|
发表于 2025-7-8 14:21:09
|
显示全部楼层
本篇导读
7月2号百度发布了中文音视频一体化的生成模型及创作平台museSteamer,支持通过单图生成10秒1080p电影级画质视频。
在权威VBench I2V中以89.38%总分登顶全球第一,生成的人物微表情和运镜效果达专业影视水准。
不得不说,又让百度秀了一把,这老铁偷偷发力,目前只有上线视频功能,数字人还没有上线。
老规矩先看几个例子,再做测评:
Case 1:扑克牌悬浮在空中,牌面有电光在闪烁,背景是破旧的房间,扑克牌缓慢旋转展示细节。
Case 2:小丑舞动,左侧机械臂两次抬起后放下,固定镜头。
Case 3:人物驻立街头,双眼目视镜头,背景人群流动,雨水滴落,镜头缓缓拉近。
Case 4:一辆白色赛车在纽约街头高速行驶,摄像机跟随赛车,轻微拉远,捕捉动态模糊的城市建筑。
从这几个例子总体来看对于指令的理解到位,生成视频画质很不错,最重要是效果很不错,不得不说有点水平。
实战教程
1.访问绘想
网址:https://huixiang.baidu.com/index
接下来就是检验能力的时刻到了。Case 1:低角度拍摄,镜头缓缓拉近。男人骑猪贴地飞行,速度极快,俩边物体后退的成为一堆模糊虚影,镜头从侧面视角推进。[镜头拉近]
真的不错,整个画面能把提示词的元素全部生成出来,整体运动效果非常的真实,真的酷呆了。
Case 2:摄像机从正面捕捉老虎的行进。阳光透过树叶,洒在老虎的脸上。随着镜头轻微推进,它专注而威严的眼神被清晰地呈现出来,仿佛在森林中巡视着自己的领地。
一点AI痕迹都没有,的确够得上专业级的视频质量。
Case 3:镜头捕捉着冲浪者在巨浪中穿梭的瞬间,展现着动感与紧张。随着镜头的移动,观众能感受到冲浪者与海浪搏击的刺激,以及那股不可抗拒的力量。
真的有点东西,值得大家用一用。Case 4:搭乘蓝色列车,穿越天空之镜。列车徐徐前行,水面映出朵朵云彩。摄像机转动,将广阔蓝天与白云尽收眼底,展现一幅如梦似幻的画卷。
百度的视频模型生成的质量还不错,对于指令的理解都非常的到位,生成的视频氛围也比较专业性,玩了几个视频还没有翻车过,这一点比别的模型强,有点期待它的10s和数字人功能。
我创建了一个公开的风之馨社群频道,目前公开免费,小报童成员一定要加入频道,后续会把小报童、知识星球和频道做成一个风之馨的商业闭环,有加入频道的希望大家可以踊跃的参与,AI时代做一个领航者比做一个参与者有趣且有前途。
如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
<hr/>往期精选 点击即看
风之馨小报童整套内容分享体系(ai绘画+ai视频+rpa+其它)正式开放
限时福利:风之馨的知识星球社群全网正式开放
太牛了!5分钟教你利用AI工具制作小红书爆款视频,11个视频快速起号
太牛了!通义千问开始说方言了,效果还真不错
太强了!Kimi‑Researcher深度解读和案例测评,自主智能时代来了
太强了!一款拥有视频生成,语音合成,语音克隆功能mcp工具,限量免费快冲
太牛了!腾讯混元首款开源混合推理MoE模型发布,小参数高性价比
太牛了!音频驱动的多人对话数字人模型MultiTalk开源了!效果堪比真人
太牛了!风之馨分享11款免费好用的mcp工具,轻松组合爆款各类视频智能体
绝了!1分钟教你利用2款AI工具免费制作抖音爆款猫咪跳水视频(附工具地址)
绝了!1 分钟极速利用Cherry Studio搭建浏览器智能分身,效率飙升200%!
#ai #ai工具 #风之馨#ai案例 #AI模型 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|