kaiyun官方网站就赢得了一支20s的长镜头视频-Kaiyun· (开云)官方网站 登录入口
发布日期:2025-10-01 07:06 点击次数:153
在东说念主工智能界限,视频生成期间一直是究诘的热门和难点。最近,百度推出的「蒸汽机」视频生成模子(MuseSteamer)再次升级,撑合手生成纵脱长度的AI视频,这一突破性发扬引起了野蛮存眷。

今天给寰球先容一款很极端的视频生成模子。
在AIGC圈出说念不外4个月,但吊唁常有期间实力。昨天,他们再次升级,撑合手生成纵脱长度的AI视频。
这个模子,恰是由百度推出的「蒸汽机」视频生成模子(MuseSteamer)。
若何个长法?咱们来骨子体验一下。
这里有一张图,一位靓仔来到了好意思利坚西部的某个小镇。

咱们把它看成参考图,输入辅导词:
1-5s镜头跟班,牛仔走向右方马车。6-10s东说念主物上前走,镜头跟班。11-15s东说念主物上前走,镜头跟班,右摇16-20s镜头跟班,牛仔推开门进去。
这么,就赢得了一支20s的长镜头视频,确切的一镜到底。
昔时,咱们要生成这么一支视频,至少得作念4次视频生成任务,至少要4张参考图。链路一长了,视频的一致性就会大打扣头。
而这个视频,模子能贯通“镜头跟班”、“上前走”、“镜头右摇”、“排闼进去”等各式包含东说念主物动作、运镜和交互的复杂指示,每次新画面衔尾也都特殊丝滑。
在系数过程中,东说念主物主体、服装、步态、布景和光影都保合手了超强的一致性。
再比如这几个case,亦然一镜到底。
辅导词是:
1-5s镜头跟班,东说念主物快速上前走。6-10s镜头跟班,东说念主物上前走向楼梯。11-15s东说念主物上前走,镜头跟班,右摇16-20s东说念主物上前走,镜头跟班,右摇,环绕到东说念主物正面。
即使Prompt里莫得写明时刻轴,模子也能自动笔据剧情需要彭胀内容,生成长视频。
比如这2个case。
Prompt:小纸船在小河里飘舞。
Prompt:小鸭子在水中嬉戏,有几只喝水,有几只划水,接下来排着队往前游,游到了岸边,拍打着翅膀,往前面的草地上走去。
Prompt:云在山间流动,太阳的色泽耀眼,固定镜头。
表面上,这玩意不错无尽生成,你辅导词刻画画面有多长,它就能生成多长的视频。
这饱胀冲突了之前AI只可生成5s、10s短视频,或依赖首尾帧来限度续写时长的局限,给用户带来了“流式无尽生成”的全新体验。
这是若何作念到的?
我了解了下,这是源于百度营业研发团队领先引入了自追思扩散模子,聚拢自追思的长序列技艺和扩散一致性强的上风,使得「蒸汽机」模子大要准确生成适应天下物理礼貌且高一致性的长视频。
它不同于可灵、即梦的首尾帧,更摆脱、更过程。比如这些case。
Prompt:东说念主物穿过阳光的光斑,一直往前走,手合手镜头跟班。东说念主物合手续上前。
Prompt:章鱼在水中浪荡。
在我印象中,百度这个「蒸汽机」模子应该是业内首个达成长视频生成的期间。在这张“AI视频生成模子期间发展旅途图”里,他们最近确凿卷疯了。
这个“音视频一体化”比许多热门模子都要早,算是国内第一个达成的。
Prompt:女性衣服淡色衬衫,玄色王人肩短发侧身站在海滩边,面朝大海凝望远处,太空中多只海鸥伸开翅膀在遨游,海风吹拂。
7月22日,百度蒸汽机模子崇敬上线手机网页版,撑合手转移端生成。8月21日,百度蒸汽机模子完成要紧升级,在业内初度达成多东说念主有声息视频一体化生成。9月25日,百度蒸汽机模子再次升级,撑合手AI长视频生成。从“一体生成”到“无尽续写”,不错看出,百度蒸汽机的期间计算是极具前瞻性和体系化的,而非零星功能更新。
自5月上线以来,月月有突破、合手续领跑同业,百度蒸汽机正在成为“行业界说者”和“敏捷改进者”。
在这些渠说念不错体验:
可在百度搜索、百度APP、手机浏览器百度搜索上搜:「百度蒸汽机」或利用平台「绘念念」
或径直拜谒这个网址:https://huixiang.baidu.com
据通晓,百度蒸汽机还将于10月中旬进一步升级,撑合手及时交互的长视频生收遵守,包括可交互数字东说念主、VR/AR视频内容以及动态游戏天下的生成技艺。
这就,更让东说念主期待了。
本文由东说念主东说念主都是居品司理作家【汪仔8440】,微信公众号:【沃垠AI】,原创/授权 发布于东说念主东说念主都是居品司理,未经许可,繁芜转载。
题图来自Unsplashkaiyun官方网站,基于 CC0 条约。
- 上一篇:kaiyun体育中好意思瑞典经贸会谈的后果-Kaiyun· (开云)官方网站 登录入口
- 下一篇:没有了