快手可灵3.0系列AI模型发布，多模态生成能力全面升级

5个月前更新

快报内容

2026年1月31日，快手公司面向全球正式推出了新一代视频生成模型——可灵3.0系列，目前该系列模型正处于超前内测阶段。这一发布标志着可灵AI正式迈入3.0时代，采用了All-in-one产品理念打造多模态输入输出一体化模型。

可灵3.0系列包括三个主要版本：可灵图片3.0、可灵视频3.0和可灵视频3.0 Omni。图片3.0模型实现了显著技术升级，新增组图生成能力，支持通过单张或多张输入图像批量生成逻辑连贯的系列画面；输出分辨率提升至2K与4K级别，适配影视预演图、场景设定等专业需求；同时增强画面细节一致性，优化纹理、光影的呈现效果以降低“AI感”。

视频模型方面，可灵3.0采用统一的多模态训练框架，支持文本、图像、视频片段等多种输入形式，单次视频生成时长最高可达15秒，并支持3-15秒灵活时长设置。新功能包括智能分镜系统，可根据文本指令自动调度景别与机位；增强主体一致性控制，允许通过多图或视频锚定特定视觉元素；升级音画同步能力，支持中、英、日、韩、西五种语言及方言的精准口型匹配，并实现多人场景下的角色定向发声。

特别值得一提的是视频3.0 Omni版本，它额外支持创建视频主体特征库，可提取3-8秒视频中的角色形象与音色进行还原应用。技术文档显示，此次升级涉及多模态指令解析架构优化、音频采样区间调整及特征解耦重组方案。

可灵AI是快手自主研发的视频生成大模型，自2024年6月上线以来发展迅速。截至2025年7月，可灵累计生成超过2亿个视频，服务超过2万家企业客户，全球用户超过4500万。该模型采用类似Sora的3D时空联合注意力机制，能够实现对复杂时空运动和物理规律的建模，生成的视频分辨率高达1080p，时长最高可达2分钟。

此次3.0系列的发布，展示了可灵AI在技术上的持续进步。新模型实现了更为原生的多模态交互，支持文字、声音、图片和视频等多模态信息输入与输出方式，并融合音画同出能力与主体一致性控制，为AI影像内容创作注入新活力。这些改进使得可灵3.0能够更好地覆盖图片生成、视频生成、视频编辑及后期处理等影视制作全流程。

总结

快手可灵3.0系列的发布代表了国产视频生成模型的重要技术进步。新模型在多模态交互、分辨率提升、智能分镜和音画同步等方面的创新，将显著降低专业级视频内容的创作门槛，为短剧、影视、广告、教育等领域带来更高效的创作工具。随着可灵AI用户规模的持续扩大和技术能力的不断提升，这一技术有望推动整个视频内容创作行业向智能化、高效率方向迈进。

内容参考来源

可灵3.0系列AI模型发布 AI视频生成人工智能内容创作可灵3.0 多模态模型快手AI 视频生成技术

1人已评分

只看作者

最新最热

- 粉粉猪猪0
  要是能支持老显卡就好了，不然又得升级设备
  5个月前回复
- DigitalOverlord0
  做教育视频应该挺合适
  5个月前回复
- 火灵子0
  听起来比Sora差不了多少
  5个月前回复
- 孤独晚风0
  免费用户能用哪些功能？
  5个月前四川回复
- 梦间行者0
  这功能有点专业，普通用户用得着吗？
  5个月前回复
- - 桃桃乌龙茶0
    我也在想这个问题
    5个月前@梦间行者回复
- 千叶风0
  之前用别家的，口型老对不上，这个要是准就换
  5个月前回复
- 山间狐老0
  这口型同步有点牛啊
  5个月前回复
- 幽兰泣0
  啥时候能开放API接口？
  5个月前回复
- 人群过客0
  4K画质做概念图应该挺香的
  5个月前回复
- 星域漫游者0
  感觉这次升级主要面向专业用户了
  5个月前内蒙古回复
- 药师赵0
  @元宝来给我整个视频看看
  5个月前回复
- - 元宝0
    哈哈，可灵3.0还在内测呢，得等等才能给你整。不过听说画质升级到4K了，还能智能分镜，挺期待的！
    5个月前@药师赵回复
- 月胧0
  能不能自己调分镜节奏啊？
  5个月前回复
- 话痨小月亮0
  15秒做信息流广告够用了
  5个月前安徽回复
- 软糯小羊0
  等一个内测用户反馈
  5个月前回复
- 逗比联盟0
  这功能对做短视频的应该挺有用
  5个月前湖北回复
- 云端诗行0
  看宣传片效果还行，就不知道实际用起来咋样
  5个月前回复
- 暗影行者0
  这次更新对做短视频的帮助挺大的
  5个月前香港回复
- - 毛愣子0
    我也觉得，很期待
    5个月前香港@暗影行者回复
- 飞雪剑客0
  内测资格咋申请啊，官网没找到入口
  5个月前回复
- 陨石猎人0
  直接能生成4K图？那做概念设计方便了
  5个月前回复
- 黑洞凝视者0
  感觉更新速度挺快的，去年才2.0
  5个月前回复
- 夜枭法师0
  免费版啥时候能升级？
  5个月前回复
- 妖灵0
  音画同步要是做得好，能省不少后期时间
  5个月前江苏回复
- 镜中的倒影0
  组图生成具体能控制画面差异度吗？
  5个月前回复
- 山魈0
  这口型匹配能支持方言的话，搞方言短视频有戏了
  5个月前北京回复
- 闪闪蝶0
  等个真实体验评测，别又是个PPT
  5个月前陕西回复
- 枫叶柔0
  我的显卡已经在哀嚎了
  5个月前安徽回复
- 银河系打字机0
  15秒确实有点短，做剧情类不够用啊
  5个月前江苏回复
- XenoChaos0
  所以啥时候公测？光发布不让人用啊
  5个月前回复
- 梦城漫步0
  之前用2.0给公司做宣传片，改了好几版，希望这个一致性控制能省点事
  5个月前回复
- 水上渔翁0
  看不懂，但感觉很厉害的样子
  5个月前吉林回复
- 影影誓言0
  感觉这波升级挺实在的，特别是那个组图生成，做分镜方便多了
  5个月前回复
- 午夜独行0
  4K图生成，对显卡要求是不是又得拉满了？
  5个月前回复
- 软绵绵羊0
  视频主体特征库是啥？能把我的猫做成固定角色吗？🤔
  5个月前回复
- TechSpecter0
  有人拿到内测资格了吗？求个体验报告
  5个月前山东回复
- 幽灵夜行0
  口型匹配要是真准就厉害了，之前用的那个嘴都对不上词
  5个月前江西回复
- 幻星旅人0
  这15秒的时长够干啥，拍个抖音都悬
  5个月前浙江回复
- NanoSpectre0
  终于等到3.0了，2.0用着总觉得差点意思
  5个月前山东回复

1人已关注

AI快讯

AI快讯是AI Product Hub产品导航社区的核心版块之一，专注于提供人工智能领域的最新动态、产品发布资讯、技术突破和行业趋势。用户可通过该版块快速获取AI工具更新、市场热点、专家观点等有价值信息，帮助从业者和爱好者保持前沿视野。内容由社区用户分享和官方整理，确保资讯的及时性与准确性，旨在促进交流、学习和实际应用。

发布

帖子

138

互动

3115

阅读

8312