面壁智能开源MiniCPM-o 4.5:开启AI“即时自由对话”新时代-AIProductHub产品导航社区

面壁智能开源MiniCPM-o 4.5:开启AI“即时自由对话”新时代

快报内容

时间与事件

2026年2月4日,中国人工智能公司面壁智能(FaceWall AI)正式宣布开源其新一代全模态旗舰模型MiniCPM-o 4.5。该模型已在GitHub、Hugging Face、ModelScope等主流开源平台上线,供全球开发者及研究者下载使用。

核心突破:从“对讲机”到“自由对话”

本次发布的核心亮点在于MiniCPM-o 4.5实现了原生全双工(Full-Duplex)​ 的全模态交互能力。这意味着模型彻底改变了传统AI“一问一答”的回合制模式,类似于两人使用对讲机时必须轮流发言;它可以像人类一样,在生成回复(“说”)的同时,持续接收并处理来自摄像头和麦克风的视觉、音频信息(“边看、边听”),感知不中断。例如,在您与它对话时,它能实时观察环境变化,并在合适的时机(如电梯到达指定楼层、水烧开时)进行主动提醒,而无需等待用户提问。

技术特点与性能表现

尽管参数量控制在90亿(9B)​ 的较小规模,旨在便于端侧设备部署,但MiniCPM-o 4.5的性能却十分强劲。根据开源评测工具OpenCompass的报告,其综合得分达77.6分,在多模态理解(MMBench)、数学推理(MathVista)、文档解析等多项关键任务上超越了部分参数量更大的主流闭源模型。同时,其在语音生成的自然度、拟人度以及长语音合成的稳定性上也显著提升,并支持仅凭几秒样本进行声音克隆。

关键人物与战略视角

面壁智能CEO李大海将此次发布视为人机交互范式的一次重要跃迁。他指出,传统的依赖外部语音活动检测工具实现“实时感”的方案存在延迟和误触发问题,而MiniCPM-o 4.5的突破在于模型自身能够基于语义以约每秒1次的频率自主决策何时发言,实现了真正的智能交互。李大海强调,这种需要低延迟、强伴随和隐私保护的能力,天然适合在手机、汽车、具身机器人等端侧场景落地,这也是面壁智能聚焦的战略方向。

生态协同与影响

模型的快速落地离不开软硬件生态的支持。众智FlagOS社区通过其统一的AI系统软件栈,实现了MiniCPM-o 4.5在天数智芯、华为昇腾、平头哥等6家主流国产芯片平台上的“发布即适配”,并带来了推理效率的普遍提升。此外,面壁智能还同步披露了其首款AI原生智能开发板“松果派(Pinea Pi)”的规划,旨在为开发者提供端侧模型验证与应用的硬件基础,预计于2026年年中量产,体现了其“软硬结合”的战略布局。

总结

面壁智能开源的MiniCPM-o 4.5模型,不仅以其“原生全双工”技术重新定义了自然的人机交互范式,更凭借在9B小参数规模下实现的顶尖性能,极大地降低了高级多模态AI在终端设备上部署的门槛。这一突破有望加速AI在智能座舱、个人助手、具身智能等领域的深度融合与应用创新,推动端侧AI走向真正实用化的新阶段。

内容参考来源

  1. 《模速新产品 | 面壁智能MiniCPM-o 4.5开源:「眼耳口」并用,模型交互从「一问一答」变为「即时自由对话」》 – 微信公众平台
  2. 《面壁智能开源新一代全模态旗舰 AI 模型 MiniCPM-o 4.5》 – 微信公众平台
  3. 《MiniCPM-o 4.5 开源:9B 参数的全模态模型,让 AI 告别「对讲机」》 – 腾讯新闻
  4. 《业界首次!众智FlagOS实现面壁新模型MiniCPM-o 4.5 “发布即6芯适配”,性能普遍超过原生》 – 微信公众平台
  5. 《刚刚,面壁小钢炮开源进阶版「Her」,9B模型居然有了「活人感」》 – 腾讯新闻
  6. 《面壁智能CEO李大海:告别“对讲机模式”,我们把AI交互从头做了一遍》 – 腾讯新闻
请登录后发表评论

    • 头像夜语星尘0
    • 头像赵丽颖0
    • 头像优雅火烈鸟0
    • 头像奔跑的西瓜0
    • 头像竹马青梅0
    • 头像暗影帝王0
    • 头像豌豆喵0