仅只有未实名的,新媒易不收取任何费用,不赚取一分钱,公益非盈利机构
请扫码咨询

新媒易动态

NEWS CENTER

AI不再仅仅“生成内容”,而是“成为内容”的一部分,一场内容生产的革命就此开启

2025-10-04

我合作过5家AI视频类的公司,有专门做视频生成的,也有做视频剪辑的。这两类算是不同赛道,但随着技能进步,从产品层面在逐渐融合。

视频生成赛道比较典型的代表是Pika、Runway等产品,视频剪辑赛吧典型代表是HeyGen、Opus Clip等产品。生成赛道一开始吸引人的点仍是在于新鲜感,而视频剪辑赛道,从AI虚拟人到长视频剪短视频、再到口型同步,还有直接生成AI UGC以及产品融合等等。

这个赛道很典型的特征便是商场足够大,用户需求很大,而且有不同人群的需求,比如朴实的创作者有发明需求,做增长的有营销视频需求,做销售的有产品介绍视频需求,甚至在创作者范畴还可以再细分,比如专门面向播客人群,面向二次元人群等等。竞争也剧烈,绝对是一个红海赛道,但所幸商场足够大,我合作过的视频类产品,增长和营收都很不错,因为确确实实带来了新的生产力革命,整个用户使用是彻底闭环的。

当AI不再仅仅“生成内容”,而是“成为内容”的一部分,一场内容生产的革命就此开启。

曩昔几年,AI现已能生成传神的图片、视频和声响,悄然经过视觉和听觉的图灵测试。但2025年最令人激动的打破,毫无疑问是——AI虚拟人(AI Avatar)。

这些不再“恐惧”的AI角色,正以惊人的速度冲出“恐惧谷”,开始全面渗透内容创作、广告营销、企业培训等多个范畴。这不仅是AI的一次技能跃迁,更是内容产业的一次范式改变。

今天正好看到a16z发了最新的一篇关于AI Avatar虚拟人这方面的报告,以下是精华信息总结,给大家分享。

一、AI虚拟人研究的演化轨迹:从嘴型匹配到全身互动

真实的应战不是嘴巴动了,而是表情、头部和身体的每一处细节是否同步、天然。

生成一个“会说话的脸”并不简单。研究人员面临的最大难题是:语音(phoneme)到嘴型(viseme)的精准匹配,再加上面部肌肉、眼神、甚至上半身动作的天然联动。


AI虚拟人技能近几年日新月异,从最早的CNN、GAN,到NeRF、3DMM、Transformer、Diffusion模型,现在已发展到基于Transformer的分散模型(DiT)。最新代表作如ByteDance的 OmniHuman 和Hedra的 Character-3,已可实现传神的半身/全身动作、表情同步、甚至环境互动。

相关推荐