当前位置：首页 >新媒易动态 >视频号购买

AI不再仅仅“生成内容”，而是“成为内容”的一部分，一场内容生产的革命就此开启

2025-10-04

我合作过5家AI视频类的公司，有专门做视频生成的，也有做视频剪辑的。这两类算是不同赛道，但随着技能进步，从产品层面在逐渐融合。

视频生成赛道比较典型的代表是Pika、Runway等产品，视频剪辑赛吧典型代表是HeyGen、Opus Clip等产品。生成赛道一开始吸引人的点仍是在于新鲜感，而视频剪辑赛道，从AI虚拟人到长视频剪短视频、再到口型同步，还有直接生成AI UGC以及产品融合等等。

这个赛道很典型的特征便是商场足够大，用户需求很大，而且有不同人群的需求，比如朴实的创作者有发明需求，做增长的有营销视频需求，做销售的有产品介绍视频需求，甚至在创作者范畴还可以再细分，比如专门面向播客人群，面向二次元人群等等。竞争也剧烈，绝对是一个红海赛道，但所幸商场足够大，我合作过的视频类产品，增长和营收都很不错，因为确确实实带来了新的生产力革命，整个用户使用是彻底闭环的。

当AI不再仅仅“生成内容”，而是“成为内容”的一部分，一场内容生产的革命就此开启。

曩昔几年，AI现已能生成传神的图片、视频和声响，悄然经过视觉和听觉的图灵测试。但2025年最令人激动的打破，毫无疑问是——AI虚拟人（AI Avatar）。

这些不再“恐惧”的AI角色，正以惊人的速度冲出“恐惧谷”，开始全面渗透内容创作、广告营销、企业培训等多个范畴。这不仅是AI的一次技能跃迁，更是内容产业的一次范式改变。

今天正好看到a16z发了最新的一篇关于AI Avatar虚拟人这方面的报告，以下是精华信息总结，给大家分享。

一、AI虚拟人研究的演化轨迹：从嘴型匹配到全身互动

真实的应战不是嘴巴动了，而是表情、头部和身体的每一处细节是否同步、天然。

生成一个“会说话的脸”并不简单。研究人员面临的最大难题是：语音（phoneme）到嘴型（viseme）的精准匹配，再加上面部肌肉、眼神、甚至上半身动作的天然联动。

AI虚拟人技能近几年日新月异，从最早的CNN、GAN，到NeRF、3DMM、Transformer、Diffusion模型，现在已发展到基于Transformer的分散模型（DiT）。最新代表作如ByteDance的 OmniHuman 和Hedra的 Character-3，已可实现传神的半身/全身动作、表情同步、甚至环境互动。

上一篇：AI虚拟人不再仅仅好玩的技术展现，而是发明实践商业价值的东西，从顾客内容创造到企业训练

下一篇：实战事例拆解：从平凡到爆款的蜕变