智能视频云 3.0 拥有丰富的技术能力,全新构建了交互与生成 AI 能力矩阵,从 AR 特效技术到新型驱动特效、风格特效和多模态生成,全面支持各类泛娱乐场景的视频交互与生成需求。特别是数字人技术,融合了众多业界领先的语音、视觉和自然语言理解等方面的 AI 技术,是百度 AI 技术的集中呈现。

视觉模态的任意风格化
视觉模态的任意风格化有两大挑战:一是形成任意风格之前都要先学习一个元模型;二是要在有限样本的条件下进行模型迁移。智能视频云 3.0 可以完美解决这些问题,基于元学习、多风格Adaptation 技术、Few-shot Learning 等技术,使元模型具备多任务学习和快速自适应学习能力,实现元模型的快速迁移,从而可根据需求快速定制不同风格的高质量视频。