VideoPoet模型能够处理多种输入类型,包括图像、视频、文本和音频,并支持多种视频生成任务,如文本到视频、图像到视频、视频风格化、视频修复、视频扩展以及视频转音频等。
VideoPoet 是由谷歌研究团队开发的一款创新的 AI 视频生成模型,旨在通过多模态大模型技术实现高质量视频内容的生成。该模型的核心优势在于其多模态大模型架构,能够处理和转换不同类型的输入信号,包括文本、图像、视频和音频,从而实现多种风格和动作的视频输出。
Δ