
DreamTalk
DreamTalk是一个基于扩散模型的音频驱动表达性头部生成框架,核心功能是将静态人物照片转化为逼真、富有表现力的说话视频。
FireRedTTS 是由小红书技术团队开发的一款基于大语言模型的语音合成系统,旨在为用户提供高效、多样化的语音生成解决方案。该系统的核心特点在于其无需训练,仅需提供几秒钟的参考音频和文本输入,即可生成高质量的语音内容。FireRedTTS 的技术框架包括数据处理、基础系统和下游应用三个部分,能够生成多风格、高表现力的音色,适用于短视频配音、聊天式语音对话等多种场景。