
FaceChain
FaceChain 是一个基于深度学习技术的个性化数字形象生成工具,利用生成对抗网络(GANs)和 Stable Diffusion 模型,通过少量照片生成高度个性化的数字形象。
CogVideo 是由清华大学和BAI唐杰团队共同开发的一款开源预训练文本到视频生成模型,是目前最大的通用领域文本到视频生成模型,拥有94亿参数。该模型基于Transformer架构,通过多帧率分层训练策略,将预训练的文本到图像生成模型CogView与文本到视频生成相结合,实现了从文本描述到生动逼真视频内容的高效转换。