首页 >> 综合头条 >

腾讯开源人像照片生成视频模型V-Express

2024-06-07 12:02:05 来源: 用户: 

站长之家(ChinaZ.com)6月7日 消息:腾讯公司开源了一款创新的模型V-Express,它能够使用人像照片生成视频。这一技术通过一系列逐步丢弃的操作来平衡不同控制信号,使得音频等较弱的信号得以有效利用,实现对姿态、输入图像和音频的综合控制。

作者团队表示,在会说话的人脸生成任务中,当目标视频与参考角色不是同一个人时,选择与参考人脸姿势更相似的目标视频将能获得更好的效果。目前,该模型在英语上的表现较为出色,但对其他语言的适应性和表现尚未经过详细测试。

V-Express模型的开源,为肖像视频生成领域带来了新的发展机遇。在这一领域,使用单个图像生成视频的方法正变得日益流行。这通常涉及到使用生成模型增强适配器来实现受控生成,其中控制信号可能包括文本、音频、图像参考、姿势、深度图等。V-Express通过渐进式的丢弃操作,解决了弱信号在强信号干扰下难以发挥作用的问题,尤其是在音频信号常常被姿势和原始图像等强信号掩盖的情况下。

实验结果显示,V-Express能够有效生成受音频控制的肖像视频,这在以往的研究中是一个难以实现的突破。V-Express方法的逐步丢弃操作,不仅有效实现了对弱条件的控制,而且为多条件生成提供了新的可能性和思路。

V-Express模型为肖像视频生成领域带来了创新的思路和方法,通过平衡不同强度的控制信号,成功实现了受音频控制的视频生成。这一成果不仅具有重要的理论和实践意义,而且为未来的多条件生成提供了新的路径。腾讯表示,将继续深入研究V-Express方法,并探索其在更广泛领域的应用,以促进肖像视频生成领域的进一步发展。

项目地址:https://top.aibase.com/tool/v-express

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
  • 【汉字塘怎么组词】“塘”是一个常见的汉字,通常与水有关,常用于表示人工或自然形成的水池、水洼等。在日常...浏览全文>>
  • 【汉字酵怎么读】在日常生活中,我们经常会遇到一些不太常见的汉字,比如“酵”。很多人对这个字的发音和含义...浏览全文>>
  • 【汉字姣怎么组词姣怎么组词】“姣”是一个较为少见的汉字,读音为 jiāo,在汉语中多用于形容女子容貌美丽。...浏览全文>>
  • 【汉字降可以组什么词】“降”是一个常见的汉字,读音为“jiàng”,在汉语中有着丰富的含义和用法。它既可以...浏览全文>>
  • 【汉字见怎么组词】在汉语学习中,“见”是一个非常常见的汉字,它不仅在日常生活中频繁出现,而且在词语搭配...浏览全文>>
  • 【汉字囝怎么读】在日常生活中,我们常常会遇到一些不常见的汉字,这些字不仅写法奇特,读音也让人感到困惑。...浏览全文>>
  • 【汉字假组词语】“汉字假组词语”这一说法在传统汉语学习中并不常见,通常我们所接触的是“汉字”和“词语”...浏览全文>>
  • 【海南旅游景点大全】海南,作为中国最南端的热带海岛省份,以其独特的自然风光、丰富的文化底蕴和宜人的气候...浏览全文>>
  • 【海南旅游攻略】海南,作为中国最南端的省份,以其独特的热带风光、丰富的自然景观和多样的文化风情吸引了无...浏览全文>>
  • 【海拉尔旅游攻略必玩的景点】海拉尔是内蒙古自治区呼伦贝尔市的行政中心,被誉为“中国最美的草原之一”,四...浏览全文>>