收藏文章 楼主
英伟达的新算法可最高节省90%流量
网友【了不起】 2020-12-02 22:11:23 分享在【时代发展的印记】版块    1    1

为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁。他们开发的新AI算法,可以将视频通话的流量最高压缩90%以上。

网友分享在meiguo.com上的图片

和其他视频相比,通话的场景比较单一,基本上只有人的头部在运动。因此只要能把头像数据大规模压缩,就能大大节约流量。

网友分享在meiguo.com上的图片

英伟达的新算法face vid2vid正是从这一点出发。只要一张图片,就能实现重建各种头部姿势图片。

H.264视频所需的带宽是这种新算法的2~12倍,从前面的演示也能看出,如果让二者使用相同比特率,那么H.264视频几乎不可用。

网友分享在meiguo.com上的图片
转动面部不扭曲

英伟达提供了一个试用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滚角)三个方向上任意旋转。

网友分享在meiguo.com上的图片

输入一张人脸,最多可以在每个方向上最多旋转30度。以下是三个方向上旋转到最大角度生成的图片。

网友分享在meiguo.com上的图片

与相比之前的方法,英伟达的这种技术即使在面部转动幅度较大时,人脸也不会扭曲变形。

网友分享在meiguo.com上的图片

然而,图片终究是不动的,要把生成的人脸放在运动的视频中还要多一个步骤。

合成面部视频

我们把上传的清晰照片作为源图像,从中获取外貌特征。然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。

而表情和姿势这两个数据可以通过关键点进行编码,这样就分离了人物身份信息和运动信息。在传输视频时只要有运动信息即可,从而节约了流量。

网友分享在meiguo.com上的图片

从源图像s中,我们得到了两组数据:关键点坐标x和雅可比矩阵J。这两组参数与面部的具体特征无关,只包含人的几何特征。

其中,雅可比矩阵表示如何通过仿射变换将关键点周围的局部补丁转换为另一幅图像中的补丁。如果是恒等雅可比矩阵,则补丁将直接复制并粘贴到新位置。

网友分享在meiguo.com上的图片

下图展示了计算前5个关键点的流程。给定源图像以及模型预测的规范关键点。

网友分享在meiguo.com上的图片

从运动视频估计的旋转和平移应用于关键点,带动头部姿势的变化。然后可以感知表情的变形将关键点调整为目标表情。

接下来开始合成视频。使用源和运动的关键点与其雅可比矩阵来估计流wk,从生成流组合成掩码m,将这两组进行线性组合即可产生合成流场w。

网友分享在meiguo.com上的图片

接着输入人脸面部特征f,即可生成输出图像y。

这种方法不仅能用于视频通话,也有其他“新玩法”。

比如觉得人物头像有点歪,可以手动输入纠正后的数据,从而将面部转正。

网友分享在meiguo.com上的图片

又或者是,把一个人的面部特征点和雅可比矩阵用于另一个人,实现面部视频动作的迁移。

网友分享在meiguo.com上的图片

团队简介

这篇文章的第一作者是来自英伟达的高级研究员Ting-Chun Wang。

网友分享在meiguo.com上的图片

文章的通讯作者是英伟达的著名研究员刘洺堉。

网友分享在meiguo.com上的图片

如果你长期关注CV领域,一定对这两位作者非常熟悉。他们在图像风格迁移、GAN等方面做出了大量的工作。

网友分享在meiguo.com上的图片
△ GauGAN

两人之前已经有过多次合作。比如。无监督图像迁移网络(NIPS 2017),还有从涂鸦生成照片的GauGAN(CVPR 2019),都是出自这二位之手。

项目页面: https://nvlabs.github.io/face-vid2vid/

论文地址: https://arxiv.org/abs/2011.15126

出处:见配图水印

meiguo.com 发布人签名/座右铭仰望我所仰望!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

1   2020-12-02 22:11:23  回复

回复/评论:英伟达的新算法可最高节省90%流量

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 中国留学生在入境美国时遭遇盘查,中方大使馆发布安全提醒!
  2. 美国“真放宽”了对中国留学生的入境政策?
  3. ICE抓捕的非法移民中,中国人数量激增?
  4. 敌友即友?马斯克和扎克伯格开始接触,图谋合伙收购OpenAI?
  5. 植物油更健康?动物油脂摄入或将加速肿瘤生长
  6. 蔡文胜的2025大动作之五,香港投资版图在持续扩张!
  7. 川普家族竟然靠它狂揽45亿美金!操盘手是赵长鹏?
  8. 马斯克“xAI”起诉前工程师“泄露机密”
  9. 先交押金!美国重启了“签证保证金”试点计划
  10. 美国年轻人的“中国观”悄然转变
  11. SpaceX的星舰“第十次试飞”成功了
  12. 休斯顿机场“小黑屋内的铝箔纸”:中国留学生遭遇遣返的36小时煎熬
  13. 相差3米!星舰试飞“精准溅落”展现技术突破
  14. 华人留学生“索赔1亿美元控诉”大学期间的农药伤害
  15. 2025年度的美国公立高中排名发布,咱只关注前三!
  16. 房子属于你,但你得付费受他们管着!关于美国HOA
  17. Niche发布2026全美最佳大学榜单 MIT重回榜首
  18. 疯狂打压华人精英,勒令华人CEO辞职… 川普政府的致命错误?
  19. 工作日没空?周末集中运动同样有益健康!
  20. 加州州长竟然模仿川普总统的风格发帖,粉丝数和支持率“都涨了”!
  21. 从美国回到中国的,基本都会被问及这些问题!
  22. 从近期的中国留学生在美国入境的悲惨遭遇说起
  23. YouTube“反诈频道”助力警方,破获6500万美元诈骗案!
  24. 白宫开通了TikTok 账号,传播政策信息!
  25. 为激励员工,OpenAI打算豪掷96亿美元!
  26. 香港永居 vs 美国国籍:身份选择背后的生活考量
  27. 全美房地产市场在趋向中性,区域分化明显!
  28. 华人科学家身陷“杀猪盘”,短短数月就被掏光250万美元积蓄!
  29. 持中国大陆护照在申请美国签证的注意事项更新(2025年8月版本)
  30. 选择西雅图、圣地亚哥还是洛杉矶?全面对比“三城生活”
  31. 美国华裔二代坦言:中国发展现状,让父辈移民后悔了!
  32. 中国留学生在入境美国时遭遇驱逐,禁止五年内再入境!
  33. 川普总统的态度突变,暗示乌克兰应该反击俄罗斯本土?
  34. 麦当劳CEO声称美国品牌的声誉在全球下滑
  35. 不输常春藤!盘点学费低、薪资高的25所美国公立大学
  36. 川普总统“访华表态”继续反复

美国动态 美果搜索

Your IP: 216.73.216.36, 2025-09-11 13:36:25

Processed in 0.08188 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(1) 分享
分享
取消