收藏文章 楼主
英伟达的新算法可最高节省90%流量
网友【了不起】 2020-12-02 22:11:23 分享在【时代发展的印记】版块    1    1

为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁。他们开发的新AI算法,可以将视频通话的流量最高压缩90%以上。

网友分享在meiguo.com上的图片

和其他视频相比,通话的场景比较单一,基本上只有人的头部在运动。因此只要能把头像数据大规模压缩,就能大大节约流量。

网友分享在meiguo.com上的图片

英伟达的新算法face vid2vid正是从这一点出发。只要一张图片,就能实现重建各种头部姿势图片。

H.264视频所需的带宽是这种新算法的2~12倍,从前面的演示也能看出,如果让二者使用相同比特率,那么H.264视频几乎不可用。

网友分享在meiguo.com上的图片
转动面部不扭曲

英伟达提供了一个试用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滚角)三个方向上任意旋转。

网友分享在meiguo.com上的图片

输入一张人脸,最多可以在每个方向上最多旋转30度。以下是三个方向上旋转到最大角度生成的图片。

网友分享在meiguo.com上的图片

与相比之前的方法,英伟达的这种技术即使在面部转动幅度较大时,人脸也不会扭曲变形。

网友分享在meiguo.com上的图片

然而,图片终究是不动的,要把生成的人脸放在运动的视频中还要多一个步骤。

合成面部视频

我们把上传的清晰照片作为源图像,从中获取外貌特征。然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。

而表情和姿势这两个数据可以通过关键点进行编码,这样就分离了人物身份信息和运动信息。在传输视频时只要有运动信息即可,从而节约了流量。

网友分享在meiguo.com上的图片

从源图像s中,我们得到了两组数据:关键点坐标x和雅可比矩阵J。这两组参数与面部的具体特征无关,只包含人的几何特征。

其中,雅可比矩阵表示如何通过仿射变换将关键点周围的局部补丁转换为另一幅图像中的补丁。如果是恒等雅可比矩阵,则补丁将直接复制并粘贴到新位置。

网友分享在meiguo.com上的图片

下图展示了计算前5个关键点的流程。给定源图像以及模型预测的规范关键点。

网友分享在meiguo.com上的图片

从运动视频估计的旋转和平移应用于关键点,带动头部姿势的变化。然后可以感知表情的变形将关键点调整为目标表情。

接下来开始合成视频。使用源和运动的关键点与其雅可比矩阵来估计流wk,从生成流组合成掩码m,将这两组进行线性组合即可产生合成流场w。

网友分享在meiguo.com上的图片

接着输入人脸面部特征f,即可生成输出图像y。

这种方法不仅能用于视频通话,也有其他“新玩法”。

比如觉得人物头像有点歪,可以手动输入纠正后的数据,从而将面部转正。

网友分享在meiguo.com上的图片

又或者是,把一个人的面部特征点和雅可比矩阵用于另一个人,实现面部视频动作的迁移。

网友分享在meiguo.com上的图片

团队简介

这篇文章的第一作者是来自英伟达的高级研究员Ting-Chun Wang。

网友分享在meiguo.com上的图片

文章的通讯作者是英伟达的著名研究员刘洺堉。

网友分享在meiguo.com上的图片

如果你长期关注CV领域,一定对这两位作者非常熟悉。他们在图像风格迁移、GAN等方面做出了大量的工作。

网友分享在meiguo.com上的图片
△ GauGAN

两人之前已经有过多次合作。比如。无监督图像迁移网络(NIPS 2017),还有从涂鸦生成照片的GauGAN(CVPR 2019),都是出自这二位之手。

项目页面: https://nvlabs.github.io/face-vid2vid/

论文地址: https://arxiv.org/abs/2011.15126

出处:见配图水印

meiguo.com 发布人签名/座右铭仰望我所仰望!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

1   2020-12-02 22:11:23  回复

回复/评论:英伟达的新算法可最高节省90%流量

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 川普和马斯克的公开交锋升级了
  2. 金星地壳似乎剧烈变化了,NASA即将启动新任务探索求证!
  3. 美国联邦调查局警示:“新型医疗保险”骗局泛滥
  4. 任天堂的Switch 2正式发售,参数细节全曝光!
  5. 马斯克的“130天政府生涯”终结后…
  6. 川普总统:加拿大可以免费加入“金穹”导弹防御系统
  7. 川普总统宣布“金卡计划”网站开放
  8. 马斯克打算组建新党“美国党”代表中间派
  9. 美国暂停了学生签证预约,申请者在社交媒体平台的活动须谨慎!
  10. 属于中国的世纪可能已经到来
  11. 在美国,千万别做的这些事盘点!
  12. 川普家族“哈佛风波”和签证政策的突变
  13. 中美各自取消91%关税!为防🇺🇸川普政府反悔,🇨🇳重申关键问题!
  14. 鲁比奥声称将会收紧中国留学生的签证审批政策
  15. 美国新法案“大漂亮”引发了全球资本配置大调整
  16. 嘴唇经常干裂起皮,或许并非缺水!
  17. 中美贸易战的谈判再起,稀土贸易成为焦点
  18. 中美通话的内容简短,但意味深长!
  19. 互联网女皇“340页AI报告”猛料刷屏
  20. 川普政府的关税政策或将加速中国崛起,助力中国成为全球的经济主导力量!
  21. 中美两国元首针对当下双边关系和经贸合作,☎️通话交流!
  22. 手机充电习惯是影响电池寿命的根本原因
  23. 美国“非法移民家庭”遣返行动引发了“婴幼儿无国籍”的危机
  24. QQ等级256级用户诞生,首次解锁“时光企鹅”图标!
  25. 盖茨列出了10项改变世界的技术名单
  26. 能熟练运用AI也不行?硅谷的40万人在近期被炒鱿鱼
  27. 判刑15年!发币ICO的定性为诈骗
  28. 世界瞩目的电话,十个不寻常的细节剖析!
  29. 美国对华为“HarmonyOS”采取行动,引发科技领域的新争议!
  30. 韦伯望远镜(JWST)发布迄今为止最大的早期宇宙地图
  31. 难怪马斯克公开认错… 川普总统的相关杀器可以更多?
  32. “蜗居”纽约的中国穷人:男女同住,毫无私隐… 却坚持不肯回国
  33. 马斯克声称川普在“爱泼斯坦名单”,白宫回应:局面令人遗憾!
  34. 英国2岁男童竟然刷新了门萨俱乐部“最年轻男性”会员纪录
  35. 美国房价仍然高位,“美国梦”成奢望!
  36. 全球AI人才的争夺战白热化,顶尖研究员成为了科技巨头争夺焦点

美国动态 美果搜索

Your IP: 216.73.216.151, 2025-07-17 12:38:36

Processed in 0.11934 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息