互联网

上视频也别轻信!AI 已经能换脸了!

盖尔加朵AV 盖尔加朵小电影 盖尔加朵无码 盖尔加朵下载 机器学习

不存在者 发表于  2018-01-04 10:47

最近某个 Reddit 用户将“神奇女侠” 盖尔·加朵(Gal Gadot) 的脸,P到了成人视频上,效果相当不错,而且他使用的是时下火爆的机器学习技术。

这一技术的关键在于,替换的脸要和原视频上的脸表情同步。大致原理是通过算法识别出面部的特定结构——不仅仅是眼睛、鼻子、嘴巴的位置,也包括颧骨、下巴、脸颊的形状,然后按照这些特征点做替换。目前这一技术并没有达到以假乱真的地步。

左:P得看不出破绽,右:破绽明显

其实类似的面部替换技术,早就被广泛运用在大片里了。例如半兽人、咕噜、阿凡达,它们都用了动作捕捉(Motion Capture)技术。动作捕捉技术常用于电影工业,游戏产业,比如:

《加勒比海盗》中的戴维·琼斯(Davy Jones)图片来源:gamedev.stackexchange.com

小岛秀夫的《死亡搁浅》,什么时候发售啊?(打岔)图片来源:dualshockers.com

扮演深井冰,哦不,史矛革的卷福 图片来源:businessinsider.com.au

严格说,这一技术属于动作捕捉技术的一个小类,叫面部捕捉(face capture)。那些脸上的黄点,是表情变化中的关键点,就像脸的“关节”一样,计算机只需要这些信息就能合成表情。而在面部识别技术中,它被称为面部追踪(face tracking)。

面部的点是“关节”,连上线变成骨骼.图片来源:petapixel.com

绝大多数商业作品只是用这种技术制作奇幻生物,然而工业光魔公司(Industrial Light & Magic)更进一步,在银幕上复活了已经故演员。

左:合成的(Synthetic)彼得·库欣扮演的威尔霍夫·塔金,右:演员盖·亨利 图片来源:nytimes.com

恐怖片演员彼得·库欣逝世于1994年。2016年在电影《星球大战外传:侠盗一号》中,技术人员将他拉进现代的巨幕。这位“现代”演员的背后是另外一位演员盖·亨利,技术人员捕捉了盖·亨利的表情,然后合成了数字版的彼得·库欣。虽然两位演员的脸挺相似的,但是技术人员仍旧要处理很多细节问题,比如彼得·库欣发“啊”这个音的时候是不动上嘴唇的。

这一技术引发了不少争论,一些人表示不能接受。虽然电影获得了肖像授权,仍旧有一些伦理问题亟待回答,我们应该在荧幕上复活故去的演员么?

深度学习,另辟蹊径

动作捕捉技术的关键在于识别人的表情,特别是脸上那些关键的位点。而深度学习技术也能满足这一要求,一些研究团队甚至演示了伪造美国前总统小布什,奥巴马,现任总统特朗普,以及俄国总统普金的视频。

Face2Face 算法演示,上面的人提供表情信息,下面的人提供脸的信息 图片来源:QUARTZ

深度学习技术和那些专门的影视工业技术相比,得到的结果要粗糙很多,更容易识别出来,然而它也要便宜很多。谷歌、微软、亚马逊这些大公司的软件技术和平台都是公开的,深度学习技术飞速发展,很多论文都在研究者之间共享,而且家用级别的显卡就能处理深度学习算法,不一定要用到云计算和超级计算机等技术。

但这还没完,面部捕捉技术已经能手机上用了,比如 iPhone X 的 Animoji 技术。能够用于识别面部表情的技术就能用于伪造表情。

苹果的 Animoji 图片来源:businessinsider.com

苹果官方的演示 图片来源:medium.com

一些技术爱好者也正在将这一技术移植到安卓手机上,我建议谨慎使用这些app。另外也希望手机的软硬件厂商更加注意信息的安全,我们在得到便捷的同时,手机也存储了更多的私密信息,手机和电脑系统本身的安全性也值得花更多的力气去重视,而不是随便打个补丁然后又让补丁失效。

好吧,已经能伪造视频了,但声音还是造不了假的?吧?

并不是,Adobe 公司在2016年演示了 Voco 技术,他能让你简简单单输入文字就能伪造人的声音。到目前为止这项技术都没有看到商业化的迹象,技术演示过程中Adobe表示,他们会在技术上做类似水印的东西,帮助人识别伪造的声音。

无独有偶,加拿大的AI创业公司 Lyrebird 在2017年4月份声称,只要有1分钟的样本,他们就能模仿出你的声音。这听起来比 Adobe 的技术还要夸张,因为 Adobe 声称它们需要20分钟的样本。

看到这里,可能你已经懵了。所以。。。怎么办?

实际上利用特效技术伪造视频很早就有了,Zach King 就是各种翘楚。有些只是娱乐,有些东西却是别有用心。总之,不要盲目相信网上看到的视频

人家只是娱乐一下啦 图片来源:pinterest.com

以后,随意放在网上的照片、视频、声音、文字都需要认真去对待,因为它们会被人用来伪造我们自己。我们虽然不是权贵富豪,但也经不起损失。

我想已经有人意识到伪造视频的祸害,开始做这类识别了,很快创业公司就会如雨后春笋般出现。本文作者将从技术和影响力两方面跟踪这个事情的进展。

显示所有评论

全部评论(24)
  • 1楼
    2018-01-04 11:09 蓑雨吟

    这不叫p吧…

    [0] 评论
  • 2楼
    2018-01-04 11:20 大头米少

    当有一天即时视讯也沦陷的话……世界变得太可怕

    [0] 评论
  • 3楼
    2018-01-04 11:26 就是喜欢新玩意儿

    这样的话再加上三D打印技术“人脸识别”还是安全的吗?

    [0] 评论
  • 4楼
    2018-01-04 11:36 SL-血冥

    看到那个面部表情的图……

    等等我去问一下导师这是不是我们实验室的熊孩子干的……


    毕竟……我做了一年的表情生成……



    说起来,目前动画电影技术中使用的面部合成技术和基于深度学习的图像/视频合成是两个完全不同的路径。

    区别大概相当于用空间元素构建空间法阵进行传送,和利用曲率推进进行光速机动之间的差距。


    动画合成是根据定点进行三维建模来实现的,过程是:图像(采集到的)->信息点->三维模型->贴图->虚拟图像

    而深度学习的做法就简单粗暴了:简单来说就是:给电脑两个图,一个真,一个假,然后合成。合成的不好就揍他,合成好的就给胡萝卜。几天之后电脑就能做出看起来是真的东西了。仅仅是看起来。


    所以你们看科幻大片毫无破绽(好莱坞的,宝莱坞不算),而这种合成图像很容易就看出差别了。


    事实上受限于数据集和训练模型,目前机器学习在图像生成领域的效果并不能以假乱真,还是很依赖PS大法的。

    [2] 评论
  • 5楼
    2018-01-04 12:18 地球上的裸猿

    眼见不一定为实

    [0] 评论
  • 6楼
    2018-01-04 14:03 天降龙虾
    引用文章内容:将“神奇女侠” 盖尔·加朵(Gal Gadot) 的脸,P到了成人视频上,效果相当不错

    假作真时真亦假,真为假时假亦真,真真假假,假假真真。。。这些都不重要了。。重要的是,那视频种子能分享下么????

    [1] 评论
  • 7楼
    2018-01-04 14:06 模因中的muton
    引用@SL-血冥 的话:看到那个面部表情的图……等等我去问一下导师这是不是我们实验室的熊孩子干的…… 毕竟……我做了一年的表情生成…… 说起来,目前动画电影技术中使用的面部合成技术和基于深度学习的图像/视频合成是两个完全不...

    如果合成图像降低下分辨率,降到监控那种等级,就足够以假乱真了啊...

    还有,我一直很好奇,深度学习学出来的识别能力,能不能在无样本的情况下识别卡通或简笔画里的事物...

    [0] 评论
  • 8楼
    2018-01-04 14:08 天降龙虾
    引用@蓑雨吟 的话:这不叫p吧…

    这应该叫A吧,毕竟是AI加工出来的嘛,所以取AI的A啊。。。。

    [0] 评论
  • 9楼
    2018-01-04 15:43 在雨夜

    科学技术总是先用在坏事儿上。就如同二战和冷战能促进科学技术的大发展。

    [0] 评论
  • 10楼
    2018-01-04 16:18 吸引子

    想到了高达00中及时ps,太吓人了。现场直播都是假的。

    [0] 评论
  • 11楼
    2018-01-04 16:48 汉尼拔wang

    应该复活故去演员,比如饭岛爱......

    [0] 评论
  • 12楼
    2018-01-05 01:35 5美金

    NTR-妻子被超人和蝙蝠侠睡走了。

    [0] 评论
  • 13楼
    2018-01-05 09:46 梦里行

    我们看到的世界,是真的么?

    [0] 评论
  • 14楼
    2018-01-05 10:11 飞面神教

    深空9号不就让中年柯克重现了吗?

    [0] 评论
  • 15楼
    2018-01-05 11:02 SL-血冥
    引用@模因中的muton 的话:如果合成图像降低下分辨率,降到监控那种等级,就足够以假乱真了啊...还有,我一直很好奇,深度学习学出来的识别能力,能不能在无样本的情况下识别卡通或简笔画里的事物...

    降到低分辨率会有低分辨率的错误。

    如果你直接缩小合成后的高分辨率图像这个……我没法拦着你。但是这就失去了以假乱真的意义了,因为低分辨率的图片本来就不真啊。(随便找个戴有黑框眼镜人脸缩小到20*20像素都会变成……Ummmmmm)


    但是如果是试图直接合成低分辨率的图像,那么误差还是会出现的。这是由目前的卷积算法决定的,卷积算法的卷积窗会影响到最终的误差大小。


    一个不恰当的比喻:机器学习方向的合成算法,就像是把一副低分辨率的马赛克图片中,每一个马赛克的颗粒都用预先准备好的精细的贴片贴上去,这样就可以获得一个更高的分辨率。而更高分辨率的依然是马赛克,就不停地贴新的更小的贴片直到达到目的。

    这样事实上影响到最终结果的,其实是多层贴片中最下面那一层的结果,因为后面的贴片都是根据它来贴的。

    所以合成低分辨率的图片,误差也一样……


    现在有基于无监督学习的分类算法,可以在无标签的情况下从海量数据里学习到AI认为的一些知识。在图片识别领域有一定的表现。(之前谷歌不就是做了个学习到识别猫的模型么)

    但是无样本是不可能的。这是目前机器学习领域的核心也是最大的缺陷,就是它极度依赖海量数据。

    如果物理学大厦边曾经有两块小小的乌云……

    那么机器学习领域目前所有的工作(多层神经网络,反向传播,卷积,激活函数,高维流型这些……)全都是建立在沙雕城堡上的,而由核弹头组成的乌云正在砸下来……

    [1] 评论
  • 16楼
    2018-01-05 12:02 动感超人_17684

    难道没有加朵的视频链接吗?小编你站出来!

    [1] 评论
  • 17楼
    2018-01-05 16:32 模因中的muton
    引用@SL-血冥 的话:降到低分辨率会有低分辨率的错误。如果你直接缩小合成后的高分辨率图像这个……我没法拦着你。但是这就失去了以假乱真的意义了,因为低分辨率的图片本来就不真啊。(随便找个戴有黑框眼镜人脸缩小到20*20像素都...

    学习了一个,感谢感谢

    机器学习事物不是跟人一样通过化简概念,而是简单粗暴的对比,这样的学习恐怕连树都很难识别啊...人看到树干,枝杈跟叶子就可以判断是不是树,机器估摸着要分析全部叶子纹理的相似程度才行啊...

    [0] 评论
  • 18楼
    2018-01-05 18:27 SL-血冥
    引用@模因中的muton 的话:学习了一个,感谢感谢机器学习事物不是跟人一样通过化简概念,而是简单粗暴的对比,这样的学习恐怕连树都很难识别啊...人看到树干,枝杈跟叶子就可以判断是不是树,机器估摸着要分析全部叶子纹理的相似程度才行啊...

    关于化简概念,事实上目前机器学习领域还在挣扎概念这个概念……

    目前机器真的不用分析全部纹理了。因为基于滑动窗卷积的模型就是考虑了纹理的重复性。


    这么说吧,机器学习学习东西的方式与人类完全不同,不具有类比价值……

    [0] 评论
  • 19楼
    2018-01-08 20:01 AI油泳的鹰 勘查技术与工程专业,编程爱好者

    咳咳,发图不留种

    [0] 评论
  • 20楼
    2018-01-09 09:10 本杰明-范-1024
    引用@SL-血冥 的话:关于化简概念,事实上目前机器学习领域还在挣扎概念这个概念……目前机器真的不用分析全部纹理了。因为基于滑动窗卷积的模型就是考虑了纹理的重复性。 这么说吧,机器学习学习东西的方式与人类完全不同,不具有类比...

    算法可以改,数据量其实比算法更重要,或者说可选的算法数量本身就是一种数据量。人类与AI最大的不同点之一就是我们获取数据的来源比AI要多得多,这种信息来源不止是外源的,还有幼年时期的积累和先天的遗传。

    [0] 评论
  • 21楼
    2018-01-09 09:13 SL-血冥
    引用@本杰明-范-1024 的话:算法可以改,数据量其实比算法更重要,或者说可选的算法数量本身就是一种数据量。人类与AI最大的不同点之一就是我们获取数据的来源比AI要多得多,这种信息来源不止是外源的,还有幼年时期的积累和先天的遗传。

    别用人类类比机器啊……地球进化了几十亿年才搞出人类这一个有语言有意识的种族……

    现在ML能做出单细胞我们程序猿就含笑九泉了……

    [0] 评论
  • 22楼
    2018-01-09 09:26 本杰明-范-1024
    引用@SL-血冥 的话:别用人类类比机器啊……地球进化了几十亿年才搞出人类这一个有语言有意识的种族……现在ML能做出单细胞我们程序猿就含笑九泉了……

    这不是类比,是抽象,从整体的系统结构来看AI与人类的差异也就在于实现结构和信息量上;输入,输出,运算,这三个抽象是AI与人类共用的,或者说任何系统都一样。

    做不出单细胞纯粹只是因为人类对细胞的了解度不够,但如果要做一个没有特别用处只在复杂度上超过细胞的计算系统,这恐怕并不是一件做不出来的事。

    [0] 评论
  • 23楼
    2018-01-09 12:07 闇夜優僯

    留图不留种,xxxxx~

    [1] 评论
  • 24楼
    2018-01-09 21:51 驭龙氏
    引用@SL-血冥 的话:看到那个面部表情的图……等等我去问一下导师这是不是我们实验室的熊孩子干的…… 毕竟……我做了一年的表情生成…… 说起来,目前动画电影技术中使用的面部合成技术和基于深度学习的图像/视频合成是两个完全不...

    我就想求你们给这个东西做个GUI出来,不是programmer不会用啊

    [0] 评论

显示所有评论

你的评论

登录 发表评论

不存在者
不存在者 Python程序员

作者的其他文章

更多科研事,扫码早知道

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 家长监控 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区