英伟达研究人员开发出以假乱真的人类面部生成器

标签: Technology | 发表时间:2018-12-14 17:02 | 作者:Devin Coldewey
出处:https://techcrunch.cn

机器学习模型已经变得非常擅长生成逼真的人脸,逼真到我可能永远不会再相信一个机器或人类是真实的。这种由英伟达(Nvidia)研究人员开发的新方法可以分离面部的细节层次,并对它们进行单独调整,以此实现超越其他方法的效果。最终生成的图像非常非常逼真。

研究人员的 论文发表在预印本网站 Arxiv 上,其中描述了一种生成和混合图像(特别是人脸)的新架构,可以“带来更好的插值特性,而且也能更好地解析变化的潜在因素”。

这基本上意味着该系统能够更好地意识到图像之间有意义的变化,并且在各种尺度上都能进行引导。举例来说,研究人员的 旧系统 可能生成两张“不同”的面孔,但除了一个人的耳朵被擦除以及衬衫颜色不同之外,它们基本上是一样的。那不是真正的不同,但系统并不知道无需重点关注图像的这些组成部分。

新系统的灵感源自所谓的风格转移,也就是对图像(比如说一张画)的重要风格特征进行提取,并应用到另一张图像的创作当中,如果一切顺利的话,最终得到的图像应该跟原来的拥有类似外观。就生成面孔而言,这里的“风格”并不是指笔触或颜色分布,而是图像的构成(居中,靠左或靠右,诸如此类)以及脸部的生理特点(肤色、雀斑以及毛发)。

这些风格特征或大或小,尺度各异——在非常小的时候,它可能是面部的单个特征;在中间的时候,它可能是镜头的构成;在最大尺度上,它就是图像整体色调之类的东西。让系统对所有这些特征进行调整,整张图像就会发生变化;与此同时,仅仅调整一部分可能只会改变一个人的发色,或者是雀斑或面部毛发的分布。

在最上面的图像中,我们可以看到面孔是如何发生彻底变化的,但“来源”和“风格”的明显标记仍然被保留下来,比如最底下一行的蓝色衬衫。在其他情形中,衣服是用整块布料生成的,就比如中心位置那个小孩貌似穿着和服一样。它是从哪儿来的呢?请注意,所有这些都是完全可变的,并不是 A+B=C,而是取决于设置选项的调整方式,A 和 B 的所有因素都存在或都不存在。

这些人脸都不是来自真实的人类,但如果你说它们是某个人设置的个人头像,我丝毫不会起疑。面部生成器现在已经能够不断地生成外观完全正常的人类图像,想想还是有点可怕。下面是更多的例子:

它的效果还不完美,但的确有效。而且,能够生成的不仅仅是人类,汽车、猫和风景,这些事物或多或少都符合相同的范式,即拥有可以分离并进行单独再现的小、中、大风格特征。对我个人而言,一个能够生成无限数量喵星人的系统似乎更加有趣。

此外,这些研究人员还发布了一个新的面部数据集:70,000 张(经过许可)从 Flickr 采集的面部图像,全都经过对齐和剪裁。他们使用亚马逊的众包服务 Mechanical Turk 清除掉了雕像、绘画和其他异常值。鉴于此类项目使用的标准数据集主要是明星走红毯的照片,这应该能够提供拥有更多变化的面部数据集来开展研究。该数据集很快将在 这里 开放给大家下载。

图片来源:英伟达

翻译:王灿均( @何无鱼

These face-generating systems are getting rather too creepily good for my liking

相关 [英伟达 研究 开发] 推荐:

英伟达研究人员开发出以假乱真的人类面部生成器

- - TechCrunch 中文版
机器学习模型已经变得非常擅长生成逼真的人脸,逼真到我可能永远不会再相信一个机器或人类是真实的. 这种由英伟达(Nvidia)研究人员开发的新方法可以分离面部的细节层次,并对它们进行单独调整,以此实现超越其他方法的效果. 论文发表在预印本网站 Arxiv 上,其中描述了一种生成和混合图像(特别是人脸)的新架构,可以“带来更好的插值特性,而且也能更好地解析变化的潜在因素”.

研究表明盗版严重损害Android开发者利益

- xing - cnBeta.COM
《福布斯》员工布莱恩・考尔菲尔德(Brian Caulfield)撰文称,一项最新研究表明,盗版软件给Android开发者造成了严重的经济损失. 美国地理位置服务公司Skyhook对75位Android开发者进行调查,结果显示:27%的开发者将盗版视为“严重问题”;另有26%的被调查者 认为,盗版构成了“一定程度的问题”;此外,53%的被调查者表示,谷歌对官方在线商店Android Market的监管过于“宽松”.

Google的案例研究:开发者是怎么搜代码的?

- - 36氪
既然有现成的,何必重新发明轮子呢. 在代码库日益丰富、搜索功能越来越高级的背景下,代码搜索已经成为一项关键的软件开发活动,而且实际上也是一项非常有用的技能. 那开发者一般都是怎么去搜索代码的呢. 针对这个问题,Google特地在内部进行了一项案例研究. 研究采用了调查和日志分析相结合的办法,得出了一些有趣的结果.

英伟达联合阿里华为共同打造智能城市平台

- - TechWeb 新酷网站 RSS阅读
TechWeb 9月25日报道 文/yoyo. 英伟达的AI智能城市平台听起来像是DC的超人漫画的故事,但实际上是一个基于GPU的智能监控工具,可以帮助缓解交通拥堵,分配城市服务,甚至找到失踪人口. 为此,英伟达已经在阿里巴巴和华为找到了两个新的合作伙伴,该公司宣布,在通用的智能城市平台版本中,它将包括Deepstream软件开发工具包.

英伟达称其 H100 数据中心 GPU 性能比上一代高 4.5 倍

- - 奇客Solidot–传递最新科技情报
英伟达发表 新闻稿,宣布其下一代基于 Hopper 架构的数据中心 GPU H100(H 代表 Hopper) 在 MLPerf 行业标准 AI 基准测试中的性能比上一代 A100(基于 Ampere 架构) 高 4.5 倍. 英伟达的新闻稿充斥着热门词,它表示“Hopper 在流行的用于自然语言处理的 BERT 模型上表现出色部分归功于其 Transformer Engine.

英伟达 CUDA 对机器学习的垄断正逐步瓦解

- - 奇客Solidot–传递最新科技情报
过去十年,机器学习软件开发框架经历了巨大变化. 虽然大部分框架严重依赖于英伟达 CUDA,在 英伟达 CUDA 上有最佳性能. 但随着 PyTorch 2.0 和 OpenAI Triton 的到来,英伟达 CUDA 对机器学习的垄断地位正逐渐瓦解. 几年前,Google 的 TensorFlow 框架及专用加速器 TPU 具有先发优势,Google 被认为有望在机器学习行业占据主导地位.

中国指数研究院:2017中国地级以上城市房地产开发投资吸引力研究(附报告)

- - 互联网数据中心-199IT
中国指数研究院发布《2017年中国地级以上城市房地产开发投资吸引力研究报告》,对全国297个地级以上城市房地产投资吸引力进行排位. 研究结果显示,2017年,上海、北京、深圳投资吸引力仍保持全国前三位,经济基本面较好的二线及受核心城市辐射的三四线城市排名靠前. 从区域分布来看,东部沿海及长三角、珠三角、京津冀城市群城市投资吸引力保持领先优势.

麻省理工学院公布世界最聪明公司名单:英伟达居首

- - TechWeb 今日焦点 RSS阅读
【TechWeb报道】7月4日消息,据国外媒体报道,著名的麻省理工学院科技评论已经公布了世界上50家最聪明的科技公司的名单,英伟达成功击败了所有公司包括SpaceX、亚马逊、英特尔和苹果等,成为2017年全球最聪明的公司. 这份名单是由麻省理工学院的科技评论撰写的,它基于重要的技术开发人员及其“商业头脑”,包括大型和小型科技公司.

看不下去AI胡说八道,英伟达出手给大模型安了个“护栏” | 开源

- - 量子位
量子位 | 公众号 QbitAI. 大模型们 胡说八道太严重,英伟达看不下去了. 他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题. 这个新工具名叫“护栏技术”(NeMo Guardrails),相当于给大模型加上一堵安全围墙,既能控制它的输出、又能过滤输入它的内容. 一方面,用户诱导大模型生成攻击性代码、输出不道德内容的时候,它就会被护栏技术“束缚”,不再输出不安全的内容.

用户研究

- - 技术改变世界 创新驱动中国 - 《程序员》官网
介绍自己的设计流程时,设计师通常都说它是“以人为中心”或是“以用户为中心”的. 笼统地讲,这表示设计师经常要考虑所设计产品的潜在用户,尽力为这些人创造出最好的产品. 这个问题看似简单,实际上却不好回答. 好的设计通常都是从用户研究着手的. 我们如何才能发现人们想要实现的目标. 虽然这样做有时会得到一些有用的信息,但一定要小心地评估人们给出的答案.