ControlNet star量破万!2023年,AI绘画杀疯了?

标签: controlnet star ai | 发表时间:2023-03-02 16:47 | 作者:机器之心
出处:https://www.jiqizhixin.com/

从骑马的宇航员到三次元小姐姐,在不到一年的时间里,AI 绘画似乎已经取得了革命性的进展。

图片

这个「骑马的宇航员」由 OpenAI 2022 年 4 月推出的文生图模型 DALL・E 2 绘制。它的前辈 ——DALL・E 在 2021 年向人们展示了直接用文本生成图像的能力,打破了自然语言与视觉的次元壁。在此基础上,DALL・2 更进一步,允许人们对原始图像进行编辑,比如在画面中添加一只柯基。这一个看似简单的操作其实体现了 AI 绘画模型可控性的提升。

图片

不过,就影响力而言,2022 年最火的文生图模型并不是 DALL・E 2,而是另一个和它功能相似的模型 ——Stable Diffusion。和 DALL・E 2 一样,Stable Diffusion 也允许创作者对生成的图像进行编辑,但优势在于,这个模型是开源的,而且可以在消费级 GPU 上运行。因此,在 2022 年 8 月发布之后,Stable Diffusion 迅速走红,短短几个月就成了最火的文生图模型。

图片

在此期间,人们也在进一步探索各种控制这类模型的方法,比如 Stable Diffusion 背后团队之一的 Runway 公司发布了一个图像擦除和替换(Erase and Replace)工具,该工具可以修改图像任何部分。用户需要做的就是擦除该区域并编写自然语言描述,剩下的交给程序就可以了。


图片

谷歌和波士顿大学的研究者则提出了一种「个性化」的文本到图像扩散模型 DreamBooth,用户只需提供 3~5 个样本 + 一句话,AI 就能定制照片级图像。

图片

此外,来自 UC 伯克利的研究团队还提出了一种根据人类指令编辑图像的新方法 InstructPix2Pix,这个模型结合了 GPT-3 和 Stable Diffusion。给定输入图像和告诉模型要做什么的文本描述,模型就能遵循描述指令来编辑图像。例如,要把画中的向日葵换成玫瑰,你只需要直接对模型说「把向日葵换成玫瑰」。


图片

进入 2023 年,一个名为 ControlNet 的模型将这类控制的灵活度推向了高峰。


ControlNet 的核心思想是在文本描述之外添加一些额外条件来控制扩散模型(如 Stable Diffusion),从而更好地控制生成图像的人物姿态、深度、画面结构等信息。


这里的额外条件以图像的形式来输入,模型可以基于这张输入图像进行 Canny 边缘检测、深度检测、语义分割、霍夫变换直线检测、整体嵌套边缘检测(HED)、人体姿态识别等,然后在生成的图像中保留这些信息。利用这一模型,我们可以直接把线稿或涂鸦转换成全彩图,生成具有同样深度结构的图等等,通过手部关键点还能优化人物手部的生成。


图片

图片

图片

这一模型在 AI 绘画领域掀起了巨浪,相关项目 GitHub star 量已破万。


图片

项目链接:https://github.com/lllyasviel/ControlNet


虽然当前很多人只是用它来生成二次元、三次元小姐姐,但其更广泛的用途也被逐渐挖掘出来,比如房屋设计、摄影摄像、影视制作、广告设计等。在这些场景中,ControlNet 被拿来和之前的一些工具一起使用,比如处理大模型微调问题的 LoRA、视频 - 动画转换工具 EbSynth 等。这些工具的组合应用加速了 AI 绘画模型与生产过程的融合。


图片利用 ControlNet 和 EbSynth 等工具重新进行室内装潢设计。图源:https://creativetechnologydigest.substack.com/p/controlling-artistic-chaos-with-controlnet  (内附完整教程)

图片利用 ControlNet 和 Houdini 工具生成 3D 模型。图源:https://www.reddit.com/r/StableDiffusion/comments/115eax6/im_working_on_api_for_the_a1111_controlnet/

图片用 Dreambooth 和 ControlNet 改变 2D 图像光照,可用于照片、视频的后期制作。图源:https://www.reddit.com/r/StableDiffusion/comments/1175id9/when_i_say_mindblowing_i_mean_it_new_experiments/

图片用 ControlNet 和 EbSynth 实现动画转真人。虽然效果还不太好,但已经显示出了把动漫改编成真人版但无需演员出镜的潜力。图源 https://www.reddit.com/r/StableDiffusion/comments/117ewr9/anime_to_live_action_with_controlnet_ebsynth_not/

图片某设计师利用 ControlNet 生成的著名品牌「新 logo」。图源:https://twitter.com/fofrAI/status/1628882166900744194

惊喜之余,这些技术的进展也让绘画等领域的从业者陷入焦虑和愤怒。焦虑的是,AI 可能会夺走自己的饭碗。愤怒的是,AI 生成的图像很多是对当前画师的抄袭和模仿,画师的知识产权受到了侵犯。

图片图源:https://www.zhihu.com/question/583294094

在这些问题尚未解决的情况下,AI 绘画在画师圈成了一个尖锐的问题。很多人认为大家应该一起抵制 AI 绘画,共同捍卫自己的权益。因此,当某知名画师疑似采用 AI 绘画为某游戏工作室供稿的消息传开后,其他画师们被彻底激怒。


同时被激怒的还有游戏玩家。由于目前 AI 绘画还存在一些局限,比如处理不好手部细节(仔细观察本文第一张图的小姐姐可以看出来),达不到玩家所要求的美术视觉效果精湛、人物富有个性和创意等要求,很多玩家产生了「被糊弄」的感觉。因此,上述游戏工作室只能紧急发布声明,称「不会在产品中使用 AI 作画」。

但这种情况会持续多久呢?当 AI 绘画的水平达到肉眼难以分辨的程度,你怎么知道你玩的游戏究竟出自画师还是 AI,亦或二者组成的「团队」?


图片

图源:https://m.weibo.cn/2268335814/4870844515358190

或许再过几个月,AI 绘画工具就会像程序员使用的 Copilot 一样,成为绘画师日常工作必不可少的工具。当然,这也在无形中提高了这一行业的门槛,正如已经被 AI「入侵」的其他行业一样。如何在这样的浪潮中保持自己的竞争力可能是每个人都应该思考的问题。


图片

相关 [controlnet star ai] 推荐:

ControlNet star量破万!2023年,AI绘画杀疯了?

- - 机器之心
从骑马的宇航员到三次元小姐姐,在不到一年的时间里,AI 绘画似乎已经取得了革命性的进展. 这个「骑马的宇航员」由 OpenAI 2022 年 4 月推出的文生图模型 DALL・E 2 绘制. 它的前辈 ——DALL・E 在 2021 年向人们展示了直接用文本生成图像的能力,打破了自然语言与视觉的次元壁.

Steve Jobs 與 Star Trek

- iAN - 都是那些日子
據外電報道,Steve Jobs葬禮已低調舉行,也未聞蘋果會為這名創辦人舉行公開悼念活動. 與A談及Steve Jobs去世前公佈的iPhone4s. 雖然外間對iPhone4s並無多大好感,甚至認為沒有更大螢幕、沒有新設計,iPhone4s是換湯不換藥之作,但A卻認為外界忽略了語音操控的Siri系統,那,不只是一般語音控制,更正確點說,那是如科幻電視Star Trek內電腦般,走向用語言與電腦直接溝通的重要一步,看看有關短片就可知:.

《Red Star 2.0》体验手记

- fyits0 - cnBeta.COM
很久很久以前,我得知在我国的邻邦,有一个名叫朝鲜的美好国度,他们的计算机产业异常发达,已经研发出了属于自己的操作系统,那就是红星2.0(Red Star 2.0),我对于这么一个神奇的系统一直心怀向往,那么在近日,它的ISO镜像终于在海盗湾上泄漏出来了,于是乎我便迫不及待的开始下载并安装了起来.

jquery Star Rating - 星形评级插件

- Bloger - 博客园-首页原创精华区
  1)jRating 是一个非常灵活的jQuery插件用于快速创建一个Ajax星型投票系统.  2)jQuery Raty这是一个能够自动生成可定制的星级评分jQuery插件. 可以自定义图标,创建各种评级组合,星星数量,每一颗星星的注释,可以在当一个星星被点击时的加回调函数.   3)Query Rater Star Plugin 国内网友开发的基于jQuery的投票插件.

AI vs AI--当AI与自己聊天

- Tim - Solidot
Shawn the R0ck 写道 "最烦人的事情之一莫过于被强迫与一个白痴对话. 但当你发现你最讨厌与之交谈的白痴其实就是你自己的基于人工智能程序的拷贝...康奈尔创造性机器实验室决定看看当AI尝试跟自己交谈会发生什么. 他们的健谈的AI程序Cleverbot与自己进行文本交互,之后朗读出文本并且显示到视频中.

Glu Mobile 发布 Android 游戏 Star Blitz [视频]

- 饼干 - 谷安——谷奥Android专题站
Glu Mobile 发布 Android 游戏 Star Blitz,该游戏发布有几天了,评价不错几乎都是 5 星. Star Blitz 是一个科幻射击游戏,游戏方式是控制太空飞行器,然后秒杀进入屏幕的各种敌人,简单的说就是“打飞机”…而且非常不错的是这个游戏是免费的,感兴趣的读者可以到 Android Market 下来试试.

Andrea Star Reese摄影作品:城市洞穴

- s - PADMAG视觉杂志
Andrea Star Reese,美国女摄影师,官方网站:http://www.andreastarreese.com/. 这系列作品名为《Urban Cave》(城市洞穴),拍摄于纽约黑人区,关注的是美国社会的另一面,一个特殊群体——无家可归的人们,他们的生活及尊严. “每一天每一夜,都有人来寻找一个容身之地,面孔在变化,很多人因疾病、入狱各种问题而离开,其他一些人只是离开了,很多人还会回来.

STAR TREK 四十五周年一路走来

- Duran - Ethermetic
美国当地时间1966年的9月8日 Star Trek 原初系列的第一集播出. 现在ST走过了整整45个年头,迈向它的第46岁. 原图:http://crenk.com/the-first-45-years-of-star-trek/.

GitHub上收获Star数排名前10的Java项目

- - IT瘾-tuicool
star:92.1k 介绍:技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计、Java、Python、C++ ;地址:https://cyc2018.github.io/CS-Notes;. 其中,算法包括:剑指 Offer 题解、Leetcode 题解、算法、笔试面试题库.