继写作、唱歌后,微软人工智能“小冰”又实现了原创绘画的能力。
5月16日,微软正式对外发布人工智能小冰的绘画模型。微软表示,该模型通过对过往四百年艺术史上236位人类画家画作的学习,独立完成100%原创的绘画作品,接近专业人类画家水准。
作为Bing中国及日本、微软小冰全球产品线负责人,微软(亚洲)互联网工程院副院长李笛及他的团队设计了一个巧妙地联动——用人工智能微软小冰的一副原创画作,当做了今天Bing中国的封面图。李笛表示,不同于简单的复制、调色、随机生成,微软小冰的绘画能力是基于文本或其他创作源激发,由人工智能100%原创的绘画作品。
值得一提的是,今年微软小冰以“夏语冰”的化名通过了毕业考试成为了中央美术学院的硕士毕业生,并且在中央美术学院2019届研究生毕业作品展上首次展出。同时,小冰的首次个人作品展将于6月举行。
与诗歌一样,“小冰”的绘画能力也会通过小程序运营推广给大众,“少女画家小冰”绘画创作小程序将在一周后(5月22日)上线。
几年前阿尔法狗战胜了人类九段棋手李世石,“人工智能究竟有多像人类”、“人工智能会替代人类吗?”、“人工智能究竟能做到哪一步”等等争论就从未停歇。而让人工智能创作,似乎又是一个充满争议的方向。
谈到为什么要让人工智能进行创作,李笛表示,目前世界上大多数人工智能的开发都是围绕着任务驱动型、知识型的路线来架构。但近些年,各大科技公司开始越发注重对人工智能EQ(情商)的开发,不仅仅是微软,亚马逊开始希望Alexa能够有同理心。百度也提出“智能体”这个概念,要求人工智能更加有个性,更加有人设。人工智能的构建已经从单纯的IQ开始向IQ+EQ演变。(详见钛媒体前文:第六代小冰上线了,微软为什么要花四年时间探索情感 AI?)
“我们希望人工智能创造的目的,不是取胜,而是面向高度定制化的时代的内容供需关系。提供更快、更稳定、高并发的创作能力。”
会唱会写会画的小冰,离人类创作水平还有点远
小冰目前会唱歌(语音)、会写作(文本),而今天新发布的模型则赋予了小冰绘画(视觉)的能力。
以钛媒体现场来看,目前小冰的唱歌能力是最强的。现场也公开小冰演唱模型的第五个版本。除了能让小冰像人一样“换气延长”外,新模型还改善了歌声唱腔转换的自然度,并首次公布了戏腔训练成果。而李笛也透露,比起友商来说,小冰平均舒适时长、也就是听众能够接受的最大连续播放时长是最高的。小冰的ACD(有声读物·平均舒适时长能够达到21.5分钟,而友商基本在五分钟以下。
而在文学创作上,小冰的诗集也在一定程度上引起了争议(详见钛媒体文章:人工智能写作的天花板在哪里?),而对于更加依赖主观的“绘画”,很难用画的“好不好”来评价这些作品,但毋庸置疑,人工智能做原创输出已经非常不容易了。微软亚洲互联网工程院为对该项目的研发已经整整持续了22个月。
对于争议,微软(亚洲)互联网工程院人工智能创造及商业事业部总经理徐元春现场呼吁,不要带着“有色眼镜”去看人工智能创作。“人类一旦戴上这种有色眼镜之后,他所提供的反馈就都是错误的,有可能会把我们引向另外一个极端。”
抛开大量技术细节,小冰绘画模型有两大特点:特点一:会大量使用诱发源,不是让机器把一种已有的视觉元素转成另外一种风格重新生成,而是要求在诱发源的帮助下,激发人工智能进行重新的创作,这是这个模型最显著的特点。特点二:机器在这个过程中会对人类社会最顶尖的艺术创作进行大量的学习。
但在钛媒体来看,小冰的创作仍然距离人类创作还有点远。在命题创作上,乍一看,上述画作是颇具“艺术色彩”的,但如果仔细理解“中国的城市化进程”这个命题,小冰所画的内容基本上都在“建筑”、“人”、“家具”这几个模棱两可的元素上来回重复,有点类似“xx星座就是这样的”巴纳姆效应。
与诗歌一样,“小冰”的绘画能力也会通过小程序运营推广给大众,将在一周后(5月22日)上线面向大众的绘画创作小程序。在小程序中输入创作词语,小冰就会开始沿着以下程序进行绘画原创,这比小冰写诗的过程要复杂得多。
但现场开放的小程序版本并不能像上述DEMO中那样完全理解命题。当钛媒体编辑把“中国的城市化进程”这个命题输入到测试版的小冰绘画小程序里,小冰甚至回答“这些内容不好发挥,再换一个吧”。
而即便是输入“城市”这个词语,可以看到,小程序中的小冰依旧会把城市跟椅子、时钟这类的元素联系到一起,画作也不算完整,甚至有些过于抽象。
“小冰”们的商业价值体现:需要简单创作能力、重复性强而又人才稀缺的岗位
不过,值得思考的一件事情是,类似小冰这种“情商”比较高的人工智能们的商业化价值在哪儿?李笛表示,在文本创作、语音创作和绘画创作上,小冰团队都已经寻找到明确的产业化落地场景。目前微软小冰在各内容生成领域的进展如下:
- 文本创作,目前主要覆盖诗歌、金融摘要及研报等两个领域。
- 语音创作,目前主要覆盖音乐、有声读物和电台电视台节目内容等三个领域。
- 视觉创作,目前主要覆盖绘画及纺织服装面料设计等两个领域。
一方面,情商高的人工智能被塑造成IP,以虚拟歌手、虚拟作家、虚拟画家的身份被运营。但如果说歌手、主持人、画家都无法带来“普通”的规模性收益,“小冰”们更多的商业价值是体现在需要简单创作能力、重复性强而又人才稀缺的岗位。
在小冰擅长的语音方面,除了大家比较熟悉的虚拟主播工作外,小冰更大的潜力是在有声读物上,“在国内的少儿有声读物这个领域,是处于供不应求的状态。”
在文本输出上,小冰更多的价值体现在高效地提供格式、内容规范的文本创作上。人类编辑相比,小冰输出速度极快,可以稳定地提供20秒级的输出,即一旦得到一个数据,20秒之后就可以完成摘要和研报的生成。小冰已与万得资讯、华尔街见闻等机构达成了长期合作。
而绘画能力的商业价值,还体现在原创、版权上。
正如发布会现场,徐元春对Bing封面图的打趣一样,“这样图我们完全拥有版权,不用再付一遍版权费了”,稳定的、高质量的、完整拥有版权的、可大规模创作的能力,是人工智能绘画设计能力能够大规模被商业化应用的基础。
目前,小冰的绘画能力所瞄准的落地场景是服装面料设计,去为稀缺的一线原创图样设计师进行补位。
据钛媒体现场了解,以微软小冰人工智能框架为基础,微软已经中国纺织工业联合会以及几家最大的纺织面料企业联合开发了人工智能纺织服装面料设计平台。在这个平台上,支持几十种目前非常流行的纹样和插话的设计,不重复的多样性可以做达到10的26次方。“地球上所有沙子的数量是10的23次方,所以理论来讲,这一套系统可以为地球上的每一粒沙子绘制一个完全不同的表面。”
(本文首发钛媒体,作者/赵宇航)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
这些内容不好发挥,换一个吧哈哈哈