AI是什么样的?你可能会说它看起来像一个机器人,一个闪烁的发光二极管或屏幕上的波形。但是AI会说AI长什么样?为了找出答案,IBM Research让AI为我们画一幅自己的图片。AI的自画像今天在《纽约时报》发布。看着这张照片,我不仅对结果感到惊讶,而且对我们在那里的旅程感到惊讶。
《纽约时报》在9月下旬联系了IBM Research,寻求我们的帮助,帮助他们熟练使用AI为即将到来的AI专栏创作艺术。由于时间紧迫,成功无法保证,我们着手教AI创造原创艺术,只需要执行一项高级任务——识别AI中的重要概念,创建一个原创图像来捕捉它,并以与《纽约时报》视觉风格相匹配的方式展示它——我们就开发出了一种将AI与人类相结合的创造力。
为什么画自画像会对AI构成挑战?毕竟,人工智能可以驾驶汽车,玩电子游戏,甚至制作电影预告片。不同的是,这些任务不需要AI去创造新的素材,只需要分析手头的信息,根据自己的训练做出决定或选择。我们已经知道,人工智能可以在语言和图像分析方面表现出色。另一方面,创造新内容是一项更具实验性的活动。
为了应对这一挑战,我们迅速在IBM Research内部成立了一个多学科团队,成员包括Alfio Gliozzo、Mauro Martino、Michele Merler和Cicero Nogueira dos santos。所需专业知识与任务性质相关:深入的科学思维、动手的技术和工程技能以及设计和可视化人才对我们的工作非常重要。本质上,我们需要明确定义创作过程。结果,形成了一个微妙的管道,人工智能在其中执行分析和合成的关键功能,以创造真正新颖和迷人的东西。
该过程包括以下三个主要步骤:
1.确定人工智能中的核心视觉概念:
摘自《纽约时报》 (NYT)上约3000篇关于“人工智能”的文章
使用自然语言处理工具来识别“人工智能”的前30个有区别的语义概念
基于图像的视觉识别神经网络针对前30个概念进行训练。
应用网络描述或表示NYT文章中图像的“人工智能”强度分数。
从十大图片中选择一张:一张人类和机器人握手的图片。
2.创建原始图像以捕捉人工智能概念:
建立了包含1000多幅人手和机器人手图像的训练数据集。
一个生成神经网络(GAN)被训练来绘制人类和机器人手的新图像,该过程持续了近一周的时间。
3.以适合NYT视觉风格的方式呈现:
从NYT收集了一个封面艺术样本,并训练了一个风格转换网络。
该网络自动生成人工智能生成的手形图像的风格化版本,以匹配NYT的封面装饰“视觉语言”。
根据整体概念的清晰度和艺术风格,选择此处显示的最终图像。
管道为我们提供了一个显著的协作创造力的新功能,它也可以应用于其他任务。想象一下,使用人工智能根据音乐家的歌曲、歌词和历史为新专辑设计艺术品。
更重要的是,研究结果展示了人工智能和人类是如何合作探索新领域的。从药物发现到金融市场预测再到恶意软件检测,我们已经在各种环境中看到了这种协同效应。将这一范式扩展到创造力领域强调了人工智能可以增强人类能力的各种方式。