人工智能(A I)的工作中有一个讽刺之处:建立最高精度的预测模型需要大量的人工、试错努力。随着机器学习和深度学习框架的不断出现,以及它们对工具平台的更新和改变,难怪这么多人工智能工作都是那么短暂。但是为什么一项关于自动化的技术会涉及如此多的定制工作呢?
所有的人工工作都存在两个问题:一是没有经过数据科学训练的人几乎不可能从事人工智能工作;其次,具有数据科学背景的人面临着非常低效的工作流程。
然而,随着自动机器学习(AutoML)的出现,这种僵局现在开始变得清晰。一些公司,如数据机器人,专门从事它。其他AI初创公司,如Dataiku、H20和Rapid Miner,以及Tibco等老牌企业软件公司,也拥有广泛的带有AutoML功能的AI平台。主要的公共云平台也是如此,包括Azure的微软、AmazonWeb Services和GoogleCloud平台。还有开源的AutoML框架,比如Auto-sklearn、Auto-Keras和优步最近的开源Ludwig平台。
汽车ML看起来不仅仅是时尚。事实上,我在AI市场上交谈过的一些人认为,AutoML可能是整个AI的未来。只要你有一个干净的数据集,并且知道其中的哪一列是“标签”(又名目标),也就是你想用新数据预测的值,AutoML就会为你建立一个模型,大大减少工作量。而且,有时候,你会不费吹灰之力就得到你的模型。
考虑到这一点,我认为一个介绍性的东西可能是有序的,这篇文章就是我试图提供的。免责声明:虽然我从80年代开始就是AI的追随者,从90年代末开始就是数据挖掘系统的粉丝,但我不是数据科学家。因此,我的词汇和解释在教学中并不权威——在某些情况下,它们可能是幼稚的。但是我在这里得到的应该可以帮助您理解AutoML平台的功能。希望能帮助你判断市场上的产品和框架。