自从人工智能诞生以来,研究人员一直试图通过与人类玩游戏来测试机器系统的智能。人们普遍认为,人类智力的标志之一是能够创造性地思考,考虑各种可能性,并在做出短期决定时将长期目标牢记在心。如果计算机能像人类一样玩困难的游戏,那么它们肯定能处理更复杂的任务。从上世纪50年代开发的具有早期跳棋功能的机器人,到如今学习能力深厚的机器人,即使是世界上最优秀的玩家,也能在国际象棋、围棋、DOTA等游戏中被打败,一台能找到谜题解答的机器的想法早已过时。人工智能本身,如果不是太老的话。
因此,组织开发的AI的核心模型之一是目标驱动的系统模型,这是有意义的。和其他AI模型一样,我们看到这种形式的人工智能被用来解决一系列常见的问题,这些问题原本需要人类的认知能力。在这种特定模式下,机器要解决的挑战是需要找到问题的最佳解决方案。问题可能是在迷宫中寻找路径,优化供应链或者优化行车路线和空闲时间。不管我们有什么特殊的需求,我们在这里寻找的力量是通过试错学习,并确定解决问题的最佳方法的想法,即使它不是最明显的。
通过反复实验加强学习。
强化学习是最有趣但最少使用的机器学习形式之一。与监督学习方法(其中机器通过人工训练进行学习,并且训练具有良好标签的数据)或非监督学习方法(其中机器试图通过发现信息簇和其他分组进行学习)不同,强化学习试图通过尝试学习进行学习。错误,使用环境反馈和总体目标成功迭代。
在不使用人工智能的情况下,组织依靠人类来创建基于程序和基于规则的系统,以指导软件和硬件系统如何运行。如果计划和规则在管理资金、员工、时间和其他资源方面可能是有效的,那么它们将变得脆弱和僵化。这些系统只有人类制定的规则强大,机器根本没有真正学习。但是将人类的智慧纳入规则可以使系统正常工作。
另一方面,目标学习AI系统规则少,需要通过迭代学习如何独立工作。这样,AI就可以完全优化整个系统,而不依赖人类设定的脆弱规则。目标驱动系统已经证明了它的价值,这表明该系统具有超强的发现“潜规则”以解决具有挑战性的问题的能力。目标驱动系统在需要资源优化的领域中有多有用并不奇怪。
AI可以有效地用于场景模拟和资源优化。通过将这种通用的方法应用到学习中,可以设置人工智能支持的系统来优化特定的目标或方案,并且可以找到许多解决方案,其中一些对他们更具创造力的人类同行来说甚至不明显。这样,尽管目标驱动的系统模型没有像其他模型(如识别、预测分析或对话模型)那样广泛实施,但它在广泛的行业中具有巨大的潜力。
在金融领域,基于强化学习的目标驱动系统正在“机器人咨询”等用例中使用,该系统使用学习来确定能够满足个人特定需求的储蓄和投资计划。目标驱动系统模式的其他应用已经用于交通灯系统的控制,从而找到了在不造成中断的情况下控制交通灯的最佳方法。而在供应链和物流行业的其他用途是寻找包裹和运送货物的最佳方式。进一步的用途包括帮助训练物理机器人,创造能让机器人奔跑和跳跃的机制和算法。
目标驱动系统甚至被用于电子商务和广告中,以找到商品的最佳价格并自动竞标广告位。目标驱动系统甚至被用于制药行业,以实现蛋白质折叠和发现新的和创新的疾病方法。这些系统可以选择最佳的试剂和反应参数来获得所需的产品,从而使它们成为治疗过程中复杂而精细的药物或资产。
目标驱动的系统模型是人工智能的关键吗(AGI)?
试错学习的思想非常有效,可以应用于任何问题。值得一提的是,DeepMind是一个将机器变成现实的组织。这个组织可以解决一个曾经被人类打败的机器无法解决的问题。该组织认为,强化学习目标驱动系统可能是解锁机器人最终目标的关键。可以学习任何东西并完成任何任务的机器。“一般智力”的概念就像人脑一样。人工智能(AGI)不再像今天所有现实世界的人工智能系统一样专注于一个狭窄的单一学习任务,而是可以学习任何任务,并将学习从一个领域应用到另一个领域,而无需大量的再培训。
沈心,该公司成立于英国,2014年被谷歌收购,旨在通过突破目标驱动系统和其他AI模型的能力限制,解决一些最复杂的机器智能问题。从专为学习如何与人类对手玩围棋而设计的AlphaGo开始,公司迅速扩展了AlphaZero,它可以从零开始学习任何游戏。以前AlphaGo需要几个月的时间才能学会,现在AlphaZero可以使用增强学习在短短几天内完成。从零开始,唯一的目标是提高胜率,AlphaZero在所有100款测试游戏中的表现都优于AlphaGo。AlphaZero通过简单地和自己玩游戏,通过反复试验来实现这个目标。通过这种简单的方法,通用学习系统不仅可以创建模式,还可以为本质上提供给它的任何输入设计最佳的条件和结果。可以预见,这就变成了d。
eepMind的最高荣耀,也是AI行业的圣杯。自然,就像技术行业中的人们经常使用新技术一样,他们将想法转向可能的实际应用。AlphaZero是利用当时可用的最佳技术创建的,例如机器学习和应用其他领域,例如神经科学和行为心理学研究。这些技术被用于强大的通用学习算法的开发中,也许我们距离AGI研究的真正突破可能还需要几年的时间。
人工智能行业在机器学习研究方面处于一个十字路口。当今使用最广泛的算法正在解决重要但相对简单的问题。尽管机器已经证明了它们能够识别图像,理解语音,查找模式,发现异常并做出预测的能力,但它们仍依赖于训练数据和狭窄的学习任务来以任何精确度完成任务。在这种情况下,机器学习非常耗费数据,并且计算量很大。如果您有足够复杂的学习任务,则可能需要PB或更多的训练数据,数十万美元的GPU密集型计算以及数月的训练。显然,仅靠暴力手段无法解决AGI。
目标驱动的系统模式虽然今天已成为七个模式中最少实施的模式之一,但它可能是掌握数据和计算密集型知识的关键。目标驱动的系统越来越多地在具有实际用例的项目中实施。因此,由于其潜在的前景,它是最有趣的模式之一。