从事机器学习(ML)项目的人都知道,ML需要大量的数据来训练算法。有人会说,你永远不会有太多的数据。数据量和生成的ML模型的复杂性之间通常存在相关性。随着AI发展到一个新的兴趣池,使用更复杂的AI功能,这种数据饥渴只会变得更强。由于人工智能的复杂性还有其他促成趋势,组织面临的问题是:“他们有合适的数据来促进成功的人工智能工作吗?”如果他们没有足够的资源,是否应该在期待AI盛宴时多备货?
组织收集的所有大数据不可能都是正确的数据,但知道AI的去向,会让组织在AI的发展和未来几十年更正确数据的收集和收集中有“落脚点”。
人工智能的进步改变了数据游戏。
虽然ML需要我提供大量的数据来修改它的行为,但是随着AI功能的日益复杂,对AI的需求也迅速增加。这是从机器学习到深度学习(DL)的一大步,因为DL比ML需要更多的数据。原因是DL只能识别神经网络各层之间的概念差异。当暴露于数百万个数据点时,DL决定了概念的边缘。DL机器被允许像人脑一样通过神经网络来表示概念,从而可以解决更复杂的问题。人工智能还可以用更不确定或模糊的答案来解决模糊问题。这些通常是判断或识别的问题,可以扩展到创造性或其他右脑活动。这需要更多的数据,
从数据驱动向结果驱动过渡
随着人工智能在其协助或解决的复杂问题中不断发展,它将变得数据驱动和目标/结果驱动。这意味着AI可能会立即请求解决特定问题或做出特定推断所需的数据,这使得数据管理变得复杂。它可能涉及解决方案的归纳数据驱动部分和基于实现目标的假设的数据推导需求之间的交互。对于注重结果的问题,需要这种动态的互动。这与仅仅通过查询数据来发现有趣的事件和模式有很大的不同。决策驱动法正好适合这两种完全不同的方法。通过将数据与结果进行匹配,一些决策将集中在操作上并得到改进。归纳演绎会有更多的战略决策。这只是增加数据使用的另一个需求渠道。
问题范围的变化会影响数据需求。
AI解决方案的范围通常从一个狭窄的领域开始,随着时间的推移扩展到更大的范围,因此需要更多的数据。复杂的解决方案通常针对多个答案,需要更多的数据来支持分支解决方案集,从而导致复杂/混合的结果。随着决策、行动和结果的范围跨越组织内外的更多背景,将需要更多数据来了解每个背景及其相互作用。这些上下文中的每一个都可能以不同的速率变化和变形,因此需要更多的数据。
净值;Net:
显然,更多的数据将成为AI辅助解决方案的标志。数据需求可能来自更具挑战性的问题、高级人工智能/分析的更好利用或端到端价值链的增长。有一点是肯定的。组织最好为“AI/数据交互”的新世界做好准备。它可以改变或扩展数据管理策略、方法、技术或工艺。请参考图1查看交互的可能性。