人工智能(AI)和机器学习(ML)是新兴领域,将以前所未有的速度改变企业。在数字时代,成功将基于使用分析来发现锁定在当今生成的大量数据中的关键见解。
过去,使用手动密集分析方法发现了这些见解。今天,这不起作用,因为数据量继续增长,数据的复杂性也在增长。AI和ML是数据科学家的最新工具,使他们能够更快地将数据细化为价值。
数据爆炸需要AI和ML
从历史上看,企业使用大型记录系统生成的一小组数据进行操作。今天的环境完全不同,其中有更多的设备和系统生成他们自己的数据,可用于分析。企业面临的挑战是手动分析的数据太多。在日益数字化的世界中竞争的唯一方法是使用AL和ML。
AI和ML用例因垂直而异
AI和ML适用于所有垂直领域,尽管没有普遍的“杀手级应用程序”。相反,有许多适用于各种行业的“致命”用例。常见用例包括:
医疗保健 - 异常检测,以更快地诊断MRI扫描
汽车 - 分类用于识别道路中的物体
零售 - 预测可以准确预测未来的销售情况
联络中心 - 翻译使代理商能够与不同语言的人交谈
正确的基础设施,所需的质量数据
无论用例如何,AI / ML的成功取决于做出正确的基础设施选择,这需要了解数据的作用。AI和ML的成功很大程度上取决于输入系统的数据质量。人工智能行业有一个公理,即“糟糕的数据会导致糟糕的推论” - 这意味着企业应该特别关注他们如何管理数据。人们可以将公理扩展到“良好的数据导致良好的推论”,强调需要合适的基础设施来确保数据“良好”。
尽管使用的数据类型可能不同,但数据在AI的每个用例中都起着关键作用。例如,通过让机器学习在企业生成的大数据湖中找到见解,可以推动创新。事实上,企业可以在数据科学的基础上培养组织内部的新思维。关键是要了解数据在AI / ML工作流程的每一步中所起的作用。
AI / ML工作流程具有以下组件:
数据收集:数据聚合,数据准备,数据转换和存储
数据科学/工程:数据分析,数据处理,安全和治理
培训:模型开发,验证和数据分类
部署:执行推理
数据面临的最大挑战之一是实时构建数据管道。使用新数据源进行探索和发现工作的数据科学家需要收集,准备,建模和推断。因此,IT需要在每个阶段进行更改,并且从更多来源收集更多数据。
同样重要的是要注意工作流是一个迭代循环,其中部署阶段的输出成为数据收集的输入并改进模型。通过这些阶段移动数据的成功在很大程度上取决于拥有合适的基础设施。
支持AI和ML的基础架构的关键考虑因素
位置: AI和ML计划不仅仅在云中进行,也不在现场处理。这些举措应该在给定输出最有意义的位置执行。例如,机场的面部识别系统应该在本地进行分析,因为将信息发送到云并返回所花费的时间会增加该过程的延迟。确保将基础架构部署在云中,本地数据中心以及边缘,这一点至关重要,以便优化AI计划的性能。
高性能基础架构的广度:如前所述,AI性能高度依赖于底层基础架构。例如,与传统的中央处理单元(CPU)相比,图形处理单元(GPU)可以将深度学习加速100倍。强大的服务器将导致过程延迟,而压倒浪费金钱。无论策略是端到端还是最佳策略,都要确保计算硬件具有正确的处理能力和高速存储组合。这需要选择具有广泛产品组合的供应商,该产品组合可以解决AI流程中的任何阶段。
经过验证的设计:基础设施显然非常重要,但运行在其上的软件也是如此。安装软件后,可能需要几个月的时间来调整和优化以适应底层硬件。选择已预安装软件并具有经过验证的设计的供应商,以缩短部署时间并确保优化性能。
数据中心的扩展: AI基础设施不是孤立存在的,应被视为当前数据中心的扩展。理想情况下,企业应该寻找可以使用现有工具进行管理的解决方案。
端到端管理:没有单一的“盒子中的AI”可以插入并打开以开始AI过程。它由几个移动部件组成,包括服务器,存储,网络和软件,每个位置有多个选择。最佳解决方案是整体解决方案,其中包括可通过单一界面管理的所有或至少大部分组件。
网络基础设施:在部署AI时,重点放在支持GPU的服务器,闪存和其他计算基础架构上。这是有道理的,因为AI处理器和存储密集。但是,必须为存储系统和服务器提供遍历网络的数据。AI的基础设施应被视为“三足凳”,其中腿是网络,服务器和存储。每个人必须同样快速地相互跟上。任何一个组件的滞后都会影响性能。应向网络提供与服务器和存储相同的尽职调查。
安全性: AI通常涉及极其敏感的数据,如患者记录,财务信息和个人数据。违反此数据可能对组织造成灾难性后果。此外,输入不良数据可能会导致AI系统做出不正确的推断,从而导致有缺陷的决策。必须使用最先进的技术从头到尾保护AI基础设施。
专业服务:虽然服务在技术上不是基础设施,但它们应该是基础设施决策的一部分。大多数组织,尤其是缺乏经验的组织,都没有必要的技能来使AI成功。服务合作伙伴可以在AI生命周期内提供必要的培训,咨询,实施和优化服务,并且应该是部署的核心组件。
广泛的生态系统:没有任何一家人工智能供应商可以在任 使用具有广泛生态系统的供应商至关重要,并且可以将AI的所有组件集合在一起,以提供完整,交钥匙的端到端解决方案。必须拼凑组件可能会导致延迟甚至失败。选择具有强大生态系统的供应商可以快速实现成功。
从历史上看,人工智能和ML项目由数据科学专家负责运营,但随着这些技术进入主流市场,这很快就会转向IT专业人员。随着这种转变发生并且AI计划变得更加普及,IT组织应该更广泛地考虑支持AI的基础架构。而不是为特定项目购买服务器,网络基础设施和其他组件,目标应该是更广泛地考虑当前和未来的业务需求,类似于当今数据中心的运行方式。