元年

数字化转型:AI中台如何在企业中落地

数据中台· 发布时间:2022-01-27

近年来,人工智能浪潮正在释放出巨大的创新能量。AI技术的加速演进,给各行各业、各类场景应用带来了颠覆性的变革。在全球数字经济飞速发展的时代背景下,行业数字化转型和智能化升级已经全面启动。

一、AI在企业落地的痛点

企业中的业务都运行于大数据之上,大量的业务、财务、税务的沉淀数据都是处于待开发状态。在信息智能化转型时代,信息就是价值。如何使这些数据真正活动起来,得到有价值的信息,并创造额外的价值,是每个企业都非常关心的话题。比如根据历史数据,一方面可以分析生产经营状况,深度挖掘数据中的模式,清晰地发现销量变化趋势,以及受哪些数据维度影响最大;另一方面利用历史数据建模,可以对将来的业务、财务、税务状况进行评估和预测,及时进行战略调整。

大数据时代最活跃的消费者是人工智能(AI),AI可以赋能企业,对庞大的信息系统进行降维,提取其中最重要的结构化数据和要素矩阵。AI技术是这个时代普及最快的技术之一,企业都或多或少参与了AI能力的消费,但是只有积极参与AI的生产,才能从源头上抓住先机。

而AI的工作流非常复杂,并拥有一定的不确定性。面对海量的沉淀数据和庞杂的场景,如何从中发现知识,寻找隐藏在大数据中的特定模式、趋势和相关性(甚至因果性)以及其他可能的商业应用前景,都需要拥有更好的数据洞察,并对现实业务产生正向反馈。随着数据量的指数级增长,企业对高价值信息的模式发现和趋势判断都将变得越来越困难,由于缺乏清晰的实施路线图,企业往往无从下手,这主要受制于以下几个因素的影响:

技术门槛高

人工智能(AI)是一门结合计算机、统计学和认知科学等的跨学科技术,一方面需要技术人员有足够的数学知识来理解AI的算法;另一方面需要将人对业务和数据的理解,转化为人工智能的算法建模。处在数字化转型阶段,企业更加关注的是业务转型和场景优化,组织算法团队去解决技术问题的人力和技术成本非常高。

建模周期长

算法的实现过程,包含数据清洗、特征提取、特征编码、算法设计、算法开发、优化和部署等等,每一步都存在不确定性,会影响到模型的最终效果。而且还需要针对业务场景进行特定优化,业务或者算法团队内部经常会重复造轮子,不利于快速迭代,导致建模的成本高、时间长。

业务反应慢

从业务需求出发,从开始需求分析到最终算法建模完成,研发团队需要针对性开展数据分析处理、模型的构建训练等,过程复杂繁复,效率不高,且有可能错过决策的最佳窗口期,拖长了需求响应时间,从而造成业务的损失,特别是对时机比较敏感的行业,比如快消品生产零售行业。

零散需求多

企业的业务需求往往比较零散,需要AI能力的场景遍布横向的部门业务线和纵向的期间业务流水,实现、管理和迭代这些应用场景耗费大量人力和脑力,造成成本和资源的浪费。

模型黑盒化

众所周知人工智能的精度越高,模型越难解释,特别是深度学习算法,人们很难在黑盒化的模型中进行数据洞察以及做出业务决策,这是一个长期困扰企业业务人员和决策层的问题。企业从大数据中受益,也承担了模型难以理解的风险,最新的人工智能潮流就包含了模型的可解释性和信任方向的研究。

二、元年方舟AI中台的解决方案

以数据中台、技术中台、业务中台为代表的一系列技术,极大地增强了业务敏捷性,通过沉淀共享服务,提高复用率,打破“烟囱式”系统之间的协作,降低业务试错成本。企业专注于业务的快速创新能力,从而提升企业业务和技术的管理效能。

随着企业智能化发展的要求,AI应用参与业务的比例越来越高,但AI模型开发的周期长、不确定性高,严重影响了下游业务推进。而企业应用AI的目标通常是:根据业务数据和市场动态,对历史数据进行挖掘、分析和洞察,通过人工智能算法对数据进行降维并抽象出效率高、效果好的模型,从而对将来的业务进行预测、推演和决策。为此,元年算法团队推出了AI中台产品,可以全方位地为客户的业务优化进行AI赋能。

1、元年方舟AI中台架构设计


能否基于中台化思想对AI研发的数据、流程和模型成果进行高效的组织和管理?目前数据中台提供了贯通一致的数据管理,在未来,数据中台则更多基于数据和算法来进行科学决策,拥有为数据决策提供战略洞察的能力。为满足业务需求,数据中台背后需要有强大的计算引擎和AI算法引擎支持,这为打造AI中台提供了契机。元年方舟AI中台对接数据中台,实行统一的数据管理,并以此为基础形成了开发流程和模型管理的高效的一体化解决方案。图1展示了典型的AI中台架构图。

2、元年方舟AI中台技术特点

AI中台旨在赋能企业用户在数小时内实现多样化的AI能力。从设计之初,就是面向企业的业务人员、数据科学家、算法人员打造。提供多种人工智能建模方式,让用户能快速创建算法模型,自动生成服务并发布到生产环境。在此服务的基础上,我们提供了场景丰富的数据洞察、预测、归因、决策、反馈等功能。


表中总结了AI中台的一些特点,因此元年方舟AI中台实际上提供了一种融合了AI+BI一体化的快速响应方案,让终端用户从业务数据入手,从人工智能的被动消费者积极转变为主动生产者的角色,利用AI提供的探索、分析、预测、决策线索,抓住市场先机。下面就几个最大的特点进行详细介绍:

AIaaS:AI 即服务,为企业AI的开发、管理、部署、监控、注册服务提供一站式解决方案,形成全生命周期的AI服务管理。业务人员和算法人员借助平台能力,可以快速实现模型的训练、部署和发布,需求交付周期大大缩短,建模周期从周的量级缩短到1小时甚至十分钟。分析人员和决策者可以根据市场行情,快速实现洞察、分析、归因和决策,抓住市场机遇。

聚焦业务:AI中台帮助用户省去了繁琐的建模步骤,用户只需要关心数据和业务本身,就可以实现高精度的AI能力,用于后续对业务的探索、预测、分析和决策。业务可以是千变万化,不同行业或者不同领域遵循同一套建模和管理方案,都可以用非常小的代价以标准化的接口方式嵌入到用户的使用场景中。聚焦业务还意味着离散需求可以抽象为通用需求,可以多次复用和迭代线上算法,比如匹配模型既可以用在酒店实体(POI)的智能化对齐中,也可以用在回款认领的过程中。同时我们会定期推出开箱即用的人工智能组件,用于不同的业务需求。

自动化调参:算法实现过程中,选择合适算法和参数往往依赖算法工程师的经验。这些流程通常比较耗费时间、有技术门槛并且非常复杂。算法团队根据特征的数据类型(比如数值型、文本型、日期型和布尔型等),对预处理、特征预处理、特征编码、算法建模和参数优化等流程,全部进行了自动化处理;对模型的超参数进行了随机搜索和贝叶斯优化等多种优化处理,用户不需要指定参数,就可以从AI中台得到训练好的最优模型,实现业内领先的AutoML能力。

解释和决策:融入模拟预测、数据洞察、归因分析等多种商业智能能力,帮助用户理解模型、建立信任,发现生产经营中的重要因素以及决策的关键线索。算法团队使用博弈论中著名的Shapley指标,来估算模型中每个特征对预测结果的影响程度,从而形成预测结果的归因分析。

3、元年方舟AI中台建模方式


元年方舟AI中台提供了以下几种建模方式:

(1)面向业务人员、分析人员的无代码建模场景

为业务人员和数据分析人员提供无代码建模平台。众所周知,人工智能算法要达到比较好的效果,需要完成冗长的建模流程,并且进行每一步流程的优化。使用元年方舟AI中台,用户无需调参,只需要上传表格数据集,就可以拥有快速实现分类、预测和时序预测的能力。

(2)面向算法人员的jupyter建模方式

通过jupyter环境,赋能企业的算法人员自定义实现算法功能。企业算法人员只需要专注于算法本身的开发,而不需要关心数据的存储、环境的搭建、服务发布等细节,并可以自动化发布为服务API,经过测试的算法最终也可以成为通用的企业组件,在业务之间共享。

(3)面向企业单业务场景的预置组件方式

预置组件是元年算法团队针对通用场景开发的一系列深度学习模型,用户只需要根据业务场景选择算法组件并提供训练数据,就可以实现诸如文本分类、文本匹配、实体识别、关系提取、情感分析等常用的功能。值得一提的是,元年会持续提供业财税和行业内的模型,帮助企业在业务中迅速实现相关场景的赋能。

三、AI中台的建模过程

AI中台的最大价值在于将企业的核心业务和繁杂的建模过程高效解耦,用户只需要聚焦于业务本身,提炼建模需求,而不需要关注建模的细节,从而形成业务数据—模型生产—模型消费—业务反馈的闭环。


如上图所示,用户聚焦于业务本身,有两层含义:一是用户需要从公司的业务场景中提炼出业务需求,形成能够代表典型业务场景的数据,进行模型的生产,而不用感知建模的过程。二是AI应用对于业务的反馈,用户可以根据模型反馈及时制定调整措施,这是模型的消费过程。

元年方舟AI中台的敏捷建模过程,几分钟内就可以生产出模型,极大提高企业使用AI应用的便捷性和时效性。模型生成之后可以进行模型消费,从而根据反馈信息及时做出业务调整和决策。下面我们就通过两个场景,了解一下消费过程。

场景1:时序模型预测

据历史数据进行生产、销售、收入等指标的预测,是每个公司的基本需求,也是最广泛的一类应用场景。通常是分析型数据的预测,比如房价预测、公司产品销量预测、热度走势等等,这种预测往往具有时间周期的变化趋势,构成一种特殊的预测场景,成为时间序列预测(简称时序预测)。举个例子来说,根据国外某产品的每周销量,预测未来几周的销量,这是一个时序预测的场景,我们用上面的视频来展示建模过程。


上图显示了该产品的每周销量,可以发现明显的周期性演化特征,并且在节假日(圣诞节、感恩节前后)有明显的销量暴涨的特征。阴影区域是模型预测结果,实线是真实结果,可以看出商家需要为即将到来的销量高峰,准备合适数量的库存;如果销量下降,商家需要考虑如何清理库存。

场景2:销量预测+归因分析+模拟预测

某汽车公司想要测算下一季度某车型在某地的销量走势,那么需要提供的数据应该尽可能包含车型的参数、宏观经济、消费习惯、竞争对手、国家政策、节假日等特征数据,模型的生产过程以数据为核心资源。在消费过程中,用户可以深入了解数据特征对于销量的影响。建模完成发布成应用,就可以考察归因分析、模拟预测和批量预测等应用页面。

归因分析通常使用瀑布图表示,蓝色的表示对销量有正向贡献的数据特征,橙色表示负向特征,柱图的高度越大表示正向/负向的程度越高。图5展示了车长、车宽、品牌等因素是影响销量的最大几个正向因素,而排量、价格是最大的几个负向因素。


如果想深入考察某一特定因素的影响,比如品牌,可以下钻该维度,了解哪些品牌的销量更多,下图展示id 638的品牌(数据已脱敏)销量超出所有品牌平均销量的22%,如下图所示:


在了解哪些因素影响比较重要之后,可以模拟改变某个因素看销量会如何变化,见图7。因此模拟预测可以辅助客户进行决策,对导致销量下降的某些因素做出调整。真实的辅助决策场景会更加复杂,有些宏观因素无法预见和干预(如天气、GDP、疫情、房价走势等等),或者根本不在数据集中,真实场景使用时需要关注数据缺失带来的预测偏差。


上述案例介绍了模型的生产过程和一般场景的消费过程,更多的业务场景同样可以泛化。元年方舟AI中台为企业提供功能丰富、灵活高效的一站式AI应用模型效率化生产平台,助力企业智能化,提高其自身业务价值,让AI与业务深度融合。

>>

解决方案

白皮书

研究报告

咨询热线

400-680-2995