自研AutoML技术,智易科技要走不同于Google的AI平台之路 | 爱分析访谈

AI技术的不断发展,似乎让我们看到了未来无限可能,然而如何将AI技术落地,服务行业,依旧是正在探索的问题。

 

智易科技创始人李杰认为,AI技术应该是一种赋能型的技术,可以服务各个行业,帮助提升生产力,目前,AI商业化落地处于初级阶段,有很多平台级的机会存在。

 

李杰具有云计算和AI技术背景,曾在微软、谷歌从事开发工作多年。2017年5月,李杰创立智易科技,并于年底正式完成深思平台研发,一款零门槛AI模型研发和应用平台。

 

深思平台可以帮助任何企业用户快速开发出可应用于实际生产环境的AI模型,用户只需要将数据导入并选择预测目标,平台即可给出最优模型。深思平台定位零门槛和全程可视化的人工智能应用开发平台,用户不需要掌握任何AI相关的理论和知识,就可以轻松上手。

 

 

深思平台是一个庞大的系统集合,包括底层的分布式集群、云基础设施;上层的AI模型研发、分布式训练架构以及大数据引擎,包括Hadoop、Spark等;同时拥有ETL层,对数据进行处理,有可视化和BI等功能;并在面向前端用户时,搭建了基于浏览器的可视化操作页面,大幅降低了使用门槛。

 

AutoML是深思平台中关键技术之一,也是如今AI研究的前沿领域。2016年,Google第一次提出AutoML概念,旨在帮助降低AI使用门槛,但是Google选择了更为依赖算力、偏重利用高性能硬件暴力搜索的方式实现智能建模调参。

 

李杰认为,这种方式在商业化中并不具备实际条件,所以智易科技在自主研发AutoML技术中,选择加入启发式搜索技术,即在面对特定问题时,平台会根据过往规则给出预判模型,将更多算力投入其中,这样可以利用更少的迭代次数达到和暴力搜索方式类似的效果。

 

深思平台支持公有云和私有部署两种方式。初次使用AI的客户会更倾向于公有云模式,已有AI使用经验并对于信息安全有较强要求的客户,比如金融行业客户,会更倾向私有部署。

 

目前,深思平台主要应用在金融业、零售业以及工业中,支持结构化数据和图像数据,可以帮助客户完成反欺诈、销量预测以及产品缺陷检测等一系列AI应用。

 

对于AI领域中的竞争,李杰认为,目前AI领域处于非常初期的阶段,正是建立行业壁垒的关键时期,由于开源的存在,算法普及程度很高,技术已经不能形成较高的竞争力,对行业场景的深入理解,准确捕捉行业痛点需求才是维持在该行业中竞争力的重要保障。

 

 

 

近期,爱分析对智易科技创始人李杰进行了专访,就智易科技的产品、经营策略、战略发展目标以及AI行业的发展趋势做了深入探讨,现将部分精彩内容分享如下。

 

降低AI使用门槛,以通用型AI平台切入市场

 

爱分析:为什么选择AI这个行业作为创业方向?

 

李杰:我博士期间就有云计算和数据挖掘的背景,工作后先在微软总部做了两年多云计算平台研发,之后去了谷歌开始接触AI尤其是深度学习。

 

当时我所在的项目组为底层云平台系统,管理着Google所有机器集群,可以接触到整个数据中心的核心数据和资源。也正是那时我发起和主导了一个数据中心智能化管理项目的研发,利用AI技术来挖掘数据价值,结果非常成功,当时就被AI的能力所震撼。

 

这样的一个契机使我认识到,AI作为一个赋能型技术,几乎可以用来服务全行业,挖掘不同场景下大数据的价值,所以很希望在这个方向上做一些深入的探索。

 

爱分析:为什么选择以通用型AI平台切入市场?

 

李杰:AI创业的主流方式是选择一个垂直领域(医疗、零售等等)进入,然后做AI相关的应用等等。

 

我想做的是通用型AI研发平台,主要有两点因素:

 

第一, AI本身作为一个赋能型技术,应该是通用的,全行业都存在跟AI结合的机会;目前,AI的商业化落地处于初级阶段,有很多平台级的机会等待我们去开拓。

 

第二, 在微软和谷歌的工作经历,使我能够站在国际视角看到最为前沿的一些技术趋势,所以希望能结合自身的背景经历做一些更有价值的事情。在云计算、大数据、以及人工智能多年的经验积累,使我能够快速利用自身技术能力搭建这样一个通用型AI研发平台,之后再利用这个工具慢慢进入其他行业,去获得对行业更多的认知。

 

爱分析:深思平台的研发周期是多久?

 

李杰:2017年4月底,我从Google离职,利用1个月左右做行业调研,发现市场上没有很好产品先例,之后2-3个月用来设计系统和原型的迭代开发,8月份开始正式进入开发阶段,12月底1.0版本开发完成。

 

爱分析:深思平台的定位是什么?

 

李杰:我们的产品定位是在一定程度上取代初中级的AI专家,并且将AI使用的低门槛做到极致。

 

在降低门槛方面我们有两个目标,第一,用户全流程不需要写任何代码;第二,完全不懂AI的用户也能完成相关的AI应用模型开发。

 

爱分析:市场上也有一些为了降低AI使用门槛的产品,这些产品有什么不足?

 

李杰:国内外有很多为了降低AI使用门槛的工具,但是最后的产品并没有达到这个目标,主要原因是,虽然这些工具提供了一定的可视化交互界面,但同时也暴露了大量的技术参数、配置给用户,所以这些产品依然是面对AI专家的。

 

自研AutoML技术,满足商业化要求

 

爱分析:深思平台包括ETL层、数仓吗?

 

李杰:我们的产品是一个庞大的系统整合。

 

最底层是分布式集群管理,云基础设施;再往上一层是基于主流的开源框架的核心AI研发层,用于AI模型训练;再往上一层,是基于Hadoop、Spark的大数据引擎,包括数据的存储和处理,以及ETL部分,支持BI、可视化功能;最后是面向用户的,搭建了基于浏览器的可视化操作页面,大幅降低了使用门槛。

 

爱分析:用户如何使用深思平台开发AI应用?

 

李杰:首先,用户可以从不同数据源(本地、云端)导入数据,然后只需要确定训练目标,平台就会自动化完成模型的搜索和迭代,找出最优解。如果模型达到了用户的生产环境要求,我们提供模型托管以及模型API接口,之后用户可以直接调用API使用模型。

 

爱分析:模型的选择是平台自动完成的吗?

 

李杰:是的,这是利用我们自主研发的AutoML技术。用户只需要选择预测目标,我们的产品就可以完成模型算法的选择、超参数的组合迭代,然后找到最优化模型。

 

我们跟Google AutoML的技术路线有一些差异。

 

Google自身有资源优势(TPU硬件),所以采取的是更为依赖算力、近似暴力破解的方式来寻找最优解,我们认为这种模式硬件成本过高,在商业化中并不适用。

 

我们则是更多的依赖于一些数学优化理论去做更加经济的搜索、迭代,并且结合我们的启发式搜索,对于不同类型的问题,我们会给出某种预判模型,我们把这些人为规则加入到自动化迭代中,达到用更少的迭代次数达到和暴力搜索类似的效果。

 

爱分析:模型由平台直接给出,大型客户对于模型的可解释性是否有顾虑?

 

李杰:有的用户会有可解释性需求。现在这也是AI领域需要突破的难点,从效果来讲,神经网络往往能达到最佳的效果,但是缺少可解释性,如果用户有很强的可解释性需求,我们会选择一些有较强可解释性的算法来服务客户。

 

爱分析:模型会根据实时数据不断更新吗?

 

李杰:模型持续训练已经支持了,按照周期来不断训练模型。但是在实际中,实时训练的需求比较少见。

 

爱分析:在建模功能上,Tensorflow和深思平台的区别有哪些?

 

李杰:我们平台是基于可拓展的架构设计,支持当前主流的AI算法框架,包括Tensorflow、Scikit-learn、Caffe等等。一些Tensorflow支持得并不太完善的模型算法,比如像决策树等等,我们会通过支持其它的一些第三方框架(例如XGBoost和LightGBM)来进行补充。

 

部署模式灵活,未来加入数据准备模块

 

爱分析:用户在使用深思平台时,可以做计算资源调度吗?

 

李杰:这些都是可以配置的,首先我们的平台是提供两种形式的服务,一种是公有云形式,SaaS模式,另一种是私有部署,私有部署中就可以根据客户需求来配置计算资源。

 

其实建模过程中每一个环节都涉及到大量数据处理,需要大量计算资源调度,我们提供两种方式,一种是平台自动化选择,另一种是用户自己制定。

 

爱分析:目前,哪种部署方式更加广泛?

 

李杰:这跟不同行业的属性有关,金融业客户倾向于私有部署,而对于一些追求快速发展、意识更为前沿的客户(如零售、互联网等),公有云模式会较多。

 

爱分析:深思平台对于数据准备环节的支持如何?

 

李杰:在AI应用研发中,占用时间最多的是模型选取迭代以及数据准备工作。现阶段,我们更多资源是投入到优化模型这块,对于数据准备工作,我们已经开始进行研发,未来我们的平台会兼顾到数据前期准备环节。

 

客户需有良好数据基础,AI平台市场仍处早期

 

爱分析:深思平台的客群定位是什么?

 

李杰:对于客户,我们有两个要求:有良好的数据基础,有明确的需求。

 

现在我们把客户分为三个阶段:

 

第一阶段,没有AI使用经验,想做AI尝试,比较初级;

 

第二阶段,有AI成功使用案列,会尝试更多场景,更加积极去使用AI,会寻求外包解决方案;

 

第三阶段,相当多的成功AI应用场景,不再满足于第三方提供解决方案,更倾向于自己拥有AI的能力。

 

我们服务的最佳客户是对AI有比较成熟的理解,并且之前有相关AI使用经验的第二和第三阶段客户。

 

爱分析:目前,智易科技的客户主要分布在哪些行业?

 

李杰:金融行业,因为跟AI结合很早,不再满足于业务解决方案,想要AI通用型能力;零售行业,有销量预测、库存管理等方面的需求,深思平台可以帮助零售行业的所有环节提升生产力;工业,利用工业视觉开发对于产品缺陷检测的AI应用。

 

爱分析:深思平台与客户原有系统的集成性如何?

 

李杰:深思本身是可以作为一个单独的平台存在的,最后输出的是一个模型,会有一个API接口,用户只需要调用API接口就可以完成应用部署。

 

爱分析:客户对平台级产品的接受程度如何?

 

李杰:现阶段,可能只有少数客户对于平台级产品的接受程度较高,但是随着客户对于AI的认知不断进步, 在未来的几年,会有更大需求爆发。

 

爱分析:智易在进入行业之后会向上层应用发展吗?

 

李杰:目前是以单点切入行业,会不断渗透到其他业务中,我们之后会不断打磨平台产品,并且会向行业应用发展。

 

爱分析:您怎么看待目前AI平台领域的竞争?

 

李杰:我认为目前AI市场处于非常初级的阶段,可以叫做人工智能商业探索的大航海时代,还有很多未探索的领域,AI+行业的机会还非常多,各个厂商都有机会成为AI时代领导者,并且我个人非常看好平台级的AI产品。

 

爱分析:开源盛行,技术不再是难点,AI行业的竞争壁垒是什么?

 

李杰:应该是对不同行业的认知程度吧,现在许多行业对AI的认知仍停留在一个较为初级的阶段,不知道AI能帮助改善生产中的哪些环节,这是我们需要跟不同行业一线业务人员共同去探索的。谁先完成对行业的深入探索,帮助客户解决实际需求,就能建立起该行业的竞争壁垒。

 

爱分析:智易科技有哪些对标公司?

 

李杰:从国际范围来看,在产品理念方面美国的DataRobot跟我们比较相似,但我们的核心竞争力在于把AI低门槛做到极致,比如让一个完全不懂AI的外卖小哥15分钟学会使用我们的产品。

 

国内目前也有一些公司在往这个方向探索,但在产品的形态理念和AI研发过程的复杂性封装方面都跟我们有较大差距。

 

爱分析:智易与微软加速器在哪些方面进行了合作?

 

李杰:智易是一家非常年轻的初创公司,很荣幸能跟微软加速器合作,同时,我们也确实感受到了微软加速器给予初创企业莫大的扶持和助力,包括技术、资源全方位的帮助。

 

第一, 微软的Azure云平台计算资源,我们拿到了非常大的一个免费额度,现在,我们平台也在部分往Azure平台迁移。

 

第二, 媒体资源的获取,也是微软无条件支持的。

 

第三, 投融资对接方面,微软设置了很多私下以及公开的渠道帮助我们去获取。

 

第四, 客户方面,微软很愿意将自身的一些大客户资源提供给我们,帮助我们进行针对性的对接。