TalkingData林逸飞:以数据智能探索业务突破 企业需正视数字化三大短板

日期:2018-09-27      来源:51cto      作者:佚名      编辑:otpub      点击:818次

在9月召开的以突破为主题的T11 2018暨TalkingData数据智能峰会上,TalkingData合伙人兼执行副总裁林逸飞发表了以数据智能探索业务突破的精彩分享。他着重介绍了TalkingData(简称TD)在零售领域的探索,并总结提出了D2D数字化转型方法论,强调从业务数字化到目标结果数字化的核心思维,并以整合合作伙伴与TalkingData自研的全景数据应用与方案,为企业客户提供业务场景落地服务。

TalkingData合伙人兼执行副总裁 林逸飞

SmartDP 2.0 夯实六大核心能力

会上,TalkingData宣布其数据智能平台已升级至2.0版本,内部称之为TalkingData数据中台。据悉,数据智能平台2.0(SmartDP 2.0)拥有管理、工程、科学以及安全、连接、共享六大核心能力。

SmartDP 2.0数据中台由三部分组成,底层是开放的数据连接平台,连接了包括电信数据、电商数据、自采集的SDK数据、社交数据、中小数据源等众多数据,通过物联网方案,安全合规地进行接入;中间层是数据治理团队,提供资产地图、质量控制、运营等能力;顶层是大量的工程工具,包含数据科学平台、模型部署平台、数据智能市场以及数据探索沙箱等。

此数据中台具有聚合所有的数据,提供大量共享数据服务和工具的作用。数据中台上有三块,首先是为TD的合作伙伴开发的业务和服务,其次是让客户在数据中台上开发自己的业务,最后最小的一部分才是TD去开发的业务。林逸飞提到。

术业有专攻,TalkingData把数据中台打磨好,把连接共享、算力、科学做好,是希望让更多的合作伙伴一起共享平台和数据的能力,把涉及到行业深度知识、行业进入壁垒的业务要求等交给合作伙伴,分工合作,以期望和客户共创一些行业应用。TD开放数据中台是希望将行业中的头部企业探索出来的数据能力和方法,更快更好地去赋能给整个产业链中的中小企业,从而促进全行业的发展。

顺势而为 让数据成为驱动经营的增长引擎

民生银行信用卡中心、绫致时装、中国移动物联网有限公司也作为重要合作伙伴代表登台,分享了在企业数字化转型方面的独到见解,以及与TalkingData合作探索转型创新的经验。林逸飞在接受51CTO记者采访时表示,TalkingData为企业的数字化转型赋能,选择行业时有三个简单的出发点。

第一个出发点:要判断企业的CXO或高级领导是否相信数据可以帮助他的业务。如果企业的领导不信数据,无论他是电商、金融还是其他行业,都不会是TalkingData的关键合作伙伴,因为数据对这类企业来说不是最主要的经营助推点。

第二个出发点:纵观TalkingData的七年发展史,从金融到零售,始终是顺势而为。例如,三五年前金融行业的数字化显而易见,金融产品推向市场的速度非常快,科技会帮助金融行业完成整个数字化闭环。最近两年是零售业,这两个是TalkingData倾力投入的行业,皆是顺势而为,顺着科技或业务模式变化的潮流而上,更容易形成数据闭环和数据资产,产生的数据效果也会更加显著。

第三个相对特殊一点的是政府,大数据给政府带来很多新的课题,政府无需依赖商业潮流就可以推动着去做很多事。例如人口普查,从前是小抽样的人口普查,如今可以考虑用更大规模的数据实现人口普查,这是一个很细分的领域,政府还可以用数据做很多事。目前,金融、零售和政府是TalkingData主力做的三个行业。

企业需正视数字化转型的三大短板

企业进行数字化转型,信数据是前提,但不同企业在进行数字化时往往存在三大主要短板。

一是组织结构问题。互联网企业往往都设有一个专门做数据驱动的部门,例如亚马逊的飞轮效应,阿里的御膳房,都是一个真实存在的组织,在规定的权限边界范围内为大家做数据服务,而传统企业往往没有这样的组织,TalkingData需要和各种部门打交道,这在无形中增加了转型的难度。

二是技术接口不完善。无论是做数据模型推荐或是协同过滤,推到市场上拿反馈时往往拿不回来,这就涉及到了企业边界和市场对接的问题,有很多技术接口准备的不够完善。例如,企业的数据不整合,数据清洗需要花费很多额外的精力。林逸飞强调,组织结构和技术接口是影响企业数字化进程的两大核心问题,而工程和技术问题并不是复杂问题。

三是人才问题。在数据工程和数据科学两个方面,传统企业与大的互联网企业之间的人才争夺非常激烈,传统企业并不占优势,人才问题也是数字化的一大短板。

腾云大学 让数据科学走出实验室

在人才问题方面,TalkingData也做了一些努力的尝试。我们有海量的数据,有非常好的计算单元,有实战型的人才,这些对于刚刚进入数据科学领域的人才而言极富吸引力。林逸飞提到,我们在与客户进行深度合作的过程中,会将一些人才安排在他们的项目里,在一段时间之后,客户会给这些人提供offer,TalkingData已为客户输送了近百个人才,其中包括从国外的几所名校以及国内的清华、人大等高等学府引入的人才。

TalkingData投入几百人去做腾讯大学这个平台,不一定能够完全缓解客户对人才的缺口,而是希望数据科学能够走出实验室,进一步实现平民化,从而发挥其真正的生产价值。

百灵计划 投入1亿资源为合作伙伴赋能

值得一提的是,TalkingData在本届T11峰会上发布了合作伙伴共创计划百灵计划, 基于TalkingData数据资源和中台能力,与合作伙伴共同探索并构建基于大数据和领先智能技术的场景商业应用。百灵计划将投入价值1亿元的资源,为100家合作伙伴提供100天的免费开放数据、开放算力以及服务与培训,加速赋能合作伙伴发展。

林逸飞介绍,目前已有几十家合作伙伴开始展开相关合作与服务,TalkingData也从中积累了一些经验。我们将免费开放算力、存储、带宽、技术框架和样本数据等资源,合作伙伴需要有明确的课题和目标,我们会有自己的团队跟他们对接,并判断其课题目标是解决哪类业务问题,在数据科学和模型方面处于哪一水平,这些都要有相应的共识,以此来判断是否为合适的合作伙伴。据透露,百灵计划的细则也会有详细的公开描述。

为平台赋能 促进人工智能产业化

在谈到对人工智能领域的研究时,林逸飞表示,TalkingData比较关注在业务端做产业化运营,作为平台型的公司,我们更希望为平台赋能。首先,TD对边缘计算领域进行资源投入,与高通、中移动等展开合作,在边缘这一侧,专注于AI框架的研究,期望在框架之上可以长出各种各样的应用。

在服务端,TD期望AI不再曲高和寡,能够实现平民化。人工智能从特征工程的选取,到工程化和模型投产,再到数据的迅速迭代,这个过程中投产比参数的调校更重要,AI框架会加速形成模型与实际效果之间的闭环,让AI更快实现产业化。林逸飞提到,有时模型调校半年不如增加一个数据维度来的更直接,与其纠结于几层的神经网络,拘泥于模型的复杂度和精确调校,不如考虑迅速投产后如何找到更合适的特征工程。

此外,在服务端TD还关注AI的基础特征工程。例如TD刚刚投资BasicFider,期望能将其变成平台级的服务,这家公司从事基础特征工程的提取工作,对人脸识别、姿态识别、道路识别、影像识别、服装识别进行标注,满足不同算法公司的标注需求。

有了AI框架,完成基础特征工程的选取和标注,那么模型间的对比将水到渠成。TD要做的并不是开发某个AI模型,而是通过数据中台实现对数据和模型的共享,与合作伙伴共同促进AI模型的产业化。


本站所载作品版权归作者及原出处共同所有。凡本网注明“来源:OTPUB”的所有作品、文章,版权均属于本站,转载、摘编或利用其它方式使用上述作品,应注明“来源:OTPUB” 或 “摘自:OTPUB”。

上一篇: 大数据需要学什么? 下一篇: 写作比写代码难多了?给数据科学...