杜晓梦:我的大数据“读心术”
文 | 史中
对于“读心术”这件事,杜晓梦恐怕是专家。
这并不因为她是个直觉强大的美女,而是因为他是北大营销建模专业的博士,比起直觉,她更相信数字。
给大家介绍下,杜晓梦是百分点集团首席数据科学家。
杜晓梦
她为我描绘了一个充满大数据和智能的未来世界。不过,想听懂她在说什么,可能首先要进行一下“洗脑”——我是说清洗一下你的思路,建立一些可能反常识的背景知识。
我猜,有两个认知可能很重要:
1、我们几千年来的忙碌,最基本的方向就是提高资源调配的效率。
2、大数据和人工智能调配资源的效果,在某些领域已经可以完胜人类经验。
虽然很多行业外的人对于百分点不太熟悉,但大概率来说,很多人都用过百分点的产品,只不过并不自知。
百分点成立于2009年,在杜晓梦加入之前,这家公司就已经名声在外。那时候,百分点的王牌产品就是“电商个性推荐系统”。你在登陆电商的时候,总会在一个显眼的区域看到系统“猜你喜欢”的推荐。鼎盛时期,百分点拿下了除淘宝京东外的大多数电商市场,有数亿人用过这套系统。
(说起来,猜你喜欢这种事情,我也会做啊。比如我猜你喜欢这个↓↓↓)
一个和数据死磕的人
从原理来说,一个人的行为可以展现他的偏好,所谓身体是诚实的。所以一个人过往买过什么,看过什么,在哪个网店的哪个橱窗前徘徊过,都很可能隐藏着他的偏好和未来选择,这就是个性化推荐的原理。
说起来,这是一个比较简单的大数据应用场景。
推荐系统之所以懂你,是因为人工智能算法在其中占据了非常重要的地位。实际上,虽然听上去是一款商业意味非常浓的系统,但它的创造者却是清一色的学术大牛。例如百分点创始人苏萌,是康奈尔大学管理学博士,曾任教于北大光华管理学院;首席架构师刘译璟是北京大学应用数学专业博士,等等。
从创始人背景也可以看出,在2010年前后,“个性推荐”这件事情的壁垒很高,唯博士才能搞定。不过,随着人工智能和大数据的黎明越来越临近,2013年,百分点开始面临一些有趣的变化。
从2013年开始,我们发现很多电商的流量在严重下滑,于是猜测这个行业没准会“寡头化”。现在看起来,当时的判断是正确的,之前我们服务的很多电商客户,现在都不在了。。。所以当时我们正好有机会,就做了一次转型。
杜晓梦说。
她指的转型,就是把业务的重心转移到企业级大数据市场。虽然是转型,但是核心技术并没有变化——通过分析数据,找到提高资源调配的方法。
第一个找到他们的,是 TCL。2013年,TCL 也已经感受到了电商对于传统销售体系严重的冲击,队伍开始不好带了。TCL 决定“自救”,环顾市场,百分点提供的“个性推荐”系统似乎很符合他们对于未来世界的想象。于是,对百分点来说这一单生意其实是找上门的。
“企业数据决策”用简单的话科普一下,就是企业利用自己从各方面掌握的客户信息,通过算法计算之后,“猜”出客户的想法,比如谁会更喜欢这一款新电视,谁的手机已经买了一年,可能复购一台,Ta 会喜欢什么型号的手机,等等。通过这些猜测,有针对性地安排生产,进行营销,调整线上线下渠道等等。
说起来,这种系统比个电商性化推荐系统要复杂得多。从一开始,就面临数据的碎片化问题。以 TCL 为例,有的用户数据来自线下销售门店,有些注册用户数据来自官方论坛,有些来自淘宝等第三方电商,想要分析这些数据,首先要打通各个模块的数据,把它们标准化,这需要运用很多营销方面的姿势。还好,这对于杜晓梦这个北大营销建模的博士来说并不是问题。
最开始 TCL 和百分点都觉得这是一次尝试,不过从结果来看,历次促销的成绩都超乎想象。百分点在企业数据决策领域一炮而红。
通过数据之间的连接分析,可以把用户分为不同的类型。
传统行业的觉醒
百分点走上了一条“拯救”传统行业的道路。
很多人对传统行业有或多或少的误解,一看到他们就觉得“日薄西山”,但是真实情况并不如此。根据 IDC 发布的预测报告,目前国内76%以上的数字经济都是由传统行业贡献的。无论是从体量还是在国民经济结构里的位置来看,传统行业都是没办法缺席的。
在杜晓梦看来,传统行业“觉醒”源于伤痛。例如,金融机构之所以会拥抱大数据,是因为受到互联网金融的巨大冲击;零售商场之所以重视“精细化营销”,是因为以阿里巴巴为首的电商已经把他们逼到角落。
所以,根据痛感的先后,传统行业拥抱大数据和人工智能也有一个有趣的次序。
1、最开始是 ToC 的制造业,因为他们如果想生产出适合市场的产品,就迫切地需要和自己的用户建立连接,为用户“画像”。
2、其次开始觉醒的,就是金融行业。金融行业其实创新精神很强,所以他们虽然在 P2P、“第三方征信”、消费金融面前没有很大的业务损失,但是他们的价值观经受了很大的冲击,于是敏锐地拥抱新技术。
3、和金融几乎同时,零售快销行业也开始觉醒。因为电商冲击给他们带来的恐慌非常大,需要背水一战。
4、随后觉醒的,是传统媒体。他们面对的是新媒体的冲击,迫切地想要和读者建立更亲密的关系。
5、最新觉醒的,是政府。因为很多大数据的应用模型已经准备好,可以有效地提高政务效率。
杜晓梦说。
有关城市的大数据系统,可以精确指导具体的政策和规划。
“布道者”杜晓梦
华为是百分点一个里程碑式的客户。
他们对自己的大数据系统质量要求非常高,需要能够处理大量复杂的数据,同时严格保证数据安全。
但是,最艰难的并不是辛苦,而是“传道”。
2014年,基层员工对于大数据的作用还没有特别清楚的认识,所以各个部门一开始非常不理解,为什么要把自己的数据共享出去给其他部门使用。杜晓梦的心里,当然有一份蓝图。智能决策系统就像一个大脑,数据就像知识。一个人多学一分知识,就可能多出十分的创造力。共享数据这件事情对企业来说是潜藏着巨大回报的。
但是,彼时的杜晓梦只能以数据专家的身份,和各个项目团队苦口婆心地普及大数据的原理,一边倾听一边说服。
像这样的事情,杜晓梦经历了不少。
之前每次我都强调我是个搞算法的博士,大谈数据驱动、业务效率、潜在客户、算法。大多数人出于尊敬北大来的博士,笑着听完。然,后就没有然后了。。。
她说。
三年前,中国的营销还是“个人英雄”的时代。一个大牛 CMO(首席营销官)拥有至高无上的权利,拿来两个亿的预算,一个人就能决定花钱的方法。例如重金买一个广告牌,押注某个广告渠道。问他为什么这样选择,他会说这是经验。他们对自己的信任,远大于对数据的信任。
但是,杜晓梦看到这三年走过来,靠个人创意取得成功的 CMO 越来越少,一个广告渠道要投放多少钱,需要数据说话;一款产品是要面向30-35岁的人做促销,还是要面向25-30岁的人做促销,也要拿数据说话。她回忆,这件事情是慢慢改变的。从行业龙头开始吃螃蟹,尝到甜头以后才会慢慢带动整个产业尊重大数据,并且使用大数据。
当然,这些年苦口婆心的“传道”,也造就了现在口才超群的杜晓梦。。。
说回华为的那个项目。最后的结果是,华为经过 A/B 测试,给一组经过分析而产生的用户发送促销消息,同时也给一组通过人工分析选出的用户发同样的促销消息,点击率相差 50%。当时这个系统收效之高,连杜晓梦本人都不由惊叹。
A/B 测试,通过给不同的人群发送相同的信息,或者给相同的人群发送不同的信息,可以测试出更具优势的传播方法。
智能决策的“奇葩”应用
时间到了2017年。
几年熬过来,杜晓梦越来越有信心。她觉得,之所以很多政务项目会找到百分点,也是看中了百分点对于特定行业的理解力。
客观来说,政府手中的数据非常多,质量也非常高。但是却一直为人诟病:政府有这么多数据,为什么不开放给社会,促进经济发展。
杜晓梦觉得,各个政府的数据有一个共同特征,就是“乱”。法人库、居民库、地理信息库、经济信息库、工商民政税务法务各种库都各自为战。很多地方政府究竟有哪些数据,自己可能都不了解。这个时点,应该有人站出来,帮助他们打通这些数据了。
这些数据打通之后,会看到什么呢?
杜晓梦说,从现有的客户来看,打通数据之后,可以通过一个全景图,看到整个城市各个地区的发展状况,以及每个重点地区呈现出的具体特征。例如某个地区的农林牧副状况究竟如何,某个地区的人口聚集模式如何。根据这些,就可以有针对性地制定产业政策,引导人口流动和产业发展。
你可以想象,政府如果根据大数据做产业政策的调整,会在多大程度上促进城市的合理发展。
另外,杜晓梦还介绍了一些大数据有趣的应用领域。
例如某个广电服务商,在全球有48个基站。但是这些基站里面的设备,会发生不可预测的损坏,为了保证服务顺利运行,需要不断更换损坏的设备。
这就有两种方法:
1、不论是否损坏,每隔3-6个月定期更换设备。这会造成浪费。
2、设备损坏之后再维修。这回造成服务质量下降。
这个问题其实有第三种解决方法,那就是用大数据智能决策系统。通过分析各个设备的实时参数,电压、电流、高频电率、水温等等,建立一个健康度判断模型,通过人工智能的方法,通过这些参数自动预测一个设备是不是即将损坏。这种方法被证明可以节省很大的成本。
与此类似,智能决策系统还可以做“桥梁铁路健康度检查”。简单来说,就是在300米长的铁路桥上,每5米放置一个探测器,测量火车通过之后,各个点位上的拉伸情况,可以预测这个桥多少年之后会垮塌。
最近,杜晓梦正在研究一个新的项目。
那就是通过收集运营商的信号塔在大雨、暴雪等各种气象条件下信号衰减情况的数据,建立一个数学模型,从而帮助运营商在各种天气下,自动调节信号塔的功率,从而保障电话网络的通信质量。
类似这样的应用,数不胜数。杜晓梦说起这些,根本停不下来。
她觉得,“智能决策”这件事情本身,对社会有巨大意义。
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以加我微信,shizhongst。
不想走丢的话,你也可以关注我的自媒体公众号“浅黑科技”。
来源:freebuf.com 2018-04-08 12:33:34 by: 史中浅黑科技
请登录后发表评论
注册