feedback

意见

反馈

back-to-up

回到

顶部

一个“机械战警”,牵起他与数据科学的缘分 | 数据科学50人·邬学宁

数据科学50人

· 邬学宁

程一祥   2018-07-05

邬学宁,SAP硅谷创新中心首席数据科学家,长期致力于机器学习与人工智能算法研究与应用。“数据科学核心算法的基础是简洁优美的数学,这是我愿意用一辈子,去追寻的事情。”

1987年,一个“机器人警察”的科幻英雄形象席卷了电影市场。荷兰导演保罗·范霍文,用“半人半机器”的造型,塑造了一个意志坚强、除恶扬善的孤单英雄形象。

这部硬科幻《机械战警》用好莱坞的方式,预言了那时人们眼中可能出现的“人工智能”形象——它不是“终结者”式的诞生了自我意识的机器,而是一个换上了机械身躯的人类自己。

(图片说明:1987年上映的经典科幻电影《机械战警》海报;图片来源:IMDb)

《机械战警》是中国最早引进的“人工智能”类科幻电影之一,当时很多电影院还采用了香港版的中文翻译片名《铁甲威龙》,凸显这个角色带给人们的震撼。那时还在上中学的邬学宁,深深迷恋上了这部电影,他反复看了好多遍,一种对“人工智能”的朦胧意识,就这样在一个他的心中埋下了伏笔。

“机械战警”引发的决定

“看到那个电影之后,我就觉得,以后一定要做机器人了。”

邬学宁认为,当年那个叱咤风云的机械警察,是他对人工智能最原始的启蒙。

中学时期的邬学宁成绩很好,是一个喜欢研究物理,没事儿爱下围棋的少年。对于即将到来的高考,以及自己要选择的未来,邬学宁没有想过太多。

“我的人生就在高三看到那部电影的时候,改变了。”邬学宁说,一部电影,让他疯狂迷恋上了“机器人”这个酷酷的话题。“于是我就拼命找,看中国哪个大学的本科有机器人专业。找到以后,本科两个批次的第一志愿全都报的这一个专业,当时就是有这样的热情。”

邬学宁选择的是家乡上海工业大学的机器人专业,这是钱伟长校长推动设立的国内当时唯一一个“机器人工程”本科专业。“高考分数我比第一批(重点大学)的分数线高42分,清北复交几乎任何专业都可以选择,但是对我都没有吸引力,我只要学机器人。”16岁的邬学宁当时带着一种对机器人的偏执,走进了大学校园,开始了他梦寐以求的“机器人”生活。

《机械战警》这部电影对邬学宁的影响,一定程度上反映了那时人类对人工智能话题的狂热追捧。二十世纪八十年代,除了《机械战警》外,好莱坞的大荧幕上频繁地出现以“人工智能”角色为主题的科幻电影作品,包括《终结者》《霹雳五号》《银翼杀手》等。

大量的科幻电影开始在人工智能的基础上,探讨人类与机器、生命等的哲学关系,《银翼杀手》更被视为赛博朋克电影题材的开山鼻祖,仿佛在暗示着这种末日似的人机关系,即将在不远的未来变为现实。

这些艺术作品的井喷式出现,多少与八十年代的第二波人工智能发展浪潮有关。

1980年,人工智能领域“符号主义”学派率先取得进展。卡内基梅隆大学为数字设备公司 Digital Equipment Corporation 设计了一款名为XCON的专家系统,这个系统能够依据一组从专门知识中推演出的逻辑规则,在某一特定领域回答或解决问题,“智能”地给出解答。

(图片说明:早期人工智能专家系统 Symbolic 3620;图片来源:Computing History

 

XCON这种以解决某一特定领域知识的人工智能迅速成为商业的宠儿。在1986年以前,它每年能为公司节省下四千万美元的成本。

几乎与此同时,另一大主流学派联结主义也不甘落后。物理学家 John Hopfield 证明了新的神经网络模型,David Rumelhart 则对反向传播算法进行了整理和推广。从仿生学角度出发的联结主义学派也重获新生,将人工智能的研究推到了新高度。

人工智能的两大主流学派在八十年代都展现出了突破性的进展,以及商业化落地潜力。日本、英国、美国等政府也开始加入到这场AI竞赛中,纷纷大手笔拨款。这其中,以日本政府投资8.5亿美元的“第五代计算机项目”最为瞩目,他们当时的目标是,制造出一台“能够与人对话,翻译语言,解释图像,并且像人一样推理的机器”。

(图片说明:以东京大学计算机中心主任的元岡達 TohruMoto-Oka 为代表的日本科学家提出的第五代计算机的逻辑概念图;图片来源:Analysis, Design and Evaluation of Man–Machine Systems 1988 报告截图)

 

然而,春天来得快,去得也快。

八十年代的AI热潮,止于末期的硬件难题。专家系统的商业化奇迹不再,神经网络又因为数据量和计算能力不足而陷入停顿,一时间,学界和业界又进入到一片哀鸿遍野的状态,政府领导的人工智能项目也无一例外,“第五代计算机”项目最后也无疾而终。

对人工智能的失落,也同样出现在了邬学宁身上。来到大学后,他发现自己所憧憬的机器人,不过是在工业流水线上工作的一些“机械臂”,与“酷”完全搭不上关系,更别说拥有智能了。“我觉得这个落差太大了,跟电影完全不一样。”即使过了这么多年,邬学宁谈起刚上大学时的经历,仍难掩失望之情。

但是来都来了,机器人硬件不好玩儿,那不如试试软件。他把空余时间都花在了计算机上,歪打正着地开始了自己的数据科学生涯。

十年曲折

与其说是人工智能,邬学宁认为机器人工程专业更多的是偏向一些自动化的东西,应用领域也主要集中在工厂车间,既没有了电影中那种酷酷的外形,也没有像人一样思考的内在智能。

“我们毕业之后,也没有办法找到人工智能的工作,大部分同学都转行了。只有一位‘专业对口’同学的去了一个摩托车公司的自动化机器人生产线。”

放弃了机器人的幻想后,邬学宁把眼光放到了计算机软件上。他们专业当时有一个计算机视觉实验室,九十年代初,这里主要在尝试利用神经网络处理计算机视觉问题,这是当时与人工智能最接近的前沿领域,他曾整日泡在那里。不过受限于第二次AI寒冬的影响,这件事儿后来也不了了之。

毕业后的十年,用他自己的话说,是迷茫的十年。“我仿佛一直在寻找一个什么东西,寻找一个人生方向。”机器人的梦想清醒后,邬学宁却一直没有找到另一份让他像当年那么心动的事业。

邬学宁曾经尝试过创业。本科毕业后,他凭借计算机技术,与老师合伙创办了一个财务软件公司;后来,又跑到澳洲读书学习管理;2000年初加入SAP,又从技术从头做起;他在SAP考了12个领域专业证书,尝试过开发、集成、供应链等SAP多个业务线的工作......

“现在回过头来看,好像那十年我绕了很大的弯路,与数据科学渐行渐远。但是我自己知道,有句广告词说的好,人生没有白走的路,每一步都算数。”邬学宁觉得,十年间虽然没有太明确的方向,但是他的每一步试错,都将在未来为他带来回报。

(图片说明:人工智能的历史发展曲线,这次的繁荣后会是下一个AI寒冬么?)

 

邬学宁的职业曲线,在这十年间与人工智能历史轨迹有着某种相似。八十年代的AI浪潮破灭后,资本界在之后的十几年间基本没有为人工智能再注入大规模的资金资源,行业的发展一度停滞。虽然以神经网络为代表的联结主义在学界不断取得突破,但是在硬件算力和数据的限制下,人工智能始终无法在业界得到更大的支持。

2008年的时候,一次偶然的项目经历,让邬学宁感觉在探索的迷雾中,仿佛看到了一丝亮光。这是一个帮助澳大利亚某酒类品牌进行市场定价的项目。传统的定价策略大都是参考同类竞品等,依赖运营者的经验。但这一次,邬学宁的团队则基于AC 尼尔森收集的过去三年间,所有市面上的饮料产品的运营大数据,通过模型和算法解决了这一问题,这个案例对他影响非常大。

“第一次看到大数据处理问题的方式,那个数据量非常大,当时的电脑算力训练模型要跑一天一夜才有结果。但是这么复杂的运算,背后是简单完美的数学模型,效果又很神奇。后来知道,哦,这是数据科学范畴的事儿。”邬学宁说到。

这个案例之后,他确信自己花了十年寻觅的方向终于出现了——数据科学。邬学宁现在回忆时说到,当他2008年选择数据科学这条路的时候,生命中之前那些一个个散落的珠子,仿佛终于串成了一条线——数据、编程、业务、管理等等,每一次看似弯路的选择,都在数据科学的框架下逐渐找到了自己的位置。

发现数据科学

“其实08年的时候,国内还没有人说‘数据科学’或者‘大数据’,也没有‘人工智能’的热潮,我虽然确定地选择了这个方向,但是其实并不知道它叫什么,后来舍恩伯格出了一本书,我一看,哦,原来我一直在做的这个事情,叫大数据。”邬学宁说,自己和数据科学的缘分,就这么结下了。

让邬学宁直接体会到数据科学价值的,是一次次基于实际业务的商业创新。

“一次国内某家主要卖生鲜的大型连锁超市来找我们,想通过重新摆放货架,提升销售额。这件事儿要怎么做呢?”邬学宁给DT君举了一个简单的商业应用案例。“其实这是一个标准的关联销售的问题”,邬学宁说,他们要做的,就是找出哪些商品摆在一起会有增益效果。

“比如说买车厘子的用户,我们发现他还喜欢买山东桃。于是就把这两个商品放在一起,带动销售。又或者可口可乐比百事可乐的消费带动力多1块钱,那商店就会多进一些可口可乐相关商品等。”这些结论通过传统的方式是很难获得的,只有通过定量的大数据分析,我们才能知道。这是数据科学的魅力。

当邬学宁去细分行业内做数据科学的业务时,他常常会遇到一些“uh-ha moment”。“我们的数据分析往往都是纯从数据科学的算法模型角度来做的,但是结果一出来,很多行业专家看到,会有一种‘啊哈’的感叹,就像‘原来是这样,我怎么没想到呢?’一样,就非常有趣。”

2016年,AlphaGo与李世乭的世纪大战正式拉开了人工智能第三春的序幕。作为资深围棋爱好者,这一历史性事件,对邬学宁的影响也是巨大的。神经网络、机器学习,邬学宁发现这些自己曾经遇到过的研究方向,一时间成为了全世界最热门的话题。“人工智能”这个词汇时隔二十年,再次回到了自己的视线中。

与市场的狂热不同,再次进入人工智能行业的邬学宁,如今对这个概念有了更多自己的思考。

“人工智能就像一座漂浮的冰山,人们能看到的机器学习等技术是冰山露出的一小部分,可能只占10%,潜藏在海平面以下的90%其实是数学,包括概率、统计、线性代数和图论等等。”他认为,数学和统计学才是人工智能领域的核心竞争力。

对于邬学宁自己来说,数据科学中最吸引他的地方,在于在纷繁复杂的问题背后,指导大数据得出结论的数学方法。“就是你第一眼看到那么多数据,用GPU跑几天几夜进行训练,要解决的实际问题有那么多种可能性,但这个庞大系统的背后,是一种以数学表述的算法,很酷,很强大。”

邬学宁又想起曾经让自己迷恋的机器人,也是那么酷,看起来那么强大,不同的是,这一次,他的兴奋不再只是空想。

AI很强大,但并非无所不能

邬学宁现在在SAP担任创新中心的首席数据科学家,经常对接不同领域的客户,利用人工智能算法进行业务创新。他曾负责过的多个不同行业的AI项目,例如:中医舌诊预测糖尿病风险、北美大型超市销量预测、巴西银行业务量分析、西班牙智慧城市、迪拜购物中心能源管理,钢铁制品的质量预测等等。

除此之外,邬学宁还非常关注数据科学在体育行业的应用。

2018年世界杯正在如火如荼地进行,本届比赛中,VAR(视频助理裁判)的表现大放异彩。这是国际足联首次将 VAR 技术应用到世界杯的舞台上,它的出现大大提升了足球比赛中裁判的准确性。

VAR 技术的核心在于环绕球场布置的33台摄像机,这些摄像机不仅能够记录比赛中每个精彩的瞬间,让裁判的判罚更加公平,而且还充当了数据采集器的角色,能够实时捕捉运动员的跑动、传导、射门等精确数据,让整场足球比赛数字化。之后,球员、教练员等就可以使用这些体育大数据,从而指导自己的比赛和训练。

(图片说明:SAP 针对足球队设计的数据科学管理分析系统Sports One;图片来源:SAP官网)

 

SAP 是体育大数据领域的先行者。从2013年开始,SAP与德国足协DFB合作,推出 Sport One 商业数据分析系统,将数据分析技术应用到足球的日常训练中。除了摄像机外,包括附带芯片的足球、带有传感器的运动服装等等,球场上的所有动作已经能够被数据越来越精确地描绘出来。从初级的位置分析、到细节的点球策略,再到运动员的心理状态,大数据开始越来越多地介入到足球训练中。而且它也确实帮助球队提升了比赛表现。

比如,它曾经帮助德国队赢下了上一届巴西世界杯的冠军。不过,数据科学也仍存在很多局限,算法并不能完美描绘出真实的体育环境。在本届世界杯上,卫冕冠军德国队由于表现欠佳,遭遇小组出局。

体育比赛中,运动的心理因素、战术执行、还有各种偶然因素(受伤、犯规等等),都是目前体育大数据还无法预测和解决的事情。

对于经历过人工智能的寒冬,也曾在数据科学中迷茫寻找方向的邬学宁来说,他对目前人工智能发展的局限性也有着深刻的认识。”经历了符号主义和联结主义后,以AlphaGo为代表的行为主义人工智能学派开始展现出巨大潜力。深度学习的红利正在逐渐耗尽,未来人工智能的发展方向应该是多学科的融合,心理学、脑科学、博弈论甚至量子力学都将对人工智能产生举足轻重的影响, 人工智能的各个门派也将摒弃前嫌,一起携手为人类创造更好的为未来。”邬学宁说到。

在邬学宁看来,不论是数据科学还是人工智能,他现在所做的事情都是以数学为基础的工作,“数学是上帝的语言”,邬学宁认为,这是一个接近“真理”的方向,是他愿意执着追求的事业。机械战警的憧憬停留在了昨天,现在他想要追求的,是已经触手可及的未来。

数据侠门派

邬学宁,SAP硅谷创新中心首席数据科学家,复旦大学人工智能客座讲师,致力于机器学习与人工智能算法研究,在全球零售、金融、制造、医疗、智慧城市等不同行业拥有丰富的利用大数据进行产品与商业模式创新的经验,著有《SAP企业机器学习》(清华大学出版社),曾担任教育部高教委骨干师资培训班大数据课程讲师,openSAP讲师。

 

数据科学50人

数据科学50人”项目是DT财经旗下数据侠计划重点内容产品,与数据科学领域KOL挖掘数据内容的价值。我们从商业数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布,第一财经数据科技及合作伙伴倾力支持。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing004并备注“数据社群”,合作请联系datahero@dtcj.com。

分享这篇文章到