feedback

意见

反馈

back-to-up

回到

顶部

他们做了这个人工智能平台,只为不辜负你对美食的热爱 | SODA数据侠十强争霸⑥

数据侠

· 吃货俱乐部

程一祥   2016-12-15

离12月22日上海开放数据创新应用大赛(SODA)的决赛只剩一周了!作为战略合作伙伴兼好基友,DT君独家采访了入围决赛的10支队伍。今天DT君携手“吃货俱乐部”的数据侠,跟大家聊一聊食品安全的话题。看看你们以前在吃喝上吐得槽,被数据侠们养成了什么。

人是食品安全最敏感的探测器

俗话说,民以食为天。饮食作为人们日常消费的刚需,无时无刻不伴随着我们的生活。现如今,注水肉、毒大米、三聚氰胺等食品安全公共事件时有发生,严重影响了城市中人们的生活质量。但是城市的信息包罗万象,食品与人们生活的关系又错综复杂。在现代庞大的城市体系中,如何有效、精准地把控食品安全呢?

麻省理工学院可感城市实验室负责人卡洛·拉蒂,在编著《数字化城市》一书中说:手机网络、社交媒体平台等让人类和城市研究的关系变得越来越紧密,这些系统所产生的“数字化排放”和我们的日常生活紧密相关,已经成为一种观察城市和改善生活的宝贵资源。

卡洛·拉蒂教授所说的“数字化排放”,不仅包括系统对物理客观信息的记录,更重要的是,是城市中“人”的主观评价和感受。“人”是城市最敏感的“探测器”,他们的评价是最有价值的原始数据源之一,是敏感的数据探测点。

SODA决赛十强团队“吃货俱乐部”受此启发,在探索城市食品安全的话题时,特别从“人”这个数据行为体终端入手。他们爬取了包括用户点评数据、商户POI数据在内的评价数据,再结合SODA开放的药监局数据、公开的食品经营单位、食品生产企业等数据,构建了一个食品安全监管模型,挖掘大数据中与食品安全相关的蛛丝马迹。

把你对吃的情感数字化

面对庞大的文本信息,吃货俱乐部主要采用了情感分析的方法对数据进行了分析和处理。

作为一种特殊的数据类型,计算机是无法主动识别文本数据的。团队首先使用深度学习的算法将文本数据转化成了数值向量,同时还包括了文字之间的信息。这个转化过程主要通过一个三层的神经网络来完成。在计算词语的频率时,优化采用了Huffman编码,有效降低了计算的复杂度,使大规模的文本分析变得更加高效。

(聚类后的词云图,图片来源:吃货俱乐部)

接下来,他们使用了无监督机器学习的方法对文本进行了词语聚类。然后根据词类的群体特征,主要将这些词分为了环境(地理位置、地铁、闹市区等)、卫生(服务员、盘在、木筷等)、综合(服务、口味等)三大类。以此为基础,他们再对文本进行了情感分析,将不同的情感进行打分。

(图片来源:吃货俱乐部)

不管你是高兴还是难过,兴奋还是消沉,不同的情感在这里完全被数字化了。把人类丰富的情感变成一个个数字,听起来好像有点“不近人情”。但是这些数字化的情感值,是接下来建立评估食品安全风险模型的重要因子。

食品安全平台:好的推荐、坏的问责

以情感分析为基础,再结合天气等其他风险因子,“吃货俱乐部”团队开发了一个食品安全人工智能开放平台。

(图片来源:评安食客)

在这个平台上,系统会根据大数据(包括物理信息和情感分析数据)对城市的餐饮单位进行食品安全风险评估。就像下面这张预警地图一样,当张三家的面馆频繁被评论“环境差”“地面不干净”等信息时,政府相关监管部门就应该“多照顾”一下这家面馆了;当李四的饺子馆被食客们评论多是“绿色环保”“健康”等信息时,就会得到更多的系统推荐,真正让用心做食品的商家得到回报。

(图片来源:吃货俱乐部)

开放大数据不仅是冷冰冰的数字,它打开一扇革新传统产业链条的大门。借助这个食品安全人工智能开放平台,“吃货俱乐部”计划做一个技术驱动型的项目,把食客、政府、商家链接在一起。

利用数据信息化的手段,通过整合数据、演算模型,对食品商家进行风险评估,找到可能发生食品安全问题的风险区域在哪里,为政府相关部门进行预警。

大数据能够帮助我们更好的了解我们所生活的城市,并畅想这些技术如何改善城市生活。“但是如今很多数据还不够开放,有些数据公司只在‘收割数据’,没有发挥大数据潜藏的社会价值。”刘啸表示。

DT君觉得,数据再“大”,也不妨从“小”事做起。数据只是一种工具,例如当我们不再为食品安全问题担忧,大数据才真正发挥了自身的价值所在。

数据侠门派


刘啸,产品经理,负责产品策划,需求分析和用户体验设计等,相信真相就藏在数据之中。

廖鹏,算法工程师,长期从事动态定价与数据预测研究。

颜晖,大数据产品经理,专注于大数据和GIS领域,主要从事Hadoop、Spark、GIS相关的产品及项目的开发和应用。

高涛,软件开发工程师,擅长软件架构设计、GIS系统研发、人机交互设计、数据库建等。

刘珺,城市规划师,擅长顶层设计、战略咨询。

潘婉君,城市规划师,擅长城市设计、做视频、UI

王昊阳,业务主管负责项目实施,运营管理。

如何加入数据侠

“数据侠”栏目网罗全球最IN的大数据侠客,利用人工智能、机器学习以及各种前瞻算法,打造理性而酷炫的数据可视化盛宴。过去,我们用文字,视频,图片传达信息。现在,我们用大数据阐述事实及其背后逻辑趋势。

DT时代超级英雄正在组队!你也想要成为成为数据侠吗?请将你脑洞大开的数据作品,发到数据侠联盟盟主程一祥邮箱吧:chengyixiang@dtcj.com。

欢迎关注12月22日SODA决赛

上海开放数据创新应用大赛(SODA)是一个城市级别数据创新平台,通过众筹政府与企事业单位数据资源,面向社会大众众包创新解决方案,从而解决城市问题,促进数据流动。2015年SODA举办第一届大赛,聚焦城市交通,吸引全球500余创新方案。


2016年SODA的主题为城市安全,覆盖交通、食品、治安等多个领域,来自全球优秀的数据侠们,从不同角度应用大数据,守卫城市安全。

2016年SODA决赛路演将于12月22日(周四)在上海举办,来自上海、武汉、天津、杭州、英国等地的10支决赛队伍将现场路演其城市安全创新解决方案,涉及警力优化、食品安全评价、社会协同治理、环境安全可视化、大规模人群应急响应等现实问题,最终将通过现场评审,角逐出20万元SODA大奖得主。

点击下方获取SODA决赛观众门票。赛前主办方将发送确认信,确定是否报名成功。

12月22日SODA决赛现场观众报名通道

(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)

分享这篇文章到