feedback

意见

反馈

back-to-up

回到

顶部

用这款可视化系统,动动手指就可解密食品的“前世今生”

数据侠

· 许路

编辑 | 项静   2017-12-11

近年来,公众对食品安全的关注度明显提升,如何建立食品安全监管的长效机制,保证消费者能吃上绿色、新鲜、安全的食品,已成为亿万消费者最为关心的话题。11月22日的线上数据侠实验室·SODA专场中,2017年上海开放数据创新应用大赛(SODA)年度大奖团队——“图灵空间”的队长许路和队员蔡可歆分享了其团队制作的一款可视化食品安全智能监控&舆论监测系统,为我们详细解读了食品溯源网络的构建和智慧舆情的监控。

食品安全溯源是什么?

1997年,欧盟为了应对“疯牛病”问题的挑战,最早提出了食品安全溯源概念,并将其逐步完善为一项食品安全管理制度。这套制度由政府进行推动,覆盖食品生产基地、食品加工企业、食品的终端销售等整个食品产业链条的上下游。一旦食品质量在消费者端出现问题,可以通过食品标签上的溯源码进行联网查询,查出该食品在生产企业的食品产地、具体农户等全流通信息,明确事故方相应的法律责任。

2002年,美国颁布生物恐怖主义行动法案,以保证针对食品的恐怖行径和食源性疾病暴发时的可追溯源头。美国食品药品管理局基于此法案要求食品生产者、加工者、分包商、零售商、进口商保存纸质或者电子的记录,用于追踪和识别食品流通的全过程信息。而在中国,2011年国家发展改革委、工业和信息化部联合发布食品工业十二五规划,提出要建设食品安全溯源体系。2015年通过食品安全法,明确规定要建立食品安全的追溯制度。

上海仪电集团(DT君注:2017年SODA大赛中,食品溯源方面的数据由该公司向“图灵空间”等参赛团队提供)利用科学监测仪器设备以及RFID二维码标签,借助集团IDC数据中心的云计算、云存储、云安全等服务,覆盖产品的生产加工仓、储物流终端、销售检验检测、政府监管、企业管理、查询验证等生命安全周期多个环节,建立了完整的智慧溯源产业链,并与上海市食品安全办公室共同筹办了上海市唯一的市级食品安全信息追溯平台。

上海仪电集团的溯源数据包括以上这张图片上的数据字段,每条记录都包含了食品的一个身份标识类型的供应商以及购买商或顾客信息。通过提取一些关键的信息,进行一个数据库的交易操作,这样就可以近似完整地获取食品的生命周期。

基于食品溯源体系的发展现状、群众舆论、政府的监管诉求及废弃油脂的二次加工等需求,我们设计了一款食品安全监控和舆论监测的可视化产品,整个产品主要由三个部分组成。

食品溯源监控网络,共享源头追溯数据

第一款产品是可视化的食品流通监控,能够了解食品流动信息,实时监控商户的供货商及进货食材,挖掘食品流通中易出问题的环节并进行企业健康度评估。

食品溯源网络能够跟踪原材料的供应、生产、销售等各个环节。当某个环节或节点发生问题时,可通过溯源网络快速追踪到问题食品的源头,进而发现它的波及范围,及时进行销毁处理,控制此类事件的危害。

这款产品的界面如图所示,图的左侧是食品溯源网络图,我们将上海仪电集团提供的溯源数据中每一条记录都连接起来,构成了部分区域的食品流通图(图中标明了流动方向)。右侧是企业信息的展示,其中1、2两个指标为全局指标,后4个指标为针对各个企业单位的数据指标(通过左侧的下拉框可以选择想查看的企业)。第1个指标是被投诉量排名,是通过对12315投诉电话进行汇总后统计了被投诉量排名靠前的企业,可帮助决策者快速定位消费者的抱怨点,降低负面社会影响;第2个指标是企业健康度排名;第3个指标以词云的形式展示了企业的供货商数据;第4个指标是企业健康度变化;第5个指标是企业在大众点评上的评分数据;第6个指标是企业食品的进货品类信息。

其中关于企业的健康度模型会用到食品新闻爬虫数据、工商局投诉数据、食药局抽检数据和食品溯源数据。

首先根据供货商设定基础分,接着对新闻爬虫数据进行基于关键词的情绪分析,给每条新闻打上一个正面或是负面的属性标签。对于抽检数据,也是进行同样的操作。最终模型是把这些数据融合成现行的加权模式,对于正面的信息给予正的参数值,负面的信息给予负的参数值。

新闻&举报信息流检测与跟踪,实现智能舆论管控

点击界面左下角的按钮后,可以切换到第二个产品——智能舆论监控系统,它能够对新闻爬虫或者投诉电话进行主题分类,并计算每个主题的能量值,反映事件的影响力大小。

舆情监测是对于互联网上的公众言论和观点进行监视和预测的行为。食品安全网络舆情有两面性,一方面,食品安全的网络舆情已经成为公众参与的食品安全管理重要平台,众多的网民通过食品网络平台来进行食品安全监督,并发布食品安全事件的信息与自身看法,如果能加以正确的引导,则可以为食品安全风险防控做出巨大贡献。

另一方面,三鹿奶粉、地沟油、染色馒头等众多食品安全事件也刺激着公众的神经,大量谩骂的帖子中夹杂着一些煽动虚假的言论出现在网络中,会对政府的公信力产生负面影响,引发社会恐慌行为,严重危害社会稳定。因此,舆论监管平台能够对于具有潜在风险的舆情进行快速预警,提醒有关部门采取相应措施。

这个产品主要用于实时监控,监测有关食品安全的舆论,并跟踪舆论的变化。监控界面的左上方是投诉电话的动态展示,左下角是新闻舆论的动态展示,这部分主要是基于话题检测与跟踪(TDT)实现的。右侧的大图则展现了各个事件的地理分布,颜色越偏暖,则代表事件能量越大,影响范围越大。

上面说的TDT是指话题监测与跟踪技术,以下是技术实现的流程图。

首先,我们将工商局的投诉电话数据和新闻爬虫数据分为两个部分,一个作为历史数据,一个作为实时数据。对历史数据进行分词,统计关键词的词频作为每条信息的特征向量,再进行聚类分析,并分别计算出每个主题的能量大小。对实时数据集定期进行上述计算,并且与主题库进行匹配,如果是新增的主题,则添加到主题库,否则重新计算该主题的能量。

为了能够反映舆论随时间的动态变化,我们会对长时间没有能量增加的主题进行检能操作,来表明该主题的影响力在逐渐减弱。

可视化油脂流通智能监控,预测回流风险

第三个产品是废弃油脂智能监控,我们可视化了上海3万多家餐饮企业的食用油进货与废弃油脂回收明细数据(数据来源于上海仪电集团的石竹油脂回收情况),并进行废弃油脂回流风险评估。

废弃食用油脂就是广义的地沟油,泛指生活中存在的各类劣质油,包括餐厨废油、猪牛羊肉内脏和皮加工以及提炼后的副产品油。废弃食用油脂会不断地酸败氧化以及分解等等,从而产生中毒性物质,砷就是其中的一种。人一旦食用,就会引起消化不良、头痛头晕、失眠乏力等症状,而其中含有的黄曲霉素、苯并芘两种毒素都是致癌物质。不少商家为了降低经营成本增加利润,会购买价格较低的废弃食用油脂加工而成的油品,这将直接影响到正常食用油的市场,不利于市场经济的健康发展。废弃油脂的监管平台能够发现可能存在的回流风险企业,并且进行相应的预警措施。

为了观察油脂的进货以及回收情况,我们将左图设计为反映油脂的整个生命周期的流动图,绿色箭头是食用油脂的一个进货方向,黄色箭头是废弃油脂的回收方向,通过可视化的油脂在餐饮加工中的流通过程,可帮助监管者清晰地了解油脂的来源与去向。

右侧的四个图中,图1、2是全局数据,图1是废弃油脂回流风险比较高的企业排名,通过这部分数据,监管部门可高效地进行线下走访,避免 “地毯式”地抽查,降低监管成本。图2是废弃油脂交易数据缺失企业的展示,通过这部分数据可以促进相关企业的补齐数据,建立完善的油脂回收监控网络。图3、4是针对单个企业的明细数据展示(通过左上角的下拉框可选择不同企业进行查询),用于了解企业在一定时间内的油脂使用情况。其中图3是企业油脂购买量和回收量在一定时间内的动态展示,图4是油脂交易企业及交易量的展示。

这三个产品分别从原材料、加工流程以及群众反馈三个角度来监控食品产业链的安全性。在理想的情况下,对源头的监控是杜绝食品隐患必须要走的一步,但是考虑到目前食品溯源技术的局限性以及溯源网络的不完整性,我们尚未对上游生产基地进行监控,仅仅做到了生产加工企业到农贸市场再到餐饮企业这三个环节的监控。通过收集数据来完成溯源网络也是将来我们要研究的一步。

最后,我们目前产品的落地方案有三个方向:

  • 为政府提供“食品溯源网络监控” 及“食品安全预警”可视化系统;

  • 为企业提供风险查询接口,可以根据合作企业的健康度,选择合适的合作对象。并指导企业提高自己的健康度;

  • 我们希望为用户提供食品溯源查询接口,以及食品安全问题提醒。

(注: 本文仅为作者观点,不代表DT财经立场。图片均来自作者PPT。)

数据侠门派

本文数据侠许路,是2017年上海开放数据创新应用大赛(SODA)年度大奖团队“图灵空间”队长。团队成员均来自上海速赞信息科技事务所,专研大数据挖掘及数据可视化,有丰富的深度学习系统搭建经验。他们根据SODA提供的数据以及自身的探索,设计了一款食品安全监控和舆论监测的可视化产品,并一举夺冠。队长许路负责产品设计,并参与算法优化;队员周涵负责前端开发,其余队员负责算法设计及数据工作。


加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing002并备注“数据社群”,合作请联系datahero@dtcj.com。

(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)

分享这篇文章到