feedback

意见

反馈

back-to-up

回到

顶部

黑客来了,你的安卓还好么? | DT×NYCDSA

NYCDSA

Melanie Uhde   09-21

每一年,想要窃取财富的黑客以及他们不断更新的黑客手段让网络安全事件数量不断上升。数据侠 Melanie Uhde 分析了从2017到2018年的黑客攻击事件,发现个人往往是黑客攻击的目标,而且安卓系统以及医疗健康行业是最受黑客“青睐”的领域。

这些年来,随着技术手段的不断提升,想要窃取财富的黑客以及他们不断更新的黑客手段也让网络安全事件数量持续飙涨。

有研究指出,数据泄露事件造成的损失平均在386万美元,而且有30%的几率会在未来2年再次发生。其中,监管严格的健康医疗和金融领域的损失最为惨重,平均损失分别在人均408美元和206美元,远高于整体水平(148美元)。

了解网络安全的现状,识别造成安全隐患的可预测的因素,对于保护个人及公司的隐私数据和信息至关重要。所以,我爬取了一些黑客攻击数据,希望利用数据科学的方法做一些有价值的分析。

我首先使用爬虫先爬取了hackmageddon.com网站上列出的网络攻击事件,发现式数据分析来找出其中的趋势。然后我使用爬虫爬取了 glassdoor.com ,收集受到网络攻击事件影响的健康医疗领域公司的信息,最后进行数据分析和数据可视化。

我使用编程语言是Python,调用了numpy,pandas,seaborn,scrapy,matplotlib,词云,神经语言等程序包。

 

在网络攻击事件方面,我收集了日期,攻击目标,目标等级,国家,攻击情况简介,以及攻击类型。公司信息方面,我收集了公司的营收情况、员工数量。在分析时我使用了数据可视化以及词云等方法来更直观展现我发现的规律。

首先我们先看一下网络攻击的现状。

与去年相比,今年每个月的网络攻击数量都有上升。

而在攻击目标方面,个人是最多的攻击对象。2017年有61起个人攻击事件,今年已经又169起。紧随其后的是健康医疗领域和金融领域的公司。其他像是科学、交通或者服务业等受影响较小。

下面的饼图显示了攻击的类型。超过一半的针对个人的攻击属于恶意软件类型,其次是劫持以及针对性的攻击。不过,尽管位列最令人担心的前5类攻击,但瞄准转账行为进行攻击以窃取信用卡信息的恶意软件攻击并不占主导。其他还包括恶意广告、漏洞攻击以及恶意脚本。

为了进一步了解针对个人的攻击的本质,我对这些攻击的描述文字进行处理和数据清洗后以词云形式呈现。出现较频繁的词是百万、事件、安卓和应用(app)。说明一些攻击常常在安卓用户下载app时出现,并同时影响数百万人。勒索软件的频率也在提高,这种攻击会远程锁住你手机的部分功能,让你无法获取自己的重要信息。

 除了安卓系统外,医疗健康行业也是黑客最喜欢的攻击对象。

下图是医疗健康行业的网络攻击事件词云。与针对个人的明显不同。网络钓鱼、电子邮件帐户以及员工成为最常出现的词。说明在针对医疗健康机构的攻击中,黑客往往通过钓鱼软件攻破员工的电邮账号进而获取整个系统的权限,之后窃取信息。

 

这让我思考一个问题,机构的员工数是否与它受攻击数成正比,因为越多的员工可能安全隐患也越大。

我将受影响的机构分成医院、私人公司(大多数是某些专症诊所)以及非营利组织(比如大的医院集团和医疗保险公司)三类。

 (图片说明:从上到下分别是非营利组织、私人公司和医院类)

非营利组织类别中,网络攻击数随组织规模增长而增多。大约30%的攻击发生在拥有超过1万雇员的机构。而比较意外的是,私人公司类别中,呈现了相反的趋势。雇员增长而攻击数下降。人数在50人以下的公司受到的攻击数最多,说明他们在网络安全方面缺乏投入。而医院类别方面,没有明显的趋势。超过一半的攻击针对的是1000到5000人的医院,也许这是因为这样的规模是所有医院的平均水平,而更大或更小规模的医院已经被我归入其他两个类别中了。医院看起来最容易受到攻击。

最后,总结一下我比较重要的发现:

  • 2018年每月的网络攻击事件都比上一年有所增长
  • 恶意软件和劫持类的攻击行为的对象多为个人
  • 黑客往往同时瞄准大批用户,以安卓用户为主
  • 受影响最大的产业是医疗健康领域
  • 黑客用邮件方式攻击雇员的账户
  • 医院陈旧的IT系统以及众多的雇员让他们在攻击面前很脆弱
  • 小的私人机构由于缺少高级网络安全团队儿更加脆弱

网络攻击威胁着每一个连上互联网的个人和公司。如果你是使用安卓的用户,下载app时小心一点可以有效防范攻击。对于医院等组织,我们建议应该提高网络安全培训,提高大家的意识。勒索软件正成为黑客们常用的手段,这需要所有行业加大在网络安全领域的投入来做出应对。

无监督机器学习可以用来将各类公司分成风险水平不同的多个种类,从而帮助监测攻击并且根据公司的不同特点来更好地预防攻击。未来深度学习将是识别未知来源网络攻击的另一个强力武器。它不仅识别攻击,而且可以在下一次攻击前提前做出应对。

(本文编译自科技博客 Who is next? Analysis of cyber attacks between 2017 and 2018,仅代表作者观点。)

数据侠门派

Melanie Uhde 是一名免疫学博士。她拥有机器学习的许多实践经验。她在哥伦比亚大学医学中心领导的团队使用机器学习技术来寻找各种新的治疗方法。她深知大数据和机器学习算法在医疗领域的潜力,因此加入 NYCDSA 学习相关知识,希望今后能将医学领域的专业知识与数据科学方面的技能相结合,解决更多问题。

关于DT×NYCDSA

DT财经与纽约数据科学学院是战略合作伙伴。DT×NYCDSA 系合作开设的系列专栏。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing003并备注“数据社群”,合作请联系datahero@dtcj.com。

 

 

分享这篇文章到