
据外媒(opensources.info)报道,机器学习的进步让人们能够以更方便的方式来训练安全系统以应对不断变化的安全形势。
近段时间,机器学习和人工智能受到越来越多的关注。新技术带来的诸多可能让人们兴奋不已。
一个事物一旦被贴上机器学习的标签,再想撕下来就难了。就像现在几乎所有基于网络发生的事情都能跟“云计算”扯上关系一样,未来“人工智能”这个词可能会跟“电脑”形影不离。
“大热之下也有些夸张的成分,”普华永道(PricewaterhouseCoopers)分析师Anand Rao说。“人们开始讨论AI变得超级聪明进而取代人类等等。”
在使用计算机的过程中,判断新下载的文件或软件是否含有恶意代码是最常见的安全情形。通常的识别方法是将程序的数字签名与已知的恶意软件进行对比,以辨别安全与否。
这种基本的识别手段有其缺点:它依赖于恶意软件数字特征库的不断随时更新来保证识别能力。一旦更新落后或识别不及时,后果令人堪忧。一些特征不明显的恶意软件经常可以轻易蒙混过关。
一家名为Deep Instinct的新创企试图使用深度学习技术来弥补此中不足。公司团队利用近10亿个已知恶意软件样本对其深度学习系统进行训练。
公司CTO Eli David 说:“深度学习改变了很多领域。计算机视觉每年增长20%~30%,此外还有语音识别。于是我们想为什么深度学习不能应用到网络安全领域呢?”

他认为基于概率大机器学习系统十分有限,尽管非常多的因素可以被识别和评估,与此同时那些太过微小的因子遭到忽略。
“如此你白白丢掉了绝大一部分数据。”他说。
作为纠正,Deep Instinct 实验室中无一遗漏地使用目前已知的所有恶意软件样本来训练其深度学习系统。整个过程耗时一整天。而且使用到高性能图形处理器来进行对数据的分析。
训练产生的系统大小约有一千兆字节,随后公司将至精简至二十兆字节。如此该系统可以被安装到任何端点设备上,包括移动设备。即使在最慢的机器上,它也能在几毫秒内完成对未知程序安全性的识别。


