据IDC预测,到2025年全球将拥有175ZB的数据,复合年增长率为61%。在这个数据大爆炸的时代,我们无时无刻不在与数据打交道。在这些数据中,总有那么一些“暗数据”。
暗数据到底是何方神圣?我们应该如何发现它们?如何分析、处理它们?
什么是暗数据?
所谓暗数据,就是从未分析或操作过的典型半结构化或非结构化数据集,其数据源包括服务器日志文件、网站浏览行为或与客户交互和交易有关的地理信息等等。
据最初创造暗数据这个词的Gartner称,暗数据被定义为在日常商业活动中收集、处理和存储信息资产,但通常不会用于其他目的。
暗数据存在的风险
全球企业数据保护和软件定义市场领导厂商Veritas Technologies委托 Vanson Bourne 对 15 个国家及地区的 1,500 名 IT 决策者和数据管理人员开展的《发挥企业数据的力量》调研显示,仍有超过半数(52%)的企业数据未进行分类或标记,全球企业的暗数据不断累积,已成大部分企业主要安全盲点。
它就像宇宙中的暗物质,大量充斥,它可能没有被我们发现或者没有被我们利用,却可能暗藏风险,尤其是在网络安全法、等保2.0等政策法规加持之下,暗数据中可能包括了违规的信息。
企业的IT系统中可能充斥着大量的暗数据,而且可能每天在不断地增加,这些数据杂乱无章,用户不知道其存放在何处,是否存放合规或存在风险?
所以在做数据整合和迁移之前,要先进行暗数据发现。减少企业的数据使用痕迹不仅可以减少数据安全风险,还可以减少违反网络安全法和其他法规的风险。
另外,我们存储的数据可能是敏感的,包含专用信息、商业机密、个人隐私信息、财务信息和医疗记录。在不确定是否保存了敏感信息时,组织倾向于采用宽松的数据安全流程。然而黑客攻击在不断增多,他们往往是第一个发现这些敏感信息的人。这些破坏可能导致高成本的责任和补救行动。
那么,作为数据安全服务的提供商,世平信息是如何帮助企业来挖掘出数据的“阴暗面”的呢?
世平数据安全产品采用多种深度内容识别技术,能够对存储于各类数据库、应用系统、网站、文件系统等海量数据进行快速扫描。
按既定策略对敏感数据进行准确定位和整理,并建立索引,对数据分布进行可视化的展示,实现对敏感数据的发现、定位、梳理及治理功能;
数据分类分级和数据发现对企业来说是一种关键技术,为减少暗数据带来的安全风险,世平信息建议企业利用世平数据安全产品对工作数据进行全面梳理,减少数据泄露风险和昂贵的违规成本,“点亮”企业的暗数据。
来源:freebuf.com 2020-07-03 15:39:23 by: 世平信息SPINFO
请登录后发表评论
注册