流量分析在语义匹配系统中的数据采样方法

ndlp用了那些技术

NDLP(网络数据防泄漏系统)应用的技术主要包括深度内容识别技术、网络监控技术、网络保护技术、自定义策略检测技术、系统自动检测技术、内容指纹匹配技术、计算机视觉技术、高级语义分析技术、网络抓包技术以及多种检测算法。具体如下:深度内容识别技术:该技术可对传输中、存储中、使用中的数据进行全面检测,通过扫描电脑上的数据,精准发现敏感信息以及不当存储情况,为数据安全提供基础保障。网络监控技术:能够监控所有HTTP、SMTP、FTP等非加密网络链接,深入分析应用协议内容,及时发现并记录可能违反数据安全策略的数据通信,有效防止数据通过这些渠道泄露。网络保护技术:针对HTTP和HTTPS协议的网络数据流量,实时进行内容恢复和扫描,实现实时审计和阻断,确保网络数据在传输过程中的安全性。自定义策略检测技术:包含关键字检测和正则表达式检测,用户可根据自身需求自定义检测策略,提高检测的针对性和灵活性。系统自动检测技术:涵盖数据字典检测、数据标识符检测、脚本检测,系统可自动对数据进行检测,提高检测效率和准确性。内容指纹匹配技术:文件指纹匹配(IDM)可对数据内容进行模糊匹配,主要用于检测非结构化储存的文档与样本文档的相似度;数据内容匹配(EDM)可对结构化数据进行精确匹配,用于匹配待检测数据是否命中结构化数据某行或某列。计算机视觉技术:基于OCR的图片识别先对图片进行处理使文字水平排版,再进行识别;图章识别基于机器学习 + 神经网络的标志识别,可模糊匹配出圆形图章。高级语义分析技术:对文本进行基本处理,通过中文分词、语言模型、特征权重、核心词、关键词提取等一系列方法,利用深度神经网络技术分析语义、自动聚类。网络抓包技术:通过独有的网络抓包技术、数据深度分析、协议内容解析、文件内容还原,对单位内部用户邮件客户端、浏览器、FTP客户端、网络共享等网络途径外发或上传的文件进行解析和文档提取,识别敏感数据。多种检测算法:支持基于关键字检测、正则表达式检测、OCR图文解析、智能分词算法等,对网络传输的数据进行泄露检测。


nginx