大数据行业的“爬虫”涉刑问题研究一、何为爬虫网络爬虫,又称为网页蜘蛛、网络机器人,是一种按照一定的规则,自动地抓取网络信息的程序或者脚本。在大数据风控行业中,以网络爬虫获取信息数据的做法最为盛行。从本质上看,“爬虫”就是一种“技术工具”。一般而言,技术工具本身并无是非对错,是否违法犯罪,关键在于使用人如何利用该“爬虫”技术。关于爬虫的分类,虽然有人将其分为公开爬虫和授权爬虫,但从实际案例来看,这种分类可能并不够全面。因为爬虫所爬取的信息,才是判断其合法性的关键。这些信息可以分为公开信息和非公开信息两类:公开信息:如公开发布的法律文件、司法判例、工商信息、用户评论信息等。非公开信息:如某人在某网站注册的个人电话号码、邮箱、身份证号码等信息,这些信息网站不应也不能公开。如果爬虫非法抓取了该类信息,便属于爬取非公开信息。二、爬虫所涉违法犯罪问题不论是爬取公开信息,还是爬取非公开信息,都有可能构成违法犯罪。爬虫主要涉及的违法犯罪问题如下:非法侵入计算机信息系统罪如果爬虫非法侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统,可能构成“非法侵入计算机信息系统罪”。这种行为严重危害了国家安全和利益,是法律严厉打击的对象。非法获取计算机信息系统数据罪爬虫规避网站经营者设置的反爬虫措施,非法获取信息,可能涉嫌“非法获取计算机信息系统数据罪”。这种行为侵犯了网站经营者的合法权益,破坏了网络秩序。破坏计算机信息系统罪如果爬虫干扰被爬网站的正常运营,可能构成“破坏计算机信息系统罪”。这种行为会导致网站无法正常运行,给网站经营者带来经济损失,同时也会影响用户的正常使用。提供侵入、非法控制计算机信息系统程序、工具罪如果是提供专门用于侵入、非法控制计算机信息系统的爬虫,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供爬虫,可构成“提供侵入、非法控制计算机信息系统程序、工具罪”。这种行为助长了网络犯罪的气焰,是法律严厉打击的对象。不正当竞争、虚假宣传、虚假广告等违法犯罪行为虽然是爬取公开信息,但利用爬虫程序非法从同类企业网站获取公开信息(如评论信息),并用于自己网站进行宣传的,可能构成不正当竞争、虚假宣传、虚假广告等违法犯罪行为。这种行为破坏了市场竞争秩序,损害了消费者的合法权益。非法获取公民个人信息罪对于爬取非公开信息的(如公民的姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等个人信息),有可能构成非法获取公民个人信息的违法、犯罪。这种行为严重侵犯了公民的隐私权和个人信息安全。非法提供公民个人信息罪如将该非法获取的公民信息无偿提供或出售给他人,又可能构成非法提供公民个人信息犯罪。这种行为进一步加剧了公民个人信息的泄露风险,给社会带来了极大的安全隐患。综上所述,大数据行业的“爬虫”技术虽然具有强大的信息获取能力,但如果被不法分子滥用,就会构成严重的违法犯罪行为。因此,我们必须加强对爬虫技术的监管和打击力度,确保其在合法、合规的范围内使用。同时,我们也应该提高公众的网络安全意识,加强个人信息保护,共同维护一个安全、有序的网络环境。



































