位置:编程技术网 > 区块链 > 正文 >

爬虫原罪:你的数据在被谁消费

2019年12月10日 09:39来源:未知手机版

任泽平 2018房地产,长春农博会时间,vr手机

整个消费金融行业猝不及防地迎来了“去爬虫”时代,尤其是现金贷受影响最大。数据缺失,迫使整个消费金融行业进行风控策略的大调整。

此次爬虫风波发生后,行业内讨论时普遍认为“技术无罪”,但是实际上在法律中和现实操作中,这句话应该重新理解。爬虫合规与违规的边界到底应该怎么设置?今后数据爬虫到底能不能用?

数据信用行业正在走向规范化,此番数据爬虫整治行动也只是开端,未来行业监管趋于常态化。依靠数据得以安身立命的数据服务商们未来的路又将何去何从?

针对被查原因、发展现状、业务影响、转型方向等,商学院记者分别向同盾科技、魔蝎科技、聚信立、新颜科技等方面发去采访函,截至发稿,尚未获得回复。

同盾科技子公司曾参与“套路贷”

11月15日下午,同盾科技发表公开声明称,其旗下独立运营的子公司杭州信川科技及有关人员正在积极配合警方调查曾经服务的某第三方单位。此前同盾科技曾公开表示,信川科技自2018年开始已经逐步调整业务,目前已全部停止相关服务。

事实上,今年9月中旬以来,杭州、上海多家数据公司接连被查,包括魔蝎科技、聚信立、同盾科技等,引起行业震荡。当时,多位业内人士曾告诉记者,被查原因很可能与违规使用爬虫数据以及暴力催收有关。

11月14日,公安部在发布会上通报,此次“净网2019”专项行动对“套路贷”犯罪开展了全链条式打击,系列行动的起点是今年在黑龙江省七台河市侦破的“7·30”套路贷专案。

以此案为线索,9月1日以来,公安部网络安全保卫局在全国铲除了一批帮助犯罪的技术服务商、数据支撑服务商、支付服务商,共打掉团伙147个,抓获嫌疑人1531名。

大数据风控釜底抽薪,“数据荒”时代如何破?

在数据市场,由于爬虫停止运转,数据的价格正在被急剧抬升。这使得风控成本迅速上升,众多放贷机构对此并没有充分的准备,由于替代方案的不成熟以及对新风控措施的观望,部分贷款产品的坏账率飙升。

“爬虫,是整个大数据风控行业的灵魂,是大数据风控的底层基石。要做大数据风控,先要有丰富的数据,然后才能运用这些数据建立模型,进行信用评价。”某第三方银行资深风控人士向记者指出,大多数大数据风控公司本身并没有那么多数据。因为数据是从业务当中来的,但是有大量数据源的机构实际上并不多,多数大数据风控公司的数据是靠爬虫爬取。爬虫服务暂停,消费金融行业的公司都多少受到影响,其中现金贷是重灾区,受影响最大的是运营商数据和电商数据两种数据。该资深风控人士告诉记者,市场上除了极少数非常头部的公司的产品之外,大部分现金贷类的产品都受到了影响,同时也包括部分非现金贷场景。据他估计,无场景现金贷大约占网贷平台资产的60%~70%。据他介绍,网贷平台没有了爬虫所提供的数据,能找到的替代数据有限,联合建模获取的数据作用并不太理想。因此,许多产品的坏账率飙升。

运营商数据和电商数据的缺失,使得大多数消费金融类公司都不得不调整风控方案。

首先被想到的替代方案是自建爬虫团队。

不过,据上述资深风控人士介绍,这样做的公司目前并不多。原因是从无到有自建爬虫团队的成本比较高,而且要自建爬虫团队,关键是要挖到合适的人,这方面的人才尚有缺口。更麻烦的是,自建爬虫团队恐非长久之计。他说,如果自建爬虫团队,还是涉及到爬取数据违规、侵犯个人隐私的问题,问题主要是在“强制授权”上,而不在“雇佣第三方爬”还是“自建团队爬”上。

自建爬虫团队的想法被放弃之后,能否接入别的数据源,成为首先被考虑的方向。

据了解,国庆节前后,许多有现金贷产品的公司在密切接触这次受影响不大的机构,如银行、大互联网旗下金融科技公司、头部P2P平台、消费金融公司等。据上述风控人士介绍,机构之间的相互对接,都开始“看身份”。他说:“一方面,一些有数据源的机构只愿意与持牌金融机构合作;一方面,持牌金融机构,也要看合作方是否获得了合法的数据源授权。”

本文地址:http://www.reviewcode.cn/qukuailian/101686.html 转载请注明出处!

今日热点资讯