数据黑产
黑客KK最近接的一单生意,是盗取“企查查”的数据。
企查查是一家企业工商信息查询平台,其核心数据服务器放在云端。
如果直接入侵云端,对抗的是整个云端的安全系统,难度有点高。
KK擅长出奇招,“能走后门,绝不走正门”。
他收拾好电脑,藏到企查查的楼下,利用小工具强行破解公司的WiFi。
进入内网后,所有人的电脑,就如KK的掌中之物。他很快找到了登陆云端服务器的用户名和密码,将200万的公司缓存数据库拖出来。
▲ KK拖出的部分数据库截图
KK将数据出手,挣了几万元。
“这就是我的日常,隔几天干一单,挣几万到几十万不等”,KK最近两年的业务量,开始猛涨,月收入上百万。
KK认为,这和最近火了的征信风控行业有关。
尽管在1988年,国内第一家专业信用评级机构就已成立,但因为那时政府数据还未提倡公开,行业只得龟速发展。
直到2013年,《征信业管理条例》发布,可算给民间征信机构画出了跑道——对于企业征信,采取备案制;对于个人征信,采取牌照制。
目前,已有138家企业征信机构备案通过,而另外8家个人征信机构,正望眼欲穿,等待牌照下发,发令枪响。
中国的征信行业,至此才正式走上历史正轨。
在某种程度上,因为互联网金融的发展,也在倒逼征信行业尽快上道——试想,每家互联网金融公司,都得从无到有的搭建一套风控系统,成本何其高?
事实上,这个领域的玩家,远不止8家个人征信、138家企业征信。
易观高级分析师李子川称,很多所谓大数据公司,其实也在做征信公司的事,“征信和数据公司的界限并不清晰”。
也就是说,这个赛道上,涌入了三股势力:征信公司、大数据公司,以及各个金融公司的风控部门。
对于他们来说,第一步,就是获取数据。“得数据者得天下”,数据似乎拥有点石成金的魔力。
对数据的极度渴求,让黑市无限繁华。
目前,数据产业链分为两个部分,第一部分是黑客,他们负责盗取数据,是前方的入侵者。
而后端,还有一个数据商,他们作为中介,对接客户和黑客。
周晓青就是如此的一个中间商。
两年前,一个客户找到周晓青,要求购买车管所的数据。出价30多万,买400万条。
周晓青通过手下的黑客军团,很快搞到了数据。
除了车牌号码、所有人等基本信息外,连发动机号、车辆识别号、保险到期时间都有。
▲ 周晓青销售的车管所数据截图
此后,客户又多次光顾,合作购买工商、房产信息等。
“对方对我信任后,才透露自己是一家大数据公司”,周晓青称,当购买一些敏感数据时,“就让我从一家皮包公司走账”。
周晓青断断续续和他们做生意,获利几十万。
他也开始关注这家数据公司的新闻,“有意思的是,这家以黑市数据起家的公司,目前已估值几十亿。”
这绝非个案。
周晓青在两年时间内,接到大量的“订单”。
大部分都是数据公司、征信公司,或者是某公司的风控部门。
周晓青称,有几类数据最吃香:工商、身份信息、车辆、房产、电商交易、银行、运营商等。
这几乎是征信行业必备的底层数据。
一般有数据的政府部门和机构,下面都会有一两家代理商,可供需要数据的企业,申请接口。
一旦有人通过接口调取过数据,就会在接口本地缓存下来。
而这部分缓存数据,就是黑客重点进攻目标。目前黑市上交易的,大部分也是缓存数据库。
“第一,是因为代理商的安全意识不强,比较好盗取;第二,如果直接攻陷政府部门数据,有违法风险,没有必要”,周晓青称。
目前,专门靠盗取数据为生的黑客并不多,大概几千人。
而另外一部分数据的外流,来自内鬼。
但数据的中间商却多达几万人,数据的每一次流转,价值上万到百万不等,周晓青简单计算过,“地下黑市,早已形成万亿级别市场”。
2数据污染
地下黑市为何如此繁华?
如果按照正常途径获取数据,价格将极为高昂。
比如,从车管所调取一个人的数据,价格是2到3元,而黑市只需要2毛。
从银联调取数据,一个人是1到2元,黑市只需要1毛。
价格差距10倍不止,也难怪大家趋之若鹜。
尽管从商业逻辑上,有某种必然性,但黑市泥潭深不可测。
“通常黑市数据真假难辨,大家都是掺杂卖”,周晓青甚至自己都干过这种事,他把一份只有100万的银行VIP客户的数据,填充了900万的假数据。
▲ 周晓青造假后的银行数据截图
银行将活期余额超过800万的用户,称为七星级用户;超过1000万的,称为八星级用户。
“填充的,也是银行客户数据,只是级别很低,冒充高星级用户。但购买数据的公司,很难鉴别真伪”,周晓青称,一份黑市价值3万的数据,经过填充后,他卖了20万。
购买者一般事前会要求抽样检测,但数据一次销售,少则几万条,多则上亿,不可能完全鉴别真伪。
这个行业最大的隐患,其实来自“被污染的数据”。
周晓青除了接“盗数据”的活,也会接“放数据”的活。
曾经一家保险公司,将一部分篡改后的数据放出,“故意将一些高净值用户,加入骗保的黑名单,将一些骗保的人,加入高净值用户名单,以搅乱市场上其他竞争对手的视线”。
就像往数据流中不断注入污水,通过层层渗透,干净的数据也会被污染、发臭。
“我的任务,就是把这部分数据销售给其他保险公司,他们甚至愿意出比购买数据更高的价格推广污染数据”,商业战场上,人们似乎喜欢花更多的钱,去“损人不利己”。
黑市上交易的数据,完全没有进行过“脱敏”。
“你很难想象,根据现在的数据,我了解你的程度,可能超过你本人”,在黑产网络中,每一个人都被扒了底裤,毫无隐私可言。
就在两日前,《中华人民共和国网络安全法》通过,里面明确指出,任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。
这也意味着,地下黑产卖的各种数据,未经授权,没有资质,都不可碰。
3征信模型
流窜在黑市中的数据流,鱼龙混杂、臭气熏天,在这个基础上建立的所谓的“大数据征信”或“风控模型”,又有几分可信度?
基础不稳,何以建高楼?
除了数据不干净,数据的同质化,也是征信行业发展缓慢的掣肘。
目前,市面上有三个数据库比较有意思:
一个是支付宝的芝麻信用分,来源于用户的淘宝交易记录和行为数据;
一个是腾讯,来源社交数据。
最后一个是前海征信,拥有平安集团的数据。
除此之外,大部分的征信机构手里的数据大体雷同。
“数据存在大量的噪音,需要进行数据清洗、挖掘,才可以使用”,李子川称,数据并非点石成金,而是在一堆沙子中淘金。
“其实,现在大部分的征信公司,只是数据的集合地,并没有所谓模型”,某互联网金融公司负责人曾和很多征信公司合作,他觉得目前征信行业能提供的价值,极为有限。
互联网金融平台会给征信公司,提供一些借贷用户的信息,对方出一份《个人征信报告》。
报告中,除了一些正常信息外,还有几个维度,比如,是否是公司法人、诉讼信息、各大电商是否购物等。
“给我们就是一堆原始数据,并没有做任何衍生和关联性”,该负责人称,这对于风控起的作用有限。
由于缺少征信模型,征信公司提供的服务只能算差强人意。但打磨一个好的征信模型,又极其艰难。
“模型的验证需要很长时间”,春晓资本高级投资经理张磊表示,“需要把它放到一个5到10年的产品周期中观察。”
比如,房贷的周期是30年,车贷5年,没有跑完整个借贷周期,并不能判断这个模型的准确性。
“验证只是第一步,还需要持续地对模型进行迭代优化。”
这是一个漫长过程,即使是周期比较短的消费金融,也需要重复验证、修正的阶段。
“这类服务节省了客户查询时间,有些进一步整理了各种数据的关联性,不能说没有意义”,易观高级分析师李子川表示,“但是这只是初级阶段,目前征信机构普遍没有提供更复杂产品的能力。”
今年年初,央行征信中心对各个银行进行调研。反馈的意见之一便是,希望在征信报告外,能够提供更深度、增值的产品。
4备案变现
张磊认为,目前民间征信面临三大问题:数据源不充分、处理技术不优秀、产品落地场景不清晰。
因为征信公司提供的价值有限,一些确实没有核心竞争力的公司,开始采取一些“有意思”的方式来变现。
专做企业征信的绿盾征信,其模式就备受诟病。他们在全国招代理人,帮他们推销征信报告。
绿盾征信员工小星透露,目前绿盾已在全国发展了800多位代理,分成方式是“二八”,代理商拿大头,可获得80%的佣金提成。
小星称,目前要成为他们的市级代理,需要给绿盾一次性缴费50万,县级代理,20万。
而对县市级别代理人的唯一要求:在当地有点人脉。“企业资源、政府资源很重要,有企业资源,就可以直接销售,而政府资源,可以指定要这家的征信报告。这才值得合作”。
“一年就回本了”,小星称,一般市级代理一年能卖出几十万的流水。
如果按照800家代理,平均每个人缴纳30万代理费,绿盾征信已获利2亿元以上。
而平均每个代理商销售20万的话,每年的流水也上亿元。
他们所谓的征信报告,主要是6个维度:工商、行业、金融借贷、媒体、企业运营、市场反馈。
售价倒不贵,注册资本小于等于500万的,800元一次;大于500万的,1800元一次。
“但这个报告只针对单次,比如某次的企业合作、政府招投标等,一家企业一年可能需要几十份”,小星称。
然而这样的报告,到底有多少价值?
小星透露,征信报告的6个维度,其实都可以从网上查询到,无非是政府公开信息的汇总。
某征信行业的负责人称,绿盾征信倒是做了一个“不错”的生意,相当于用政府授予的“备案”资质套利。
一家被被处罚多年的制药企业,一度成为绿盾征信示范企业,不仅颁发优秀企业榜样牌匾,还成为绿盾官网的“信用楷模”。
这意味着,一些有“污点”的企业,将绿盾征信作为背书、洗白的途径。
《北京地区企业征信机构监管存在的问题及建议》也指出,个别征信机构夸大宣传,大量在异地发展代理业务,实质是“为了收取代理费,不惜损害相关主体权益”。
实际上,政府部门也注意到这一趋势,今年初,央行要求各家征信机构如实上报自己线下代理情况,尤其是代理机构业务风险情况。
而另一种隐秘的变现方式是——卖备案资质。
目前,专门做这种备案交易的“中间人”已经出现,他们的服务范围包括,帮助企业申请备案,也能帮助购买已有备案资质的公司。
报价是,北京地区征信牌照在100万以上,其他地区在80万左右。
手续费已到如此价位,备案的价格将何其高?
目前,支付牌照市面的售价已高达6亿,征信备案和牌照,是否会重复第三方支付牌照的激情与疯狂?
今年,央行已放慢了企业征信备案的审批速度。
这意味这,属于征信行业的野蛮时代,即将结束。
“它需要沉下心来,”李子川说,他并不希望这个行业走得太快。
作为金融中最核心的征信、风控行业,未来将成为行业的基础砖瓦,恐怕容不下一丝浮躁和怠慢。
|