找回密码
 立即注册
搜索
查看: 810|回复: 0
打印 上一主题 下一主题
收起左侧

[探索频道] 巧达科技被端,揭露大数据行业的两大顽疾

[复制链接]

 成长值: 24450

绿铜v3_04绿银v3_04灰金v1_05紫铜v1_05绿金v1_01紫铜v3_01

跳转到指定楼层
楼主
 楼主| 发表于 2019-4-10 16:07 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
一家名叫巧达科技的AI大数据公司火了,不是因为融资,也不是因为它吸引了什么大牛,而是因为它被警方一锅端了。
“大约是两三周前,警察突然进来,把所有人都带走了,甚至连来面试的人都带走了。一两百号人,一溜警车,全给带走了。”财新网探访巧达科技办公所在地时,大楼保安与前台如此说。据燃财经援引巧达科技前员工表示,直至3月25日,除了HR等非核心成员被放回家以外,改公司核心高管依然失联中。
巧达科技到底所犯何事、如何处罚等,仍需静待警方公布调查结果。但外界普遍认为「违规收集并利用个人简历信息」可能是此次事件的导火索。
据了解,巧达科技成立于2014年7月,号称拥有中国最大的简历数据库:通过2.2亿+有简历的自然人、10亿+通讯录、100亿+用户识别ID组合和1000亿+用户综合数据,计算出了8亿+用户数据。巧达科技曾对外披露,截至2015年6月30日,收入自然人的简历超过1.6亿人,总计超过18亿份,超过25亿行为轨迹。2017年1月完成B轮融资,估值2亿美元,投资者包括李开复创新工场、百度风投齐玉杰、中信产业基金、人工智能产业基金等等。
疑似违规收集数据
如此多的数据,巧达科技是怎么得到的呢?外界普遍认为有如下几种方法:
1、按照巧达科技自己的说法,其通过向HR或猎头提供一系列免费的招聘工具,获得数以亿计的共享简历。蓝洞新消费也对其中具体的原理进行过专门的分析:HR招人任务繁重,巧达科技等公司开发的智能招聘SaaS产品可以帮助HR提高效率,登录一个平台即可管理所有渠道的简历信息。由于目前很多招聘网站的商业模式都包括付费下载简历,花几万元可以下载几千份简历,可以查看该招聘网站的无限量个人简历。因此,当HR将多个招聘平台的“付费账号”托管给SaaS系统平台之后,该平台便共享了这些简历,当SaaS平台累计的HR客户过万数时,该平台沉淀的简历则可以过亿。那么,问题来了,HR或猎头对共享简历是否知情?而且他们是否有权共享用户的简历?
2、另外,外界还猜测巧达科技利用爬虫技术搜集简历。从技术层面来看,利用爬虫确实可以在各大招聘网站海量下载简历。有微信好友曾告诉墨客星球他手上就有几万份智联的简历,都是之前没事爬着玩的。爬虫这么容易?难道各大网站的反爬虫技术都是瞎了吗?“在花高价买的高权shell面前,任何防御都是纸老虎。”该好友如此表示。
因此,聚光灯背后,其实反映出来的是用户隐私保护、爬虫危机等行业问题。
1、其实很早之前就有网友指出违规获取用户个人隐私信息。但巧达科技爱伙伴产品负责人刘博表示,在民法的侵权责任法中界定个人信息分为个人敏感信息和个人一般信息。隐私部分包含在个人敏感信息中,分如下几类:个人私生活情况、婚姻家庭情况、财产状况、个人身体隐蔽部位特征。除此之外的部分,都归属个人一般信息。 刘博表示,简历中不存在法理规定的个人隐私信息,巧达科技只分析简历信息中的个人教育经历和个人求职经历两部分,是属于“个人可向公众开放并知悉”的信息。而简历中的照片、联系方式、身份证等不在乔大招的获取范围内,解析前会做脱敏处理。
然而,据某媒体报道,巧达科技提供的服务还包括根据客户提供的某用户手机号,与自有的简历库进行匹配,补全这个手机号的其他自然人信息,包括年龄、性别、行业、职业、户籍、收入、教育经历、工作经历、关系链等。
根据工信部《信息安全技术公共及商用服务信息系统个人信息保护指南》,个人一般信息可以建立在默许同意的基础上, 敏感信息则建立在明示同意的基础上,收集和利用必须获得个人信息主体明确授权。据媒体报道,根据《信息安全技术个人信息安全规范》定义的“个人敏感信息”以及“个人一般信息”标准,简历中有部分数据已然属于“个人敏感信息”。
另外,根据《信息安全技术个人信息安全规范》,当直接收集用户个人信息时,需要有明确个人授权;而当间接收取个人信息,应了解个人信息提供方已获得的个人信息处理的授权同意范围,包括使用目的,个人信息主体是否授权同意转让、共享、公开披露等。如本组织开展业务需进行的个人信息处理活动超出该授权同意范围,应在获取个人信息后的合理期限内或处理个人信息前,征得个人信息主体的明示同意。
总之,通过HR获取用户简历数据或许是不正当的。
2、关于爬虫危机,大数据时代,爬虫已经成为获取大数据最普遍的方法,在如今这个将大数据神化为黄金和石油的年代,企业间对大数据的争夺逐渐演变成了爬虫危机。
2017年,hiQ Labs爬取LinkedIn用户资料中的公开可见信息,为企业了解是否雇员有意向离职提供帮助,但LinkedIn认为该行为违反反爬取软件禁令,要求hiQ Labs停止这类爬取行为。随后,hiQ Labs不服并起诉LinkedIn。虽然最终法院给出了有利于hiQ Labs的判决,但对如何合理利用爬虫技术大社会讨论却一直没有休止。
技术作恶
实际上,除了在简历的获取上可能存在问题以外,在简历数据的使用上,巧达科技的做法也很不得人心。
除了上面所说的利用简历数据帮助客户补全用户画像的服务以外,巧达科技旗下“爱伙伴”项目会时刻“监视”公司员工在招聘网站上刷简历等行为,得知哪个员工有跳槽意向,然后把这个信息卖给企业HR,然后企业HR会去找员工约谈。这令众多求职者深恶痛绝,不少求职者感觉被侵犯,却无从反抗。有行业从业者告诉墨客星球,巧达科技通过该服务卖了很多钱,但在行业内早就臭名昭著了。
时候,巧达科技的投资方纷纷澄清与该公司的关系。
创新工场表示,创新工场为巧达科技财务投资人,未曾参与公司的任何运营。同时,巧达早已搬离创新工场,公司独立运营。
百度风投方面对21世纪经济报道回应称,巧达科技并非百度风投的投资组合。该公司可能为齐玉杰早年所投,但齐本人目前在休假,并不方便联系。
总的来说,该事件说明了大数据的强大价值,但价值虽大,若不好好利用,被人拿去作恶,大数据对人们的伤害也将是巨大的。大数据行业仍处于发展的早期,一颗老鼠屎就能坏了整个行业,为此,为行业树立更加明确的法律法规将势在必行。当然,对于企业而言,要记住一点:别犯法,莫作恶。否则,众叛亲离是小,被判坐牢才得不偿失。

插件设计:zasq.net
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| ( Q群816270601 )

GMT+8, 2024-11-23 23:37 , Processed in 1.881632 second(s), 46 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表