起底電商平臺背後爬蟲產業鏈:淘寶12億條數據泄露

一年一度618電商盛宴,在買買買的同時,“如何省錢”成爲大家最關心的問題。比價、返利、優惠券都是消費者在網購時的剛需。

但在這些“優惠”背後已產生灰色地帶,爬蟲由於成本和門檻較低,成爲黑產常用的技術手段。

返利平臺非法爬蟲獲取淘寶用戶個人數據

近日,河南省一則裁判文書揭開了部分淘寶返利平臺的黑幕

不法分子爬取淘寶客戶個人信息近12億條,用於自身“淘寶客”業務,在微信羣中進行淘寶商品的推廣,從而獲得淘寶網佣金商家服務費

裁判文書顯示,2019年以來,被告人逯某受僱於被告人黎某,逯某在其家中利用自己開發的爬蟲軟件,通過淘寶網頁接口爬取淘寶客戶的信息,並將其中淘寶客戶的手機號碼提供給黎某開設的瀏陽泰創網絡科技有限公司(下稱“瀏陽泰創”)用於經營活動,該公司從2019年8月至2020年7月非法獲利爲395.26萬元。

司法鑑定,逯某通過其開發的軟件爬取淘寶客戶數字ID、淘寶暱稱、手機號碼等淘寶客戶信息共計11.8億條,逯某將其爬取信息中的淘寶客戶手機號碼通過微信文件的形式發送給黎某使用,共計1971.26萬條。

2020年8月,淘寶(中國)軟件有限公司報警稱,2020年7月6日至13日之間,有黑產通過mtop訂單評價接口繞過平臺風控批量爬取加密數據,爬取字段量巨大,7月6日至13日之間平均每天爬取數量500萬,爬取內容包括買家暱稱、用戶評價內容、暱稱等敏感字段。經淘寶網站排查,逯某有重大作案嫌疑,方案發。

證人證言證實,瀏陽泰創主要業務是淘寶客,在微信羣中進行淘寶商品推廣,從而獲得淘寶的佣金和商家服務費。2019年起,逯某利用自寫軟件爬取淘寶客戶信息後,不定時將公司需要的淘寶客戶手機號碼發送給黎某,黎某在收到手機號碼後將信息數據導入“微信加人”軟件,加微信好友成功後,由公司員工負責發送廣告鏈接,用戶在廣告羣中購買商品,公司從中獲得佣金。

多位證人對於微信羣總數的描述不一,根據其描述,最多可達1100個羣,每個羣人數在90人到200人之間不等,按此粗略計算,使用瀏陽泰創建立返利平臺的用戶人數至少10萬人。瀏陽泰創平臺在一年間獲得經營額超過395萬元,違法所得超過34萬元。

返利平臺“惠”了誰

目前國內返利平臺衆多,從不同電商平臺來看,阿里巴巴自營“阿里媽媽”平臺、京東自營“京東聯盟”平臺等都是電商自營的大數據營銷平臺;從業務通道來看,涉及網頁端、APP客戶端、微博、微信等多種渠道。

記者下載體驗了阿里巴巴自營平臺“阿里媽媽”的返利模式。用戶可以在淘寶聯盟註冊成爲“淘寶客”,複製想要推廣的商品鏈接,可以從淘寶聯盟後臺獲取專屬推廣鏈接,任何買家複製該推廣鏈接進入店鋪完成購買後,推廣的用戶可以獲得賣家按一定比例支付的佣金。

簡單來說,返利平臺實際上是營銷推廣平臺,電商平臺的商家從銷售額中按比例支付佣金,其中一部分以優惠券鏈接的方式給到消費者價格優惠,另一部分支付給返利平臺或個人作爲營銷推廣費用。在消費者自認爲從返利平臺獲得優惠券得到實惠的同時,返利平臺也通過賺取商家分傭獲利,賺得鉢滿盆滿

一些頭部的返利平臺已進軍資本市場,例如今年1月,“淘粉吧”也進入上市輔導階段,擬在A股掛牌上市,5月,返利網數字科技有限公司(SH.600228)借殼昌九生化上市。

電商平臺爬蟲拉鋸戰

爬蟲對電商平臺的威脅由來已久。

據記者瞭解,目前針對電商平臺的爬蟲行爲主要有商品詳情頁爬蟲、用戶隱私數據爬蟲、交易數據爬蟲等三大類,其中商品詳情頁爬蟲是許多比價平臺的慣用技術手段

業內人士指出,目前電商平臺最敏感的爬蟲行爲就是對商品詳情頁的爬蟲,尤其是價格數據,一方面友商之間始終在採取各種手段互相爬取數據,另一方面有黑產利用各平臺之間差價牟利

維擇科技系統架構師趙曉彪告訴記者,一些比價平臺通過爬取電商平臺商品詳情頁面數據,爲網站平臺引流,再通過流量變現獲利,這並非長久之計。在未來電商平臺反爬蟲技術逐漸完善後,將面臨技術與合規方面的壓力。

據悉,近兩年來,針對數據安全保護,國內一些大廠已成立了團隊研究相關問題,具體包括數據存儲安全、計算安全、傳輸安全等三個方面。針對電商平臺的爬蟲與反爬蟲技術處於相互演進、相互促進的長期拉鋸階段。

目前電商平臺已採取措施,通過限制訪問次數、前端頁面展示加密、提高人機識別技術等攔截識別黑產,提高黑產作惡成本。

值得關注的是,近期全國各地加快數據立法,例如,在此前深圳發佈的數據條例徵求意見稿中,明確了數據公平競爭原則。

這意味着未來電商平臺數據爬蟲將面臨更高的違法成本。

據徵求意見稿規定市場主體不得使用非法手段破壞其他市場主體所採取的保護數據的技術措施;不得違反行業慣例收集或者利用其他市場主體數據;不得利用非法收集的他人數據提供替代性產品或者服務;不得未經其他市場主體或者消費者同意,將其他市場主體的數據直接進行商業利用;不得采取法律、法規規定禁止侵害其他市場主體或者消費者合法權益的其他行爲。