金融科技依賴用戶數據,易引發隱私問題,多方安全計算可以保證用戶隱私安全,數據不出本地私域。
原文標題:《用演算法定義邊界,安全多方計算重構金融大數據風控模式 | 算力隱私專欄》
撰文:郭嘉,富數科技高級總監,負責隱私計算的解決方案與業務落地
編輯:生煎
在金融科技的發展道路上,大數據金融與隱私保護看來相悖,但是若不能適配逐漸升級的隱私保護,金融科技就無法走的更遠。2019 年下半年,監管部門密集出台了《數據安全管理辦法》、《App 違法違規收集使用個人信息行為認定方法》、《個人金融信息(數據)保護試行辦法》等多項徵求意見稿及草案。
在業內人士看來,從法律層面加強金融數據的保護,是保證用戶信息安全、維護用戶權益和金融穩定的重要課題,也是金融行業治理整頓的重要一環。
涉及國內多家銀行數百萬條客戶數據資料,在暗網被標「白菜價」兜售的消息廣為流傳。引起監管及業內高度重視的同時,也再次拉緊金融消費者敏感的神經。
在去年的突擊拉網行動中,一個近幾年最為暴利的行業走向了滅亡,這就是現金貸。信貸本沒有錯,錯在這個發展過程中變味了,變得像過街老鼠。信貸的核心是風控與催收,風控的命門是數據。信貸行業如何給自己洗心革面,這需要從信貸風控說起。
風控的本質是數據
支撐風控的大數據市場發生了變化,這個變化似乎是不可逆的,所謂風雨之後見彩虹。過去很長時間,放貸的場景是這樣子的(這也是美國流入中國的所謂的 Fintech 模式、零售模式、小貸模式、發薪貸模式……)。
某放貸機構在新聞瀏覽器投放一支廣告——「……只要身份證就能領取 8000 元急用金……」,小明因為急用錢點擊進入,註冊領取,這個過程非常簡易,包括註冊、下載 APP、填寫信息與綁卡、申請等待、授信通過領款等幾個線上操作。
機構是如何對借款用戶進行風控呢?上一輩人肯定無法理解,因為他們獲得貸款都需要抵押或者擔保。互聯網金融強調零售業務的效率,這個風控過程被完全搬到了互聯網這個虛擬空間。風控的命門變成了數據,從小明註冊開始,這一系列的動作,都被放貸機構掌握了他的數據。
放貸機構獲得了小明的姓名、身份證、手機號等要素,獲得了手機 APP 底層的行為數據,獲得了銀行卡信息數據,通過用戶 ID 信息,風控引擎會自動去第三方數據查詢更多的標籤,比如是否在其他借貸平台有過借款、有過逾期,是否是信貸黑名單,是否經常瀏覽博彩類網站,填寫的家庭地址是否是一個偽造的地址,甚至是小明的通訊錄和聯繫人是否有老賴或者貸款中介……
打一個比喻,一旦申請網貸,借款人相當於被脫光了放在櫥窗里,供人審閱!
缺乏技術理論的金融科技走不遠
不傻的人都能看明白,這個所謂的「科技賦能」在過去的互聯網信貸模式一定是罪孽的幫凶。心地善良的我們,本應該享受這種快捷的方式借到自己急需的錢,享受科技帶來的普惠,卻變成了被完全監控、騷擾。你的信息變成暴利商的無成本交易品,你的手機號被無數次倒賣,你一天可能接到十個營銷電話、二十條營銷簡訊。這一切都會讓本來安安靜靜的生活變得無序、變得可怕。
金融無奸不商,股市吸血、貸款要命。互金這些年,因為缺乏完整的監管體系,所有的傳統金融都試圖加持所謂金融科技,大張旗鼓。在科技賦能的過程,脫離了社會人文本質,更嚴重的是脫離了道德與倫理。這話並不嚴重,可能是古代的人太笨,不懂得說你脫了拍點裸照就可以得到貸款,這已經是上升到社會道德層面的問題了。
我很想說,缺人文道德的金融科技走不遠,也必須不可以走遠。缺人文道德,我們美麗文明的國度會失去原本的美好,人心惶惶、膽戰心驚,那種生活在新科技時代的不安,會讓我們看身邊所有事物都感覺是一個陷阱。
金融科技要健康,首先解決隱私問題
過去大多數金融科技案件,都因用戶隱私問題引發。非法採集數據、非法販賣數據的歸因其實還是數據行業生態的不完善性,讓一大部分奸商有機可乘。金融科技從業者都有這樣的感覺,自去年開始,似乎所有的業務都停滯了。迫於法律法規的約束與要求,風控變得一數難求。
金融科技絕對依賴用戶數據。
精準營銷要達到精準,必須使用個人用戶數據,比如一個做信用卡推廣的銀行,如果閉著眼睛去投放信息流或者發簡訊,roi 如果能達到 0.3 已是萬幸。一般的渠道都會進行用戶刻畫,比如採購消費標籤等,甚至是運營商的 DPI 數據(近期是否瀏覽過辦信用卡的頁面),這樣的經驗標籤或者瀏覽日誌可能可以讓 roi 提高到 1 以上。
風控評分要達到效果,更須依賴於個人用戶數據,比如一個銀行做個人貸款,如果只用央行徵信數據,很有可能借款人不在其中,即使在其中但是數據維度單一。高效的方式是採購第三方的信用數據進行評估,比如某嘛分(當然今天已經不直接輸出)、運營商的話費信息、手機設備 SDK 廠商的 APP 安裝和使用信息、地圖廠商的 LBS 位置數據等等,通過多維度的數據進行聯合建模,最終得到借款人的信用評估值。
這些金融業務本質上不是想「買賣」用戶數據,作為業務甲乙方本質上只期望得到數據背後的知識和價值。所以,金融科技本沒有錯,錯的是金融科技過程留下的禍根很深。金融科技要正名自己,必須解決賦能過程中對用戶數據隱私的絕對保護和安全。
數據應用範式必須重構
解決用戶隱私問題,我們曾經熟悉的 API 調用與建模方式存在著千瘡百孔的漏洞——保險公司去查數據源,保險客戶 ID 就被緩存、被惡意再營銷、被迫流失;銀行要對信用卡建模,就必須把 Y 樣本(信用卡逾期表現)給到數據源,或者數據源把標籤庫完整地放到銀行端,用戶數據的大批量遷移出庫往往引起惡劣後果。
風控是支撐金融業務的核心,要持續健康地運轉,必須重構數據應用的範式——數據廠商與金融機構用安全計算的方式合作數據,用人工智慧保證數據的絕對安全。一個簡單的安全計算(舉例聯邦學習)為例:
Role A 表示銀行端,Role B 表示數據源,用聯邦學習的方式使用數據進行聯合建模,整個過程數據本身只在本地私域進行計算,過程中交互的是加密的模型參數,最終得到加密的分散式模型。
安全計算既保護數據,又提效
多個模型交叉
有過風控經驗的工程師都經歷過,假設現在有 2 個數據源,運營商數據和 SDK 數據,如果對方都不直接輸出標籤的情況下,智能帶著 Y 樣本分別去運營商和 SDK 伺服器上建模,分別訓練出模型。實際應用過程中,相當於分別調用模型,得到各自的評分,最後做交叉評估。
多方聯合建模
(多方)安全計算可以實現統一建模,在一個平台上,同時用運營商和 SDK 的標籤,進行多方訓練,得到一個更完整的綜合評分模型。
多方安全計算聯合建模優勢:
- 保證用戶隱私安全,數據不出本地私域;
- 避免單數據源聯合建模的特徵
大數據風控未來,演算法定義邊界
數據業務能做多少大,不應該只取決於業務的市場容量有多大,業務做到哪兒應該停止,這個問題將會被演算法重新定義。為什麼如此說道?因為數據業務的敏感性,迫使一旦遇到數據安全帶,就必須停止,這就是所謂的邊界。這個邊界可以有法律來制定,但是往往很難,因為數據業務的錯綜複雜導致沒有一個條例可以講清楚你這樣用數據是不是合法合規。
先定義模式,在模式之內,你能夠到的地方,都允許你去觸碰,這就清晰了!數據業務回歸業務本質,不需要去擔心和考慮是不是觸碰到法律。這就好比足球場上的球員只要關注自己的球技,不要將球踢出邊界即可,球場上盡情發揮、淋漓盡致,踢出精彩的比賽。
安全計算,定義好了這個足球場和球場規則,數據源和金融機構作為參與方,在這個球場上,不存在數據出界的機會:數據不出庫、可用不可見、模型滿地跑。
尊重人文,才是人工智慧
人工智慧是一個很寬的辭彙,本意上是讓人們的生活更快捷、更美好,多看十年二十年,人工智慧才處於一個早期,人工智慧賦予金融業務顯得過於急躁,過程中的「不愉快」可以成為一個經驗或者教訓,往後發展之路,必須步步「經」心,必須回歸到本意,那就得尊重人文。否則一切都會弄巧成拙、畸形怪出。目前包括富數科技在內的做安全計算的幾家公司,都試圖用新的技術來詮釋安全的定義,最終讓人工智慧更貼近人文,更擁有社會責任感。
互聯網與科技發展之快,如飛奔的高鐵,適當的時候放緩腳步,回過頭看看存在的問題,這是企業和行業的責任!遊戲行業如何引導孩子的健康?直播與社交如何抵制涉黃?金融如何防犯用戶隱私問題……產能巨大的話題行業與人工智慧結合顯得極為重要,警惕互聯網大躍進過程中的人文迷失。
來源鏈接:mp.weixin.qq.com
冷萃財經原創,作者:Awing,轉載請註明出處:https://www.lccjd.top/2020/06/20/%e5%ae%89%e5%85%a8%e5%a4%9a%e6%96%b9%e8%ae%a1%e7%ae%97%e5%a6%82%e4%bd%95%e9%9d%a9%e6%96%b0%e9%87%91%e8%9e%8d%e7%a7%91%e6%8a%80%e5%a4%a7%e6%95%b0%e6%8d%ae%e9%a3%8e%e6%8e%a7%e6%a8%a1%e5%bc%8f%ef%bc%9f/?variant=zh-tw
文章評論