首頁 > 新聞 > IT資訊 > 正文

焦點訊息:黃益平:大數據如何共享?

2022-08-02 15:50:34來源:中新經緯  

中新經緯8月2日電 題:大數據如何共享?

作者 黃益平 北京大學國家發展研究院教授、副院長,北大數字金融研究中心主任

導語:對數據要素不能簡單地套用傳統生產要素的治理方法,實現大數據共享,也應主要通過分享大數據分析的結果,而不是分享原始數據本身。


(資料圖片僅供參考)

2022年4月,我在博鰲亞洲論壇期間主持了一場關于數字經濟的討論,在會上博鰲亞洲論壇副理事長、中方首席代表,中國金融學會會長周小川提出用安全算法手段克服國際間數據難以完全自由流動的矛盾,借用他的話,可以理解為“數據不出境,但分析結果可以出境”。這個思路對我有很大的啟示,當前歐美國家正積極推動國際數字貿易規則的制訂,提出了數據跨境自由流動的主張。但這對包括中國在內的其它一些國家來說構成了挑戰,如果基于國家安全等考慮做不到數據自由流動,就可能會對這些國家參與國際數字貿易形成制約。周小川的思路為化解這個矛盾提供了一個解決方案,就是用分析結果的流動替代原始數據的流動。這個思路也打開了我對國內大數據共享問題的思考空間。

“數據是數字經濟時代的石油”,現實中大數據應用的成功案例已經非常多,包括產品的精準營銷、服務的個性化方案以及信用風險的有效評估等。大數據分析可以幫助提高經濟效率,改善用戶體驗,擴大經營規模,促進經濟與社會的創新與發展。大數據已經成為當前經濟中十分重要的生產要素。到目前為止,大數據多是在大科技平臺上產生的,因而大科技公司是大數據分析的主要實踐者。但如果大數據可以共享,大數據分析的紅利就會更大。可能就是出于這個考慮,最近幾年政府在一些領域推動數據共享。設立幾家大數據征信公司的目的,應該就是為了讓更多的商業銀行利用大數據信用風險評估的手段。

但作為特殊的生產要素,并非所有的大數據都是可以拿出來共享的。在這個前提下如何達成數據共享的效果,確實需要做創新性的思考。討論數據共享,首先要面對數據權屬的問題,即數據歸誰所有?傳統生產要素如資本和土地的有效利用都是基于一個前提,就是清晰地界定產權。但這個做法很難簡單地套用到大數據,直接的原因是一些大數據的權屬很難被清晰地界定。比如用戶在平臺上點外賣、看短視頻的數據,既包含個人的一些信息,但同時也有平臺支持的線上活動。顯然,在這個實例中,要在用戶和平臺之間劃清楚數據的所有權界線,難度非常大。一個合理的解決方案是涉及個人特性的數據歸個人所有,用戶在平臺上活動留下的數字足跡可以歸個人和平臺共同擁有,與個人基本上沒有關系的數據則可以歸平臺所有。

在現實生活中,數據確權還面臨一個挑戰,就是要在權益保護與使用效率之間取得一個平衡。中國和歐盟的實踐提供了兩個對應的典型案例。過去中國缺乏有效的數據治理政策,既沒有確權,保護也不足。這樣,一方面,利用大數據分析的創新活動十分活躍,但另一方面,各種違規、違法的行為也十分普遍。因此,最近幾年政府采取了許多措施,加大數據保護的力度。歐盟在數據保護方面一直做得比較早、也比較好,美中不足是由于限制比較多,基于大數據分析的經濟創新相對不活躍。因此,數據治理特別是確權需要秉承一個原則,就是既要保護權益,也要支持創新。對數據確權要特別重視平臺的貢獻和權益。

討論數據共享還要面對適合性的問題,什么數據可以共享、什么數據不能共享?從原則上說,起碼有三類數據不能共享:一是個人隱私,二是商業機密,三是國家安全。個人的姓名、年齡、性別、教育水平、家庭住址、聯系方式等均屬于個人隱私,應該明確歸屬于個人所有,當然也不能輕易分享。業內常見的做法是對行為與交易數據做脫敏處理,分析師無法追溯到具體的個人或者人群。同樣,如果事關商業機密和國家安全,數據也不能隨便披露。就這些大的原則達成共識并不難,難的是在執行過程中如何把握。以國家安全為例,如果范圍劃得寬泛一些,那也許可以認定絕大部分數據都有一定的敏感性,即便像公眾打車、叫外賣甚至看短視頻這樣的數據,也不排除能分析出一些人群行為方式的變化。所以,如何恰當地把握這個度,同樣是一個極大的考驗。如果標準設定得不夠嚴格,可能會造成不少隱患。但如果標準卡得太嚴,大數據分析也就無從做起。

討論數據共享,最后需要回答的問題是,如何共享?大數據其實有非常適合共享的特點,就是可以無限制地復制。這是數據要素與傳統生產要素的一個根本差別,無論是資本還是土地,如果已經有一家企業在使用,別的企業就無法同時使用。但大數據不一樣,如果需要,一套數據可以供無數家企業同時使用,或許這也正是大數據分析能夠產生超常回報的原因。但這個優點也會引發一個缺點,就是數據的擁有者如何保證購買者不會復制數據給其他人使用,如果不能保證,那么擁有者也就只能出售一次,大數據共享所產生的回報很難完全內部化。這樣,擁有者就很難有足夠的激勵和資源去從事費時費力的搜集、清理和分析工作。大數據若沒了生產,共享也就無從談起。

但在現實生活中已經有公共數據共享的實例。所謂公共數據,主要是指由公共部門積累的大量靜態數據,典型的例子是稅收、社保、司法甚至水電等數據。這些數據已經形成,也不需要相關部門再做額外的投入。目前一些地區通過建立地方性的數據平臺,整合已有的公共數據,支持商業銀行的信用風險評估,為中小企業提供貸款,取得了不錯的效果。廣東省、浙江省、蘇州市和淄博市等嘗試建立的平臺形態不同,主導機構也不一樣,甚至覆蓋的數據也有很大的差別,但這些實踐有一個共同的地方,就是向商業銀行共享公共數據,支持普惠金融業務。

特別需要指出的是,即便是這類共享公共數據的平臺,其實也沒有共享原始數據。平臺的功能只是提供一個接口,讓獲得授權的銀行算法工具進入不同的公共數據庫進行運算,獲得結果。換句話說,這些金融信息服務平臺所做的,實質上就是周小川所提出的思路,“原始數據不出系統,但分析結果可以出系統”。“公共數據”不能出系統,有權益的考慮,也有安全的考慮。但這個理由對于大科技平臺上的大數據則更加突出。因為大多數公共數據是靜態的,什么時候交過多少稅、交過多少水電費,在系統內使用,還是在系統外使用,差異不大。但大數據是動態的,如果分割之后離開系統,可能就很難產生同樣的大數據分析功效。

最近有一種觀點,既然大數據是一種新的生產要素,既重要、又敏感,因此最好能由政府部門或者國有企業掌握。這種想法有一定的合理性,因為在現實中,民營企業在數據處理方面的不合規、不合法行為確實非常多。當然,幾乎所有的大科技公司都是民營企業,這也是事實。但解決合規合法問題的有效途徑是加強監管,而不是把數據集中到國有部門。數據如何才能集中到國有部門,這個技術問題就不好解決。即便能,國有部門行為的合規性比較高,但創新性卻普遍比較低,這樣大數據分析的活力也就喪失了。最佳甚至唯一的解決方案是加強對民營大科技公司的監管,事實上,最近兩年,數據保護的法律、制度頻頻出臺,大科技公司的數據保護意識已經大大加強。即便學者從事學術研究,獲取數據的難度也明顯提高了。

總之,千萬不要套用傳統生產要素的管理方法去管理數據生產要素。無論是確權,還是共享,都需要適應數據特性的思路,根本目的是在保護相關方權益和發揮大數據效用之間取得平衡。大數據共享是一個值得向往和努力的方向,但在實施中要避免簡單粗暴的做法,尤其不能只是把數據分享給大家。事實上很多原始數據是不能拿出來的,這其中有個人隱私、商業機密和國家安全等方面的考慮,也是因為數據復制的成本非常低,更重要的是很多數據一旦離開其原生的平臺系統,其價值就會大打折扣甚至變得一分不值。所以,推動共享的合理做法是建立數據共享平臺,需要使用大數據的機構可以通過平臺提供的接入口,利用大科技平臺的原始數據進行運算,然后輸出結果,即“原始數據不出系統,運算結果出系統”。這就是我從周小川在博鰲亞洲論壇提出的思路獲得的啟示。(中新經緯APP)

本文由中新經緯研究院選編,因選編產生的作品中新經緯版權所有,未經書面授權,任何單位及個人不得轉載、摘編或以其它方式使用。選編內容涉及的觀點僅代表原作者,不代表中新經緯觀點。

責任編輯:宋亞芬

【承澤觀察·平臺經濟40評之二十五】沈艷:推行算法審計大有可為

【承澤觀察·平臺經濟40評之二十四】張俊妮:主動提升算法透明度有利于平臺企業可持續發展

【承澤觀察·平臺經濟40評之二十三】余昌華:數字經濟提升了投資效率嗎?

編輯:董湘依

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀