如何喚醒“沉睡”的公共數據?開發(fā)利用頂層設計出臺
“這是中央層面首次對公共數據資源開發(fā)利用進行系統(tǒng)部署。”
——————————
整理材料、開展調研、上報數據……“十一”假期剛過,各地政府的數據管理機構、數據服務企業(yè)就馬不停蹄地忙碌起來。
“今天上午,省里面就到了我們這邊的數據要素產業(yè)園,現在都還在那邊調研。”10月11日傍晚,四川省某地級市政務和大數據局副局長在電話中對中青報·中青網記者說。來不及細聊,他就忙著接待,掛斷了電話。也在這兩天,每日互動股份有限公司(以下簡稱“每日互動”)董事長方毅奔波于各種會議,調研、采訪一個接著一個,時間被安排得“密不透風”。究其原因,都與一份公共數據資源開發(fā)利用領域的頂層設計文件有關。
10月9日,中辦、國辦正式對外發(fā)布了《關于加快公共數據資源開發(fā)利用的意見》(以下簡稱《意見》),提出到2025年,公共數據資源開發(fā)利用制度規(guī)則初步建立;到2030年,公共數據資源開發(fā)利用制度規(guī)則更加成熟,資源開發(fā)利用體系全面建成。
“這是中央層面首次對公共數據資源開發(fā)利用進行系統(tǒng)部署。”國家數據局局長劉烈宏在日前舉行的國新辦新聞發(fā)布會上說。而就在《意見》發(fā)布后的第三天,兩項配套政策的征求意見稿也按期與公眾見面,公共數據資源開發(fā)利用的政策規(guī)則體系逐漸明晰,如何喚醒“沉睡”的公共數據則備受關注。
明確共享、開放和授權運營三種方式
作為繼土地、勞動力、資本、技術之后的第五大生產要素,數據越來越受到市場的重視。
2022年12月,《中共中央 國務院關于構建數據基礎制度更好發(fā)揮數據要素作用的意見》發(fā)布,業(yè)內稱為“數據二十條”,以此來凸顯其重要性。在總述“探索數據產權結構性分置制度”時,“數據二十條”明確要“建立公共數據、企業(yè)數據、個人數據的分類分級確權授權制度”。
這里提到的公共數據,就是各級黨政機關、企事業(yè)單位依法履職,或提供公共服務過程中產生的數據資源,小到城市空氣質量、小區(qū)用水用電,大到GDP、CPI等,《意見》也延續(xù)了這一概念。聚焦數據智能服務賽道10余年,每日互動推出的數據服務產品,大部分是基于自主持有數據和相關平臺企業(yè)數據開發(fā)而來,“從政府等單位獲取公共數據的情況并不多”。但長期與數據打交道的方毅,深諳各類數據價值。
“在業(yè)內,公共數據被認為是極具價值的數據資源。”方毅對記者說,公共數據規(guī)模體量大,數據的客觀性、準確性更高,企業(yè)類、平臺類數據往往是實時采集的,更加鮮活。“未來如果能把公共數據的開放性、權威性、準確性,與互聯(lián)網平臺數據的鮮活性相結合,可以更好地發(fā)揮數據要素的價值。”
其實,早在2015年,“公共數據”的表述就首次出現在國務院發(fā)布的《促進大數據發(fā)展行動綱要》中。多年來,面向支撐數字政府建設,公共數據發(fā)揮了顯著作用,但劉烈宏坦言,公共數據在資源供給、應用創(chuàng)新、權益分配等方面,“不敢”“不愿”“不會”的問題比較突出,要素價值沒有得到充分釋放。他也明確指出:“公共數據資源開發(fā)利用不足,主要矛盾在供給側。”
今年5月發(fā)布的《全國數據資源調查報告(2023年)》顯示,2023年,我國公共數據開放量同比增長超16%,18.6%的平臺企業(yè)和51%的中央企業(yè)在數據開發(fā)利用過程中應用到政府開放數據。但在2023年我國生產的數據量中,只有2.9%被保存,而在存儲數據中,一年未使用的數據約占四成,大量數據價值被低估,亟待挖掘復用。
對此,《意見》首先瞄準公共數據資源供給,明確了共享、開放、授權運營3種公共數據資源供給方式。國家數據局副局長陳榮輝表示,作出上述規(guī)定,主要是考慮要按“需”施策、因“數”施策,既滿足不同的開發(fā)利用需要,也提出有針對性的管理要求,“目的就是希望能夠系統(tǒng)性地解決公共數據資源‘供得出’的問題”。
其中,“共享”面向各級政務部門,主要解決跨層級、跨地區(qū)、跨系統(tǒng)、跨部門、跨業(yè)務的數據共享交換問題;“開放”主要面向企業(yè)和社會公眾,強調要在維護國家數據安全、保護個人信息和商業(yè)秘密的前提下,利用互聯(lián)網依法依規(guī)有序開放數據或者數據集。
陳榮輝透露,截至今年7月,我國已有243個省級和城市的地方政府上線了數據開放平臺,開放的有效數據集超過37萬個,“最近8年來增長了44倍”。《意見》提出,要健全公共數據開放政策體系,優(yōu)先開放與民生緊密相關、社會需求迫切的數據。“這些措施,必將持續(xù)提升公共數據開放的‘質’和‘效’。”他說。
而對于潛在價值高,具有一定敏感性的數據,則需要依托更加專業(yè)的力量,付出一定的治理和開發(fā)成本,形成數據產品和服務供社會各方調用。在此背景下,授權運營應運而生。
“公共數據資源開發(fā)利用是數據要素化配置的切入點,也是社會數據資源開發(fā)利用的牛鼻子。”清華大學計算社會科學與國家治理實驗室執(zhí)行主任孟慶國預計,《意見》將激活現有占全社會70%-80%的公共數據資源,“將對企業(yè)數據資源開發(fā)利用、個人數據資源開發(fā)利用等都產生極大的示范帶動作用”。
強化規(guī)范公共數據授權運營
“公共數據授權運營將是擴大公共數據資源供給最主要和有效的方式。”孟慶國對記者說,相較于“共享”和“開放”,“授權運營”在平衡公共數據的公益性與收益性問題、平衡公共數據信息保護與數據價值釋放問題方面,存在著較大優(yōu)勢。
他提到,公共數據來源于政府部門、公共企事業(yè)單位的公共管理和公共服務履職,如果無條件無償使用,開發(fā)利用動力就會不足,也難以持續(xù)。通過授權運營,允許運營機構在政府指導和授權下,進行有償服務,將極大程度激活公共數據市場活力。“此外,授權給專業(yè)的機構運營公共數據,按照‘管運適度分離’的原則,讓社會資本有序參與,也能最大釋放公共數據要素價值。”
此前,“數據二十條”曾提到要“推進實施公共數據確權授權機制”。此次新發(fā)布的《意見》則提出,要“鼓勵探索公共數據授權運營”,探索將授權運營納入“三重一大”決策范圍,強調要明確授權條件、運營模式、運營期限、退出機制和安全管理責任等。在國家數據局數據資源司司長張望看來,這是建立數據產權分置運行機制的重大舉措,也是建立公共數據、企業(yè)數據、個人數據分類分級確權授權機制的一個重要的突破口,就是在落實“數據二十條”精神。
記者查詢公開信息后發(fā)現,截至目前,全國各地至少公布了50份公共數據授權運營專門政策文件,大多數出現在“數據二十條”出臺之后,其中又以2023年發(fā)布的文件居多。“因此,2023年也被業(yè)內稱為我國的‘公共數據授權年’。”方毅認為,從各地的相關動作,足以看出社會各界對公共數據資源授權運營的期待。
其實,從去年國家數據局掛牌成立到現在,近一年的時間,方毅作為企業(yè)方代表之一,一直與國家數據局保持著良好的溝通,相關政策文件在前期醞釀和討論過程中,其公司也參與其中。“《意見》的主基調是強調數據‘開放’和‘運用’,從大的邏輯上可以理解為,在保障數據安全的同時,鼓勵供需雙方共同努力讓數據潤澤到產業(yè)發(fā)展中。”他說。
值得注意的是,《意見》不光將“公共數據授權運營”作為一種新型公共數據資源開發(fā)利用形式寫入,還將“加強資源管理,規(guī)范公共數據授權運營”單獨作為一節(jié)寫出,并著重強調了要“建立健全價格形成機制維護公共利益”,關注到公共數據資源到底“值多少錢”這個關鍵問題。
實際上,數據定價,一直是數據要素市場化配置的難點和焦點。中央財經大學數字經濟融合創(chuàng)新發(fā)展中心主任陳端介紹,目前,公共數據的定價主要有專家評估、數據收集或管理機構定價、市場公允價值定價等方式,尚未形成統(tǒng)一的公共數據價值評估標準。“核心是不同主體對定價權的爭奪,背后則是定價模式的差異”。
對此,《意見》提出要發(fā)揮好價格政策的杠桿調節(jié)作用,加快建立符合公共數據要素特性的價格形成機制,還明確提出了“無償使用”和“有償使用”兩種方式。“無償使用”用于公共治理、公益事業(yè)的數據產品和技術服務,實行有條件的無償使用;“有償使用”用于產業(yè)發(fā)展、行業(yè)發(fā)展的經營性技術和產品開發(fā),確實需要收費的,也不能漫天要價,要實行政府指導價,目的就是要降低全社會的用數成本。
“兩種收益方式,保障了公共數據的公共屬性,最大程度激發(fā)了公共數據開發(fā)運營的市場活力。”孟慶國說。陳榮輝表示,建立健全價格形成機制,本質是要在堅持維護公共利益的前提下,正確處理公益性和市場化開發(fā)利用的關系,實現經濟和社會綜合效益的最大化。記者在采訪中了解到,目前,國家數據局正會同國家發(fā)展改革委,研究制定相關價格政策文件,將于近期出臺。
安全合規(guī)地使用數據
對于公共數據資源開發(fā)利用,“如何保證數據被安全合規(guī)地使用”是民眾最關心的問題。
近日,審計署發(fā)布了《中央部門單位2023年預算執(zhí)行等情況審計結果》,其中提到,4個部門所屬7家運維單位未經審批自定數據內容、服務形式和收費標準,依托13個系統(tǒng)數據對外收費2.48億元。這是公共數據被違規(guī)利用的典型案例。有業(yè)內人士指出,政務和公共數據開放能釋放經濟價值,但也要在數據安全要求范圍內。政務數據、公共數據等所包含的有價值信息多,需要高程度的保護,例如限制或禁止對外流通,以及更為嚴格的授權獲取或使用程序等。
除了數據被違規(guī)利用,陳端提到,在公共數據資源開發(fā)利用過程中,公共數據泄露風險也值得關注。她說,數據具有易復制性和可攜帶性特點,公共數據價值密度高,涉及大量個人敏感信息,如泄露將對個人隱私造成嚴重影響,動搖公眾對公共數據開放的信任度,也會給相關方帶來經濟損失。其中,國防、軍事等領域的敏感信息安全風險尤為突出,需要有更為完善的數據安全防范機制。
“在‘數據二十條’中,堅持‘原始數據不出域、數據可用不可見’的原則,主要是為了防止數據泄露。”孟慶國分析說。《意見》也延續(xù)了“數據二十條”的上述原則,對公共數據安全作出相應規(guī)定,并特別重申“依法依規(guī)予以保密的公共數據不予開放,嚴格管控未依法依規(guī)公開的原始公共數據直接進入市場”。
在制度方面,《意見》要求建立健全分類分級、風險評估、監(jiān)測預警、應急處置等工作體系,開展公共數據利用的安全風險評估和應用業(yè)務規(guī)范性審查。在技術方面,鼓勵開發(fā)數據模型、數據核驗、評價指數等多形式數據產品。此外,《意見》還強調要提升數據匯聚關聯(lián)風險識別和管控水平。
“數據資源開發(fā)利用程度越深,數據安全和個人信息保護就越要強化。”張望介紹,對于其中涉及個人信息的公共數據,將嚴格落實《中華人民共和國個人信息保護法》,進行脫敏和匿名化處理。同時,有關部門還將支持數據加密、可信流通、安全治理等技術創(chuàng)新和應用,更好地解決數據利用中的安全問題。
關于公共數據開發(fā)利用中的數據安全合規(guī)問題,方毅認為要圍繞具體場景來討論。他以交通場景為例說,如果某輛車的數據被泄露,就有可能侵犯了隱私,但如果是根據車輛分析得到的整體路況數據就不涉及隱私,且路況分析數據反映出的城市交通情況將有助于交管部門很好地提升交通治理水平。
“所以,結合具體場景來談數據的安全合規(guī)非常重要。”方毅認為,這一方面要通過機制來保障“分場景”論證,同時也需要用裝置來保障“封場景”使用,從而做到數據可用而不可見,“讓數據非必要不流轉,但數據價值暢通流轉”。
(中青報·中青網記者 賈驥業(yè))
分享讓更多人看到