】 【打 印】 
【 第1頁 第2頁 】 
構建多元化的人工智能訓練數據供給體系
http://www.crntt.hk   2025-01-17 13:38:03
 
  完善數據跨境傳輸機制,豐富數據類型。人工智能訓練數據的高質量供給,離不開數據跨境傳輸制度的支撐。不同國家、不同地區的數據資源具有多元化的本地特徵,這類數據資源能夠優化人工智能算法模型,提升人工智能產品和服務的通用性。近年來,我國數據跨境傳輸的法律法規相繼出台,確立了以“安全評估、個人信息出境標準合同、個人信息保護認證以及特殊機制”為內容的數據跨境傳輸治理框架。同時,《促進和規範數據跨境流動規定》進一步解綁了基於學術合作、跨國生產製造、市場營銷等活動進行數據跨境傳輸的限制條件。為了更好推動訓練數據的跨境流動,需要遵循發展與安全並重的治理邏輯。從長遠來看,數據資源本地化不利於人工智能產業的創新發展,也不利於數據要素的市場化配置。數據跨境傳輸制度的建構是為了實現又好又快的跨境傳輸數據,在數據資源的“一進一出”中,充分獲取全球範圍內的高質量訓練數據資源。在促進產業發展的同時,還需要確保數據出境安全,積極探索多邊、雙邊數據跨境合作機制,提升我國在數據跨境傳輸國際規則制定中的話語權,以構建網絡空間命運共同體為導向,實現訓練數據安全有序流動。

  出台數據供給配套政策,暢通數據流動。在財政支持政策方面,不同規模的科技企業獲取訓練數據的能力並不相同,為了降低人工智能產業的市場門檻,有必要通過設立專項資金、實施稅收優惠政策等手段降低中小企業獲取高質量訓練數據的實際難度。針對在特定領域具有卓越表現的中小企業、科研機構予以專項扶持,特別是涉及先進標注算法、數據整合技術等事項,可以通過專項資金助力企業購置更先進的設備、擴充專業人才隊伍。在技術標準體系方面,統一的技術標準是確保訓練數據質量、規範數據供給的重要工具。在訓練數據采集、標注環節,設置統一的技術標準體系能夠有效降低後續數據分析、數據挖掘等環節的研發成本。同時,科學客觀的技術標準也能針對科技倫理事項輔助確立更為統一的標注規則。在基礎設施平台建設方面,為了緩解各行業、各領域數據流動範圍狹窄、流動類型有限等“數據孤島”現象,需要政府部門推動建設面向訓練數據供給的數字基礎設施以及公共算法訓練平台。通過這些基礎設施和公共平台,將涵蓋經濟、地理、交通等各個領域的數據資源進行匯總,從而有效提高訓練數據的總體數量和質量。


 【 第1頁 第2頁 】


          
】 【打 印】 

 相關新聞: