產業步入快速發展階段
全球數據標注市場目前正處於迅速增長期。近年來,我國數據標注產業已進入快速發展階段,產業鏈條不斷完善,技術創新成果逐步實現市場化應用。據測算,2023年我國數據標注產業規模已達800億元左右。
四川成都、遼寧沈陽、安徽合肥、湖南長沙等7個承擔數據標注基地建設任務的城市,在大模型標注、自動化標注等領域取得重要突破。長沙信息產業園作為長沙首批數據標注基地之一,已吸引智能網聯汽車、數據標注、網絡安全等1萬餘家各類數字企業入駐,成功打造了人工智能創新中心算力服務平台。
廣東積極推進數據標注訓練試點和基地建設,為大模型訓練提供堅實數據支撐。2023年9月,廣東省公共數據標注訓練試點正式啟動。在廣東省公共數據標注基地(清遠),百度、燕湖科技、好思達等一批在自動駕駛、政務公共標注領域表現突出的企業已率先入駐。憑借龍頭企業的帶動作用和數字經濟產業的集聚效應,清遠的數據標注產業蓬勃發展。
“我們以數字經濟產業為核心,與數字經濟產業龍頭企業緊密合作,致力於打造國家級數據標注產業集聚區和產教融合示範區。”廣東省公共數據標注基地(清遠)負責人李艶康介紹,落戶在此的百度智能雲(清遠)人工智能基礎數據產業基地已累計引進孵化數據標注企業5家,培育專業數據標注師超300人。未來,基地將持續培育孵化更多優秀數據標注企業,推動清遠數據服務產業不斷壯大發展。
復合型人才缺口仍然較大
《實施意見》的出台,將進一步提升數據供給質量,有效解決制約人工智能產業發展的高質量數據短缺問題。
值得注意的是,隨著人工智能應用的不斷深化,對數據標注的需求也愈發細分化和專業化。2024年7月,張通團隊和廣州華銀康醫療集團股份有限公司在人工智能與數字經濟廣東省實驗室(廣州)共建AI病理研究中心,著手研發人工智能病理大模型,讓人工智能模型能像專業醫生一樣看病問診。在其中的數據預處理環節,中心特別聘請了3位資深的主任級醫師進行數據標注。 |