亚洲成av人片在www色猫咪_精品剧情在线观看_国产欧美一区二区在线_欧美一卡2卡3卡4卡

首頁 > 資訊 > 科技 > 正文

數據標注為AI發(fā)展加工“優(yōu)質原料”

2025-01-27 13:32:13來源:科技日報

圖為廣東省公共數據標注基地(清遠)。 受訪者供圖

隨著人工智能迅猛發(fā)展,高質量訓練數據短缺逐漸成為制約行業(yè)進步的一大瓶頸,而數據標注產業(yè)可為人工智能創(chuàng)新發(fā)展提供強大動力。國家發(fā)展改革委、國家數據局、財政部、人力資源和社會保障部四部門日前聯(lián)合印發(fā)的《關于促進數據標注產業(yè)高質量發(fā)展的實施意見》(以下簡稱《實施意見》),提出到2027年的發(fā)展目標:數據標注產業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產業(yè)規(guī)模大幅躍升,年均復合增長率超過20%。

我國數據標注產業(yè)現狀如何?數據標注產業(yè)高質量發(fā)展還需要跨過哪些“門檻”?針對這些問題,科技日報記者進行了采訪。

 原始數據變?yōu)榭捎觅Y源

“通俗地說,訓練人工智能大模型的過程就像老師教學生識字。”華南理工大學計算機科學與工程學院副院長張通形象地解釋道,數據標注就是給數據“貼標簽”或者“做記號”,需要專業(yè)人員向大模型闡釋各個數據的標簽及需執(zhí)行的相應任務。他們“教導”大模型參與訓練的數據是什么,給圖像、語音、文本等各種數據“貼標簽”。高質量的數據標注,有助于機器精準理解、快速學習、高效訓練,顯著提升大模型的準確性和泛化能力。

在訓練ChatGPT時,美國開放人工智能研究中心(OpenAI)就投入了大量資源用于數據標注。為確保標注任務高質量完成,使ChatGPT能更好地理解人類指令,保障大模型的準確性與可靠性,OpenAI聘請了眾多“老師”。這些“老師”涵蓋一般數據標注人員和專業(yè)人士,還包括博士級別的專家。

數據標注是人工智能發(fā)展的核心基石之一。“數據標注產業(yè)是對數據進行篩選、清洗、分類、注釋、標記和質量檢驗等加工處理的新興產業(yè),其核心任務是對原始數據進行加工,使之成為可用于訓練人工智能大模型的優(yōu)質原料。”張通介紹,數據標注作為訓練大模型至關重要的一環(huán),直接影響機器學習模型的性能,對支撐人工智能能力水平提升有重要作用。

在張通看來,未經處理的原始數據只是潛在資源,而經過標注處理后沉淀的數據,才能在市場上進行有效交易和流通,從而充分釋放數據要素價值。培育壯大數據標注產業(yè),對于提升數據供給質量、推動人工智能創(chuàng)新發(fā)展不可或缺。

業(yè)內人士認為,隨著人工智能技術不斷成熟、應用領域持續(xù)拓展,數據標注行業(yè)將迎來更廣闊市場空間,尤其是在低空經濟、智慧城市、自動駕駛、智慧醫(yī)療等新興科技領域展現出巨大潛力。

 產業(yè)步入快速發(fā)展階段

全球數據標注市場目前正處于迅速增長期。近年來,我國數據標注產業(yè)已進入快速發(fā)展階段,產業(yè)鏈條不斷完善,技術創(chuàng)新成果逐步實現市場化應用。據測算,2023年我國數據標注產業(yè)規(guī)模已達800億元左右。

四川成都、遼寧沈陽、安徽合肥、湖南長沙等7個承擔數據標注基地建設任務的城市,在大模型標注、自動化標注等領域取得重要突破。長沙信息產業(yè)園作為長沙首批數據標注基地之一,已吸引智能網聯(lián)汽車、數據標注、網絡安全等1萬余家各類數字企業(yè)入駐,成功打造了人工智能創(chuàng)新中心算力服務平臺。

廣東積極推進數據標注訓練試點和基地建設,為大模型訓練提供堅實數據支撐。2023年9月,廣東省公共數據標注訓練試點正式啟動。在廣東省公共數據標注基地(清遠),百度、燕湖科技、好思達等一批在自動駕駛、政務公共標注領域表現突出的企業(yè)已率先入駐。憑借龍頭企業(yè)的帶動作用和數字經濟產業(yè)的集聚效應,清遠的數據標注產業(yè)蓬勃發(fā)展。

“我們以數字經濟產業(yè)為核心,與數字經濟產業(yè)龍頭企業(yè)緊密合作,致力于打造國家級數據標注產業(yè)集聚區(qū)和產教融合示范區(qū)。”廣東省公共數據標注基地(清遠)負責人李艷康介紹,落戶在此的百度智能云(清遠)人工智能基礎數據產業(yè)基地已累計引進孵化數據標注企業(yè)5家,培育專業(yè)數據標注師超300人。未來,基地將持續(xù)培育孵化更多優(yōu)秀數據標注企業(yè),推動清遠數據服務產業(yè)不斷壯大發(fā)展。

復合型人才缺口仍然較大

《實施意見》的出臺,將進一步提升數據供給質量,有效解決制約人工智能產業(yè)發(fā)展的高質量數據短缺問題。

值得注意的是,隨著人工智能應用的不斷深化,對數據標注的需求也愈發(fā)細分化和專業(yè)化。2024年7月,張通團隊和廣州華銀康醫(yī)療集團股份有限公司在人工智能與數字經濟廣東省實驗室(廣州)共建AI病理研究中心,著手研發(fā)人工智能病理大模型,讓人工智能模型能像專業(yè)醫(yī)生一樣看病問診。在其中的數據預處理環(huán)節(jié),中心特別聘請了3位資深的主任級醫(yī)師進行數據標注。

“醫(yī)療、材料等專業(yè)領域,涉及到專業(yè)對象和術語結合的標注過程,只有專業(yè)從業(yè)人員才能勝任標注工作。而且,標注任務極其耗時、耗力、耗資源。整個標注工作并非一蹴而就,而是需要在實際應用場景中優(yōu)化、持續(xù)迭代,促使模型智能化水平不斷升級。”張通說,當前我國數據標注行業(yè)人才缺口仍然較大,亟待培養(yǎng)復合型數據標注人才,這是我國數據標注產業(yè)高質量發(fā)展必須跨過的“門檻”。

《實施意見》對加強標注人才隊伍建設作出部署。以人才項目計劃和科技項目等為抓手,培育和引進高端專業(yè)人才;制(修)定人工智能訓練、數據標注相關職業(yè)國家職業(yè)標準;支持數據標注領域職業(yè)資格與職業(yè)技能等級銜接互認……一項項舉措,將為數據標注產業(yè)高質量發(fā)展提供支撐。

完善的產業(yè)生態(tài)建設對數據標注行業(yè)發(fā)展同樣重要。《實施意見》提出,暢通數據采集、標注、人工智能應用產業(yè)鏈,推動數據標注產業(yè)上下游協(xié)同發(fā)展;支持數據標注龍頭企業(yè)和第三方機構等建設數據標注開源平臺,助力中小企業(yè)發(fā)展;培育一批人力資源、供需對接、國際合作、法律審計等服務數據標注的第三方機構,完善數據標注產業(yè)生態(tài)。

“未來數據標注行業(yè)的發(fā)展,也可考慮‘以人工智能促人工智能’的思路,即讓已經完成學習的人工智能反哺數據標注工作,提高效率。這是值得深入探討且極具價值的研究方向。”張通認為,數據標注行業(yè)的發(fā)展有望加速推動數字經濟與實體經濟深度融合,加快形成新質生產力。

關鍵詞:

責任編輯:孫知兵

免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯(lián)系我們!

關于我們 - 聯(lián)系方式 - 版權聲明 - 招聘信息 - 友鏈交換 - 網站統(tǒng)計
 

太平洋財富主辦 版權所有:太平洋財富網

?中國互聯(lián)網違法和不良信息舉報中心中國互聯(lián)網違法和不良信息舉報中心

Copyright© 2012-2020 太平洋財富網(www.avav001.com) All rights reserved.

未經過本站允許 請勿將本站內容傳播或復制 業(yè)務QQ:3 31 986 683

 

主站蜘蛛池模板: 久久亚洲国产精品日日av夜夜| 国产成人综合久久| 欧美日韩在线不卡视频 | 99在线国产| 青青久久av北条麻妃黑人| 97精品久久久| 美女久久久久久久| 日日摸天天爽天天爽视频| 久久精品男人天堂| 国产精品日韩欧美| 久久视频精品在线| www日韩中文字幕在线看| 国产精品久久久久久久久久99| 国产欧美一区二区三区久久| 欧美日韩国产高清视频| 久久精品视频中文字幕| 人妻少妇精品久久| 久久精品国产69国产精品亚洲| 国产精品国内视频| 日韩在线视频观看| 国产精品久久视频| 欧美精品亚洲| 午夜精品久久久久久久男人的天堂| 日本在线播放不卡| 国产精品午夜视频| 国产成人a亚洲精品| 欧美在线一区二区三区四区| 91免费看片网站| 91超碰中文字幕久久精品| 久无码久无码av无码| 久久久无码中文字幕久...| 97久久精品国产| 欧美二区在线看| 日本丰满少妇黄大片在线观看| 99视频在线播放| 国产精品视频久久| 国产精品久久久久久久久久ktv | 午夜精品一区二区三区av| 久久人人爽国产| 国产成人成网站在线播放青青| 精品国偷自产在线视频99|