亚洲偷自91区韩国|制服丝袜在线视频香蕉|国产一级做a爰片在线看|日本乱人伦片中文字幕三区|亚欧乱色束缚一区二区三区|在线看片无码永久免费aⅴ|91国内精品人妻无码久久久|精品久久久久久久久久中文字幕

【每周經(jīng)濟觀察】找準數(shù)據(jù)標注產(chǎn)業(yè)發(fā)展著力點

2025-01-18 06:54 來源:經(jīng)濟日報
查看余下全文
(責任編輯:符仲明)
手機看中經(jīng)經(jīng)濟日報微信中經(jīng)網(wǎng)微信
當前位置     首頁 > 新聞 > 國內(nèi)時政更多新聞 > 正文
中經(jīng)搜索

【每周經(jīng)濟觀察】找準數(shù)據(jù)標注產(chǎn)業(yè)發(fā)展著力點

2025年01月18日 06:54   來源:經(jīng)濟日報   

  推動數(shù)據(jù)標注產(chǎn)業(yè)化,不僅夯實了人工智能算法訓練的基石,也有助于釋放數(shù)據(jù)要素的價值。新形勢下,促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展,需要在需求牽引、創(chuàng)新驅(qū)動、生態(tài)培育等方面找準發(fā)力點。

  日前,一份名為《關(guān)于促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展的實施意見》的文件,迅速讓“數(shù)據(jù)標注產(chǎn)業(yè)”躍入大眾視野,也引發(fā)很多人的好奇:“數(shù)據(jù)標注”究竟是個什么樣的產(chǎn)業(yè)?國家為何如此重視這個新事物?

  對于“數(shù)據(jù)標注”,專家的解釋很直接:就是給文本、語音、圖片、視頻等各種各樣的數(shù)據(jù)“打標簽”。但別小看這些標簽,正是有了它們,數(shù)據(jù)才可以更好地被人工智能算法理解和使用,人工智能系統(tǒng)的性能與準確性才能有效提升。從某種意義上說,沒有高質(zhì)量的數(shù)據(jù)標注,就沒有高性能的人工智能系統(tǒng)。

  通常情況下,訓練一個領(lǐng)先的大模型,需要數(shù)百萬條甚至數(shù)千萬條標注數(shù)據(jù)。遺憾的是,我國雖是全球第二大數(shù)據(jù)資源國,但還算不上數(shù)據(jù)資源強國。有機構(gòu)統(tǒng)計顯示,2023年我國數(shù)據(jù)資源為32ZB(澤字節(jié)),保存數(shù)據(jù)僅有2.9%,這一數(shù)字遠低于發(fā)達國家平均水平。換句話說,數(shù)據(jù)質(zhì)量低、大量數(shù)據(jù)被浪費等現(xiàn)象,客觀上制約了我國數(shù)據(jù)資源價值的發(fā)揮,而通過推動數(shù)據(jù)標注產(chǎn)業(yè)化,不僅夯實了人工智能算法訓練的基石,也有助于釋放數(shù)據(jù)要素的價值。

  促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展,有其必要性。當前,全球主流基礎(chǔ)大模型中,中文語料僅占全部語料的1%,高質(zhì)量中文數(shù)據(jù)不足很大程度是我國基礎(chǔ)大模型能力的短板所在。正因如此,全面提升中文語料質(zhì)量,已成為破解我國大模型發(fā)展的關(guān)鍵環(huán)節(jié)之一。打造具有國際影響力的數(shù)據(jù)標注企業(yè)和品牌,將有助于構(gòu)建完整的人工智能產(chǎn)業(yè)鏈,提升我國在全球人工智能領(lǐng)域的市場份額和話語權(quán)。

  近年來,人工智能技術(shù)的迭代升級和應用場景的持續(xù)拓展,推動數(shù)據(jù)標注產(chǎn)業(yè)不斷呈現(xiàn)出自動化、專業(yè)化和高端化的特點,數(shù)據(jù)標注產(chǎn)業(yè)正逐步從傳統(tǒng)的勞動密集型產(chǎn)業(yè)向知識密集型產(chǎn)業(yè)轉(zhuǎn)變,數(shù)據(jù)標注員作為國家認可的新工種,其專業(yè)化要求也在不斷提高。同時,數(shù)據(jù)標注的應用領(lǐng)域加快拓展深化,除了傳統(tǒng)的語音轉(zhuǎn)寫、圖片文字識別等,來自垂直大模型公司的新需求也越來越多,標注的內(nèi)容也更加豐富多彩。

  新形勢下,促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展,需要在需求牽引、創(chuàng)新驅(qū)動、生態(tài)培育等方面找準發(fā)力點——

  在深化需求牽引方面,通過釋放公共數(shù)據(jù)標注需求和挖掘企業(yè)數(shù)據(jù)標注需求,依法依規(guī)有序推動公共數(shù)據(jù)標注與開發(fā)利用。支持跨部門、跨地區(qū)、跨層級公共數(shù)據(jù)融合應用,鼓勵政府部門和企業(yè)協(xié)同開展政務大模型所需數(shù)據(jù)的標注和訓練,在現(xiàn)代農(nóng)業(yè)、智能制造、信息服務等重點領(lǐng)域發(fā)掘公共數(shù)據(jù)標注需求。

  在增強創(chuàng)新驅(qū)動方面,加強數(shù)據(jù)標注領(lǐng)域的關(guān)鍵技術(shù)攻關(guān)、標準制定和創(chuàng)新載體建設(shè)。支持軟硬一體、自主可控的數(shù)據(jù)標注領(lǐng)域技術(shù)和關(guān)鍵設(shè)備的研發(fā)應用。培育建設(shè)數(shù)據(jù)標注領(lǐng)域重點實驗室、技術(shù)創(chuàng)新中心等創(chuàng)新載體。

  在培育繁榮生態(tài)方面,著力壯大數(shù)據(jù)標注產(chǎn)業(yè)的經(jīng)營主體,推動其規(guī);藴驶、集約化發(fā)展。積極完善產(chǎn)業(yè)生態(tài),暢通數(shù)據(jù)采集、標注、人工智能應用產(chǎn)業(yè)鏈,推動上下游協(xié)同發(fā)展,培育一批深耕行業(yè)的數(shù)據(jù)標注瞪羚企業(yè)、獨角獸企業(yè)。

  此外,還要持續(xù)優(yōu)化支撐體系,在加大財稅金融支持力度、推動數(shù)據(jù)標注服務納入政府采購范疇等方面,提升數(shù)據(jù)標注的公共服務能力。尤其是在人才培養(yǎng)上,要深化產(chǎn)學研融合,鼓勵行業(yè)聯(lián)盟、高校、科研院所與企業(yè)建立長期合作機制,進一步暢通人才發(fā)展通道,強化數(shù)據(jù)標注產(chǎn)業(yè)發(fā)展的人才支撐。 (作者:顧陽 來源:經(jīng)濟日報)

(責任編輯:符仲明)