原標(biāo)題:我省上線數(shù)據(jù)集“體檢”平臺(tái)
人工智能企業(yè)和開發(fā)者如何更便捷地獲得可信、可用的高質(zhì)量數(shù)據(jù),從而訓(xùn)練出優(yōu)秀模型?11月21日,2025中國5G+工業(yè)互聯(lián)網(wǎng)大會(huì)“工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)暨數(shù)字身份平行論壇”上,數(shù)據(jù)標(biāo)注與高質(zhì)量數(shù)據(jù)集創(chuàng)新服務(wù)平臺(tái)正式落戶湖北,為湖北乃至全國人工智能產(chǎn)業(yè)提供“放心數(shù)據(jù)”和可靠的數(shù)據(jù)基礎(chǔ)設(shè)施支撐,讓AI企業(yè)和模型開發(fā)者匹配更精準(zhǔn)。
“如果說算法模型是AI的引擎,那么高質(zhì)量數(shù)據(jù)就是驅(qū)動(dòng)引擎的‘燃油’!敝袊畔⑼ㄐ叛芯吭汗I(yè)互聯(lián)網(wǎng)與物聯(lián)網(wǎng)研究所中部運(yùn)營中心主任黃子沛表示,平臺(tái)要破解的是當(dāng)前AI產(chǎn)業(yè)的核心痛點(diǎn):高質(zhì)量數(shù)據(jù)供給不足、標(biāo)準(zhǔn)不一、可信度難評(píng)估。
據(jù)介紹,該平臺(tái)對(duì)標(biāo)中國信通院《高質(zhì)量數(shù)據(jù) 質(zhì)量標(biāo)準(zhǔn)規(guī)范》,建立“文檔完整性—質(zhì)量合規(guī)性—場景適配性”三維評(píng)估體系,從完整性、準(zhǔn)確性、規(guī)范性、一致性、及時(shí)性等維度對(duì)數(shù)據(jù)集開展“體檢”。通過評(píng)估的數(shù)據(jù)集將獲得權(quán)威評(píng)估證書和報(bào)告,確保流通與使用的數(shù)據(jù)真正成為AI模型訓(xùn)練的“放心油”。
通過提供大模型基準(zhǔn)測試服務(wù),該平臺(tái)從行業(yè)、應(yīng)用、通用和安全四個(gè)維度進(jìn)行篩選,幫助湖北的企業(yè)科學(xué)地進(jìn)行模型選型,也讓模型開發(fā)者找到優(yōu)化方向,極大加速模型在政務(wù)、金融、工業(yè)等垂直領(lǐng)域的產(chǎn)業(yè)化落地。
業(yè)內(nèi)人士分析,平臺(tái)將降低AI研發(fā)門檻,吸引更多AI企業(yè)和項(xiàng)目在湖北集聚,形成產(chǎn)業(yè)集群效應(yīng)。同時(shí)助力湖北在快速發(fā)展的AI產(chǎn)業(yè)中,搶占“數(shù)據(jù)基礎(chǔ)設(shè)施”的制高點(diǎn),增強(qiáng)湖北在全國人工智能發(fā)展格局中的核心地位和競爭力。(記者劉柳、通訊員黎小雙)
長按二維碼關(guān)注精彩內(nèi)容





