記者從國家數(shù)據(jù)局獲悉:中文數(shù)據(jù)在國內(nèi)大模型的訓(xùn)練性能提升方面發(fā)揮著重要作用。國內(nèi)多數(shù)模型訓(xùn)練使用的中文數(shù)據(jù)占比已經(jīng)超過60%,有的模型達(dá)到80%。中文高質(zhì)量數(shù)據(jù)的開發(fā)和供給能力持續(xù)增強(qiáng),推動(dòng)我國人工智能模型性能快速提升。
在人工智能時(shí)代,Token(通常所說的詞元)是處理文本的最小數(shù)據(jù)單元。國家數(shù)據(jù)局局長劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已經(jīng)突破30萬億,1年半時(shí)間增長了300多倍,反映了我國人工智能應(yīng)用規(guī)模的快速增長。
Copyright ? 2001-2025 湖北荊楚網(wǎng)絡(luò)科技股份有限公司 All Rights Reserved
互聯(lián)網(wǎng)新聞信息許可證 42120170001 -
增值電信業(yè)務(wù)經(jīng)營許可證 鄂B2-20231273 -
廣播電視節(jié)目制作經(jīng)營許可證(鄂)字第00011號(hào)
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證 1706144 -
互聯(lián)網(wǎng)出版許可證 (鄂)字3號(hào) -
營業(yè)執(zhí)照
鄂ICP備 13000573號(hào)-1 鄂公網(wǎng)安備 42010602000206號(hào)
版權(quán)為 荊楚網(wǎng) m.fysf168.com 所有 未經(jīng)同意不得復(fù)制或鏡像