3月25日,央視新聞發(fā)布“詞元”相關(guān)專(zhuān)家解答。
指出,“詞元”是人工智能大模型為了高效處理數(shù)據(jù),把數(shù)據(jù)進(jìn)行拆分后的最小信息單元,可以理解為一個(gè)字,或是一個(gè)詞,或是一個(gè)符號(hào)。
在人工智能時(shí)代,用戶(hù)輸入的每一個(gè)字,大模型生成的每一段話、識(shí)別的每一幅圖像,都在消耗詞元。
國(guó)家數(shù)據(jù)局相關(guān)負(fù)責(zé)人介紹,到今年3月,我國(guó)日均Token(詞元)的調(diào)用量已經(jīng)超過(guò)了140萬(wàn)億。
國(guó)家數(shù)據(jù)局專(zhuān)家咨詢(xún)委員會(huì)委員張向宏:
日均超140萬(wàn)億的詞元調(diào)用量,相當(dāng)于1000萬(wàn)億個(gè)中文詞匯,也相當(dāng)于250個(gè)中國(guó)國(guó)家圖書(shū)館的資源量。
國(guó)家發(fā)展改革委國(guó)家信息中心人工智能處工程師 蔡馳宇:
詞元日均調(diào)用量大幅增長(zhǎng),充分表明人工智能正加速?gòu)膶?shí)驗(yàn)室走向千行百業(yè)和千家萬(wàn)戶(hù),變成了實(shí)實(shí)在在的生產(chǎn)力工具,像水、電、網(wǎng)絡(luò)一樣,成為智能社會(huì)運(yùn)轉(zhuǎn)的基礎(chǔ)資源。詞元的消耗量是人工智能產(chǎn)業(yè)發(fā)展的重要指標(biāo)和“晴雨表”。
作為新生事物的詞元,也在催生新的機(jī)遇。
國(guó)家數(shù)據(jù)局負(fù)責(zé)人表示,以詞元計(jì)費(fèi)為基礎(chǔ)的新型商業(yè)邏輯正在加速演進(jìn)。
據(jù)了解,圍繞詞元的調(diào)用、分發(fā)與結(jié)算,一套新的價(jià)值體系正在加速演進(jìn)形成,并成為人工智能產(chǎn)業(yè)可能變現(xiàn)的重要路徑。
蔡馳宇:過(guò)去,一家企業(yè)使用信息服務(wù),就得購(gòu)買(mǎi)信息軟件,那是一次性購(gòu)買(mǎi)軟件的價(jià)格;現(xiàn)在一家企業(yè)同樣是使用信息服務(wù),它可能直接調(diào)用的是大模型的接口,用多少詞元,就付多少費(fèi)用,以詞元消耗量的多少作為計(jì)費(fèi)的依據(jù)。
與此同時(shí),專(zhuān)家表示,詞元消耗量增長(zhǎng)也對(duì)電力資源提出了更高需求。今年的政府工作報(bào)告中提出,實(shí)施算電協(xié)同等新基建工程。
張向宏:算電協(xié)同的本質(zhì)含義,就是要使用我們國(guó)家具有超前優(yōu)勢(shì)的綠電來(lái)發(fā)展我們的算力產(chǎn)業(yè)和人工智能產(chǎn)業(yè)。

