近日,國家數(shù)據(jù)局等權威機構在公開場合正式將Token的中文翻譯確定為“詞元”,這一AI時代的最小計量單位不僅完成了中文語境下的“身份漂白”,更憑借中國AI企業(yè)的極致算法與工程優(yōu)化,開啟了大規(guī)模出海的進程。
“詞元”正式普遍中文詞匯
長期以來,Token在中文語境下的翻譯處于混亂狀態(tài)。早期受加密貨幣熱潮影響,不少開發(fā)者將其生搬硬套為“代幣”或“令牌”。
然而,在生成式AI領域,Token的本質是模型處理語言的基本計算單元。將Token譯為‘代幣’不僅不貼切,更會造成公眾對其金融屬性的誤解。
隨著國家數(shù)據(jù)局局長在發(fā)布會上的明確定義,“詞元”一詞正式入編。它形象地傳達了其作為“語言原子”的邏輯:AI并不直接閱讀文字,而是將語言拆解為“詞元”,再轉化為數(shù)字進行運算。
這種翻譯上的正本清源,標志著AI技術正從極客“黑話”轉向社會公共基礎設施。
中國“詞元”席卷全球應用生態(tài)
在術語規(guī)范化的背后,是一場驚心動魄的全球商業(yè)競爭。根據(jù)2026年2月全球領先的AI API聚合平臺OpenRouter的數(shù)據(jù)顯示,中國AI大模型如DeepSeek、Qwen、GLM等的調用量發(fā)生了“歷史性反超”。
3月份第一周中國大模型調用總量達到4.19萬億“詞元”,較前一周大幅增長 34.9%;相比之下,美國大模型的調用量為3.63萬億Token,環(huán)比下滑8.5%。MiniMax的M2.5模型以1.87 萬億Token的調用量蟬聯(lián)全球榜首,環(huán)比增長15%。
3月第一周全球AI模型“詞元”調用量排行榜
令人側目的是,這其中近50%的活躍用戶來自美國。這意味著,由于中國“詞元”極高的性價比,大量海外開發(fā)者正通過API“套利”中國算力。
目前,性能相當?shù)闹袊P驮~元定價僅為美國的十分之一甚至二十分之一。在Agent和OpenClaw等AI深化應用日益普及的今天,完成一次復雜任務往往需要消耗數(shù)萬個“詞元”,這種巨大的成本鴻溝,正促使全球AI生態(tài)的重心向中國供給側偏移。
中國“詞元”的競爭優(yōu)勢更多源于“被逼出來的算法奇跡”。
在芯片受限的壓力下,中國團隊被迫放棄“暴力堆算力”的路線,極大地降低了推理時的內存占用,實現(xiàn)了同等硬件下更高的詞元產(chǎn)出。
另外,中國工程師通過對顯存管理和并行框架的極限壓榨,將每一塊顯卡的剩余價值利用到了極致。
更關鍵的是,中國有全球最強大的電力基礎建設,借助“東數(shù)西算”等工程,中國AI企業(yè)將計算中心布局在能源豐富的西部地區(qū),將充足的綠色電力轉化為廉價的“數(shù)字動力”向全球輸出。
專家認為,詞元之于AI時代,正如度數(shù)之于電表、桶之于石油。中國AI企業(yè)通過輸出極低成本的“詞元”,正在成為全球AI經(jīng)濟的“發(fā)電廠”。這種“逆向依賴”不僅構建了堅實的商業(yè)護城河,也為中國在未來全球AI分工體系中爭取到了關鍵的定價權與標準制定權。
AI的競爭的核心已不再僅僅是“誰更聰明”,更是“誰能以最低的成本,讓AI聰明地完成任務”。中國“詞元”的全球走紅,正是這一邏輯轉換的最好注腳。揚子晚報/紫牛新聞記者 宋世鋒
校對 胡妍璐