最近,Token這個詞特別火,Token中文名叫詞元。今年3月,國家數(shù)據(jù)局宣布,我國詞元的日均調(diào)用量突破140萬億,相比2024年初的1000億,增長了千倍。同月,中國AI大模型周詞元調(diào)用量連續(xù)三周超越美國。中國已成為全球AI應用活躍度最高的國家之一。就像刷手機要消耗流量一樣,越來越多的人每天也在消耗大量詞元。
詞元調(diào)用量大爆炸清晰地表明,人工智能時代已經(jīng)到來。那么,這對于我們普通人、對于社會發(fā)展意味著什么?要搞懂這一切,首先我們要弄明白什么是詞元?
中國信通院信息化與工業(yè)化融合研究所副所長黃偉:“它實際上是人工智能理解自然語言最小的基本單元?!?/p>
比如,我們問大模型“今天北京天氣怎么樣?”那么,大模型會把這句話拆分成“今天/北京/天氣/怎么樣/?/”5個詞元,一個詞元約等于1.5到2個字。從日常對話、文案創(chuàng)作、視覺生成,再到智能體自主執(zhí)行復雜任務,AI的應用場景不斷拓寬。
過去,我們很難為智力服務找到統(tǒng)一的計量單位,但是詞元的出現(xiàn)解決了這一難題。AI從此可計量、可定價、可交易。
我們現(xiàn)在所處的智能時代,正如百年前電力普及的前夜。時代從工業(yè)文明邁入智能文明,衡量發(fā)展的核心標尺也從千瓦時換成了詞元。
大模型公司或許最先感受到這股新浪潮的脈動。豆包是我國第一個,也是全球第三個日均詞元消耗突破100萬億的大模型,兩年增長千倍。我們走進這家公司內(nèi)部,看看詞元調(diào)用量為什么會大爆發(fā)?
火山引擎大模型解決方案負責人張?zhí)靹拢骸叭ツ辏赡艽蠹矣媚P瓦€都是問答、知識的獲取,簡單的AI搜索,今年已經(jīng)給模型提了大量非常復雜的任務,每一個任務的Token(詞元)量都是十倍、百倍增長。另一方面,現(xiàn)在AI所覆蓋和滲透的用戶越來越高,現(xiàn)在我們有幾億的用戶,每個月都在頻繁深度使用AI。”
不僅大量普通用戶在用,公司的工作人員每天也在大量消耗詞元。正如工業(yè)用電越多越有活力一樣,隨著AI技術的滲透和普及,詞元消耗必將越來越多。比如,每生成一分鐘720p的AI視頻,便會消耗上百萬詞元;各種“龍蝦”智能體一次復雜操作,也能輕輕松松“燒掉”幾十萬詞元。詞元已經(jīng)成為衡量個人和企業(yè)AI生產(chǎn)力以及數(shù)據(jù)要素利用效率的關鍵指標。
聯(lián)想智庫理事長、中國軟件行業(yè)協(xié)會AI終端智能體創(chuàng)新專業(yè)委員會主任委員阿不力克木·阿不力米提:“我有個大膽的預測,可能會出現(xiàn)新的大尺度單位值。它不會以小的Token為單元,然后給它加萬萬億、萬億億?!?/p>
張?zhí)靹拢骸?026年是一個新的起點,整個模型開始從簡單的生產(chǎn)效率提升,變成真正意義上的生產(chǎn)力兌現(xiàn)?!?/p>
事實上,越來越多的企業(yè)已經(jīng)將AI、大模型作為生產(chǎn)力工具,因此也帶來大量的詞元消耗。當AI時代來臨時,始建于1978年的寶鋼提出“以AI重新定義鋼鐵”。對于寶鋼而言,鋼鐵制造是主業(yè)。而要煉好一爐鋼十分不易,爐長是掌握“火候”的關鍵人物。想要培養(yǎng)一名優(yōu)秀的爐長至少需要5-10年時間。
煉鋼時,爐內(nèi)環(huán)境非常復雜,不僅高溫、高壓,還有復雜的物理、化學反應,如同一個“黑箱”。爐長靠豐富的經(jīng)驗來判斷爐況,不僅勞動強度大、風險高,而且還存在穩(wěn)定性差、難以量化等弊端。
中國寶武寶鋼股份煉鋼廠黨委書記、廠長張勝軍:“如果一爐鋼冶煉失敗,要造成回爐,少則幾萬元,多則幾十萬元的損失?!?/p>
為了解決這個問題,寶鋼研發(fā)出了“AI爐長”。它是寶鋼用幾十年積累的大數(shù)據(jù)“特訓”出來的工業(yè)大模型智能體,能利用數(shù)據(jù)實時感知“黑箱”的內(nèi)部狀態(tài);實時主動診斷和決策,鋼水溫度和成分控制命中率超過90%;它還能根據(jù)爐況自動調(diào)整操作參數(shù),變“被動應對”為“主動調(diào)控”。相當于用AI智能體來模擬傳統(tǒng)爐長的工作思路,無論訓練還是使用這個智能體,都必須消耗掉大量詞元。
中國寶武寶鋼股份中央研究院首席研究員于艷:“我們用的因素、參數(shù)、工藝參數(shù)有1800多個,用AI技術,能夠極大提高整個模型的精度,把他(爐長)的思考過程變成智能體的思考鏈。他(爐長)的決策可能基于他的經(jīng)驗,而我們的決策基于數(shù)據(jù),這樣的決策比爐長可能更精準?!?/p>
“AI爐長”將不可控的“黑箱”操作變?yōu)橥该?、可視、可控的智能化生產(chǎn)過程,顯著提升鋼水質(zhì)量,降低能耗與成本,同時將工人從高溫高危環(huán)境中逐步解放出來,這項AI技術已經(jīng)達到國際先進水平。嘗到AI技術紅利的寶鋼,開發(fā)出了包括“AI爐長”在內(nèi)的120多個智能體,涵蓋生產(chǎn)、運營、市場營銷等方方面面。它們像數(shù)字員工一樣不知疲倦地工作,付出的代價正是大量的詞元。
中國寶武寶鋼股份數(shù)據(jù)AI部部長吳文彬:“專業(yè)的一些智能體每天大概有兩三千萬的Token(詞元)消耗量,復雜的智能體訓練一周,有可能是上億的Token(詞元)消耗?!?/p>
在“AI重新定義鋼鐵”的戰(zhàn)略下,公司將閑置的舊廠房改造成大型智算中心與云平臺,整體算力規(guī)模高達300P。如今,寶鋼一邊堅守主業(yè)、淬煉鋼鐵,一邊依托集團的算力底座,深耕產(chǎn)業(yè)智能化,以智能算力賦能鋼鐵全產(chǎn)業(yè)鏈轉(zhuǎn)型升級。
事實上,詞元不僅滲透到互聯(lián)網(wǎng)、大模型、制造業(yè)等,也借助AI悄然滲透到我們熟悉的服務業(yè),只是你或許還沒有察覺到。對銀行客戶經(jīng)理來說,每天都要面對不同客戶的差異化需求,從海量金融產(chǎn)品里找到最合適的方案。搜數(shù)據(jù)、做分析、出方案,過去這些工作基本靠人工,但是現(xiàn)在已經(jīng)徹底改變。
中國工商銀行北京市分行個人客戶經(jīng)理張語涵:“我們有個人金融AI助理,它可以協(xié)助我們將客戶的需求跟產(chǎn)品做匹配,后期再結合專業(yè)知識做更好融合。(過去)我們可能需要花1小時,現(xiàn)在時間成本可以縮短到2到3分鐘?!?/p>
效率倍增的秘密正是智能體,而要運行智能體就必將消耗大量的詞元。而真正的詞元“吞金獸”是對公業(yè)務。在交易大廳里,每分每秒都在參與全球資金交易。以對客外匯交易業(yè)務為例,通過交易智能體,已經(jīng)實現(xiàn)了交易的全流程自動化。
中國工商銀行金融市場部數(shù)字化轉(zhuǎn)型發(fā)展處高級交易經(jīng)理常樂:“智能詢價交易比率現(xiàn)在已經(jīng)超過了96%,客戶詢價交易全流程的用時降至了分鐘級。相較傳統(tǒng)模式,對客服務的能力和效率提升了數(shù)倍,此外,我們還應用AI技術在銀行間市場開展匯率、利率等交易?!?/p>
在公眾看不到的地方,大量消耗的詞元正化作源源不斷的推進劑,推動金融業(yè)加速前進。
中國工商銀行金融科技部副總經(jīng)理金海旻:“2026年初,全行業(yè)務應用日均Token(詞元)消耗量達到了百億級,較兩年前增長了近百倍。覆蓋了前臺客戶經(jīng)理、中臺風控審核人員、后臺運營人員等主要崗位。”
就像百年前,電力剛走進我們生活一樣,如今的詞元大爆炸僅僅是開始。隨著算力基建持續(xù)完善,AI向千行百業(yè)深度滲透,詞元也如同當年的用電量一般,深度重塑產(chǎn)業(yè)格局。值得一提的是,雖然我國詞元調(diào)用量快速增長,但是在大模型、AI芯片以及高質(zhì)量數(shù)據(jù)上,還有較大的提升空間。專家表示,一個以詞元為核心計價單位的萬億級規(guī)模的市場正在加速形成。一場更大范圍、更深層次的智能化變革才剛剛啟程。
就像電力重塑工業(yè)文明,如今的詞元大爆炸,正在開啟人類全新的智能時代。為了滿足全社會對詞元的需求,目前我國正在打造國家算力網(wǎng),與水網(wǎng)、新型電網(wǎng)等一起并列為國家“六張網(wǎng)”之一,納入“十五五”規(guī)劃。你可以把它理解成一座“超級詞元工廠”,將整合全國算力資源,持續(xù)穩(wěn)定輸出海量詞元,為智能時代的發(fā)展提供源源不斷的動力。當全國算力真正“并網(wǎng)發(fā)電”,一場更深層次、更大范圍的智能革命,也將拉開大幕。