5月7日,騰訊混元公布最新數(shù)據(jù),自上線以來,Hy3 preview 的 Token 調(diào)用量持續(xù)增加,目前總量已經(jīng)超過上一代版本模型 Hy2 的 10 倍,尤其是代碼和智能體類場景的 Token 調(diào)用量增加明顯,并且騰訊的 WorkBuddy/Codebuddy 以及 Qclaw 類應(yīng)用中的總增長幅度超過16.5倍。
此外,來自 OpenRouter 的公開數(shù)據(jù)顯示,Hy3 preview 在過去一周的Token 調(diào)用量排到了周榜總榜以及市場占有率“雙第一”,并且在編程和工具調(diào)用場景下的調(diào)用量也排在榜首。
OpenRouter 模型調(diào)用周榜(5月7日)
騰訊混元負(fù)責(zé)人表示:“Hy3 preview主打?qū)嵱?,為了搜集用戶反饋,了解模型在真?shí)場景中效果,Hy3 preview 在上線之初便在 OpenRouter 開啟限免活動,方便開發(fā)者免費(fèi)試用模型。 在這個過程中,我們看到模型的調(diào)用量持續(xù)增長,同時也搜集到不少正負(fù)面反饋,這為模型的后續(xù)迭代提供了方向,要特別感謝開發(fā)者對混元的關(guān)注和認(rèn)可?!?/p>
在社交媒體上,不少用戶對 Hy3 preview 給出了積極的評價,比如:“模型在工具調(diào)用的成功率、代碼生成的可靠性上表現(xiàn)優(yōu)秀”,“是一個‘Agent-First’的模型”,同時“模型在指令遵循上準(zhǔn)確性上也令人印象深刻”。
Hy3 preview 是騰訊混元進(jìn)行技術(shù)重構(gòu)后推出的首個模型,采用快慢思考融合的混合專家(MoE)架構(gòu),總參數(shù)量達(dá) 2950億,激活參數(shù)量為210億,支持 256K 的長上下文窗口。
大模型調(diào)用量的爆發(fā)式增長往往與“技術(shù)效能”強(qiáng)相關(guān)。性能上,騰訊業(yè)務(wù)此前的測試結(jié)果顯示,在 CodeBuddy 和 WorkBuddy 等智能體應(yīng)用中,Hy3 preview 的首次響應(yīng)速度提升了54%,任務(wù)平均完成時間縮短47%,任務(wù)成功率維持在99.99%的高位。此外,接入該模型的騰訊文檔 AI PPT 功能,其生成成功率較上一代提升了20%。目前,Hy3 preview 已全面接入騰訊多個產(chǎn)品,包括騰訊元寶、QQ瀏覽器、微信讀書等多個業(yè)務(wù)場景。
值得注意的是,除了騰訊業(yè)務(wù)外,在 OpenRouter 公布的 Hy3 preview 調(diào)用量最多的 APP 排行榜上,前 5 名均為國際主流智能體和代碼類應(yīng)用。
雅菲 曉風(fēng)
校對 王菲