中新經(jīng)緯3月29日電 (周奕航 謝婧雯)“Token已成為AI時代的‘貨幣’。人與AI交互,AI與AI協(xié)作,都以Token為核心媒介完成?!?026中關(guān)村論壇年會期間,摩爾線程相關(guān)技術(shù)負責(zé)人向中新經(jīng)緯表示。
隨著算力基礎(chǔ)設(shè)施的迭代與AI智能體應(yīng)用的爆發(fā),“Token”作為AI信息處理的計量單位,成為本屆中關(guān)村論壇的關(guān)鍵詞。
從概念到落地
3月25日,全國科學(xué)技術(shù)名詞審定委員會發(fā)布公告,將Token的中文名定為“詞元”,面向全社會發(fā)布試用。
“所有大模型均以Token為計量單位,Token就是AI的核心度量單位?!蓖貭査夹畔⒓夹g(shù)股份有限公司副總裁林松濤對中新經(jīng)緯表示,就像用電按度來計費一樣,Token就是AI里面的“度”,通過消耗電力等底層能源,最終轉(zhuǎn)化為Token輸出。
今年以來,以O(shè)penClaw(下稱龍蝦)為代表的AI智能體爆火,詞元需求迅速擴張。據(jù)國家數(shù)據(jù)局數(shù)據(jù),2024年初,中國日均Token調(diào)用量為1000億;至2025年底,躍升至100萬億;今年3月,已突破140萬億,兩年增長超千倍。
據(jù)第三方AI模型聚合平臺OpenRouter數(shù)據(jù),2026年3月9日至15日當(dāng)周,OpenClaw單家貢獻了平臺內(nèi)20%的詞元消耗量;其單周詞元消耗規(guī)模,相當(dāng)于2025年第四季度全平臺周均詞元消耗量的60%。
“龍蝦興起,進一步推動了人工智能算力使用模式的轉(zhuǎn)變,現(xiàn)在以推理為主、以服務(wù)為主,Token變得非常標(biāo)準(zhǔn)?!敝锌剖锕飧呒壐笨偛美畋笾赋?,這一變化源于AI算力使用模式的轉(zhuǎn)變,支撐AI發(fā)展的算力基礎(chǔ)設(shè)施,正逐漸從算力工廠變成詞元工廠。
在360集團創(chuàng)始人周鴻祎看來,Token是AI時代的數(shù)字能源,是算力轉(zhuǎn)化為智力的計量載體,與電力、算力同屬AI基建核心。他指出,算力是Token的生產(chǎn)基礎(chǔ),推理算力更是支撐Token消耗的關(guān)鍵,而Token的爆發(fā)又將倒逼算力升級?!氨举|(zhì)上,Token之爭就是算力之爭,底層更是電力和能源效率的競爭。”他稱。
周鴻祎對中新經(jīng)緯表示,龍蝦等智能體應(yīng)用爆火,是Token經(jīng)濟從概念到落地的標(biāo)志性事件?!褒埼r實現(xiàn)了用戶付費習(xí)慣教育,讓Token從行業(yè)技術(shù)指標(biāo)變?yōu)榍岸丝筛兄膬r值載體?!彼袛啵壳叭站?40萬億Token消耗僅是爆發(fā)起點,遠未到企業(yè)級規(guī)模化應(yīng)用階段。龍蝦等L5級智能體的暴力推理特性,將推動Token消耗進入指數(shù)增長通道。
周鴻祎進一步指出,當(dāng)前,AI的商業(yè)邏輯正在重構(gòu),其商業(yè)模式或?qū)⑥D(zhuǎn)向“按需付費”的Token經(jīng)濟?!皬幕ヂ?lián)網(wǎng)時代的流量經(jīng)濟到Agent時代的Token經(jīng)濟,背后是底層邏輯的質(zhì)變。流量經(jīng)濟是注意力經(jīng)濟,邊際成本趨近于零,不創(chuàng)造新生產(chǎn)力;Token經(jīng)濟是生產(chǎn)力計價,靠算力、芯片、電力支撐,用戶越多、消耗越大、成本越高?!彼f。
火山引擎官網(wǎng)顯示,AI音視頻互動方案Tokens的計費方式包括按實際消耗的Token數(shù)量計費以及資源包預(yù)付費兩種方式。其中,按實際消耗的Token數(shù)量計費方式單價為12元/百萬Tokens。華為云官網(wǎng)顯示,根據(jù)模型的版本不同,價格也不同;按套餐包付費,1個月期間,100萬Tokens原價為2.2元至5.6元,3個月期間,10億Tokens原價為2199元至5598元。
如何賺錢?
談及AI的商業(yè)化,榮耀具身智能首席營銷官王皚認為,Agent正在成為新的生產(chǎn)力,Agent在使用過程中又會產(chǎn)生大量的Token,未來也許有基于Token的AI商業(yè)閉環(huán)?!熬拖裼盟秒姲炊劝磭嵱嬞M,AI按Token計費,調(diào)用不同能力的模型,費用也會分級分層。”他稱。
“Token需要算力來做產(chǎn)出,但現(xiàn)在評價的維度和指標(biāo)變得更多了。原來一個算力系統(tǒng)的算力是一個評價指標(biāo),未來如何更經(jīng)濟地做Token產(chǎn)出,變成了評價指標(biāo)?!?026中關(guān)村論壇年會期間,中科曙光高級副總裁李斌向中新經(jīng)緯表示。
李斌表示,從用戶體驗的角度看,Token的核心在于響應(yīng)速度,即提出問題后,能否在短時間內(nèi)獲得反饋;而從算力運營者的視角出發(fā),則需要考慮Token能同時支撐多少用戶的并發(fā)訪問,并在高并發(fā)條件下依然保障基本的使用體驗。
周鴻祎認為,通過Token變現(xiàn)分為兩條路徑。其中,通用Token走普惠路線,依靠海量消耗實現(xiàn)薄利多銷,像水電一樣成為基礎(chǔ)服務(wù);而垂直場景、高價值任務(wù)的Token,則依托技術(shù)和場景壁壘形成高毛利,如安全、工業(yè)等領(lǐng)域?!昂诵氖翘嵘齌oken價值,以規(guī)?;龌A(chǔ),以技術(shù)溢價做增量。”
在摩爾線程相關(guān)技術(shù)負責(zé)人看來,Token經(jīng)濟的核心是人與AI、AI與AI的協(xié)作效率,核心商業(yè)閉環(huán)在于單位成本下的Token產(chǎn)出。
“我們不應(yīng)該只追求Token的數(shù)量,而是要關(guān)注性價比,要做到算得準(zhǔn)、算得快、算得穩(wěn)、算得安全,同時把Token成本壓到最低,這才是算力能用、好用的關(guān)鍵。”該負責(zé)人指出,隨著AI智能體邁入應(yīng)用元年,推理算力需求的增速遠高于訓(xùn)練。
值得一提的是,Token經(jīng)濟的規(guī)?;?,離不開算力這一底層支撐。之江實驗室副主任何水兵指出,算力規(guī)模的擴張并不等同于Token產(chǎn)出能力的同步提升?!罢{(diào)度瓶頸、通信與存儲性能短板等問題,均會影響算力釋放效率,拉低單位算力的Token產(chǎn)出效率。”他以H100萬卡集群為例,“年度算力成本約12億元人民幣,若算力利用率存在10%的損耗,年度直接經(jīng)濟損失將超1.2億元。”
無問芯穹聯(lián)合創(chuàng)始人兼首席執(zhí)行官夏立雪在AI開源前沿論壇上指出,當(dāng)前AI發(fā)展仍處于長期持續(xù)推進的過程中,其生命力取決于能否構(gòu)建可持續(xù)的Token供給體系。從基礎(chǔ)設(shè)施角度看,資源終究有限,站在“Token工廠”的視角,能否持續(xù)、穩(wěn)定、大規(guī)模地提供Token,讓頂尖模型真正長期服務(wù)更多下游場景,是一個關(guān)鍵問題。
小米大模型負責(zé)人羅福莉在AI開源前沿論壇上指出,由于大模型在飛速進步、加上Agent框架加持,2026年Token或迎來100倍增長。
李斌認為,隨著Token消耗的爆發(fā)式增長,算力需求將持續(xù)擴張。OpenClaw以來,Token消耗成倍增長。算力輸出標(biāo)準(zhǔn)化之后,需求增長是無限的。原來用戶需要高門檻調(diào)用算力,現(xiàn)在智能體作為使用接口,加上靈活的標(biāo)配型超節(jié)點,進一步降低了使用門檻,未來算力增長空間巨大。
(更多報道線索,請聯(lián)系本文作者周奕航:zhouyihang@chinanews.com.cn)(中新經(jīng)緯APP)
(文中觀點僅供參考,不構(gòu)成投資建議,投資有風(fēng)險,入市需謹慎。)
中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其他方式使用。