中新網(wǎng)北京2月17日電 (記者 尹倩蕓)中國科技公司又“過大年”。
除夕當天,阿里巴巴開源全新一代大模型千問Qwen3.5-Plus,該版本總參數(shù)3970億,激活僅170億,部署顯存占用降低60%,在保持能力的同時優(yōu)化速度與成本。
Qwen3.5-Plus整體能力媲美Gemini3 Pro,在多項權威基準測試中刷新開源模型紀錄,API(應用程序接口)價格每百萬Token(字符)低至0.8元,僅為Gemini3 Pro的1/18。
值得注意的是,千問3.5在文本和視覺的混合數(shù)據(jù)上預訓練,實現(xiàn)了原生多模態(tài)的新突破,在推理、編程、Agent智能體等全方位基準評估中均表現(xiàn)優(yōu)異,并在視覺理解能力的權威評測中斬獲數(shù)項性能最佳。
在春節(jié)假期到來前,中國科技公司就已開始密集“上新”:智譜宣布上線并開源GLM-5,并稱這款模型為“Agentic Engineering時代最好的開源模型”;科大訊飛和MiniMax也帶來新模型,分別是基于全國產(chǎn)算力訓練的星火X2大模型和M2.5模型,而M2.5在處理復雜任務時展現(xiàn)出了更高的決策成熟度。
字節(jié)跳動新一代AI視頻生成模型Seedance2.0近期也站到了聚光燈下,其憑借多模態(tài)創(chuàng)作方式、自帶運鏡的呈現(xiàn)效果,迅速在全球范圍內(nèi)引發(fā)高度關注。
這并非中國科技公司第一押注“春節(jié)檔”,回望2025年的春節(jié)假期,彼時阿里云通義團隊發(fā)布Qwen2.5-Max,這是其大模型的全新版本升級,DeepSeek(深度求索)迎來大量新平臺的接入上架,熱度持續(xù)升溫。
上海財經(jīng)大學特聘教授胡延平認為,今年發(fā)的新模型都越來越“多能實用”,原生多模態(tài)+智能體能力,代碼、多語言等方面表現(xiàn)均衡,甚至空間智能、視覺推理也可用,同等“質(zhì)素”只需過去三分之一的體量,解碼吞吐量卻又數(shù)倍增長,這些都讓部署和使用省去很多麻煩,效率也提高很多。
業(yè)界認為,Qwen3.5的意義不止于“又刷新了一次榜單”。過去兩年,大模型行業(yè)信奉“大力出奇跡”,參數(shù)從千億堆向萬億,性能在漲,但代價也在漲。部署應用專用集群,推理要燒算力,中小企業(yè)用不起,技術越來越強,但離真正好用越來越遠。Qwen3.5的思路則是,不比誰更大,而是比誰更聰明,比誰能用相對更小的模型,借助技術創(chuàng)新,獲得更大的智能。
融合亦是另一大看點,也遠遠超出“讀懂一張圖”。Qwen3.5能對圖像進行像素級空間定位與代碼級精細處理,能理解長達2小時視頻中的時序演變與因果關系,能將一張手繪草圖直接轉(zhuǎn)化為可運行的前端代碼,甚至可以作為視覺智能體自主操控手機與電腦、跨應用完成多步驟復雜任務。
如此從識別到理解、從單模態(tài)到跨模態(tài)推理,這料將為后續(xù)更自然、更一致的多模態(tài)生成與推理打下了堅實基礎。
目前,千問模型的開源數(shù)量超400個,衍生模型數(shù)量突破20萬個,下載量突破10億次,遠超美國的Llama,包括李飛飛團隊、愛彼迎等全球公司和機構都在使用千問模型。
中國工程院院士倪光南近期就表示,開源已經(jīng)成為全球信息技術發(fā)展的強大動力,在新興的、大模型引領的人工智能領域,開源表現(xiàn)強勁。中國已經(jīng)成為全球開源大模型的最大提供者,如中國的 Qwen、DeepSeek、Kimi等都在 AI模型評估平臺 LMArena的排名中名列前茅。
他還提到,一些中國企業(yè)引領的開源社區(qū)在國際上蓬勃發(fā)展,在 AI時代展現(xiàn)出勃勃生機。中國企業(yè)積極擁抱開源理念,成為全球開源大模型創(chuàng)新的引領者。(完)