“AI大牛股”公開(kāi)技術(shù)細(xì)節(jié)。“全球大模型第一股”智譜正式發(fā)布了GLM-5技術(shù)報(bào)告。智譜表示,GLM-5能夠?qū)崿F(xiàn)性能的大幅躍升,主要得益于四大技術(shù)創(chuàng)新。GLM-5在真實(shí)世界編程任務(wù)中展現(xiàn)出前所未有的能力,在處理端到端軟件工程挑戰(zhàn)方面超越了此前所有開(kāi)源基線。
股價(jià)表現(xiàn)方面,周五(2月20日),智譜股價(jià)單日大漲42.72%,報(bào)725港元/股,股價(jià)再創(chuàng)新高,總市值達(dá)3232億港元,上市43天股價(jià)累計(jì)漲幅已超500%。消息面上,在發(fā)布GLM-5后,由于供不應(yīng)求,智譜宣布上調(diào)GLM Coding Plan套餐價(jià)格,中國(guó)區(qū)漲價(jià)30%,海外版漲價(jià)超100%。
2月22日下午,據(jù)智譜官微消息,智譜推出了GLM-5,這是一款旨在推動(dòng)編程范式從“VibeCoding”(氛圍編程)轉(zhuǎn)向“AgenticEngineering”(智能體工程)的下一代基礎(chǔ)模型。GLM-5在前代模型GLM-4.5的智能體、推理與編程(Agentic,ReasoningandCoding,ARC)能力基礎(chǔ)上,采用稀疏注意力(DeepSeekSparseAttention,DSA)以大幅降低推理成本,同時(shí)保持長(zhǎng)上下文能力無(wú)損。

為了讓模型更好地與各類任務(wù)對(duì)齊,智譜構(gòu)建了一套新型異步強(qiáng)化學(xué)習(xí)(RL)基礎(chǔ)設(shè)施,通過(guò)將生成過(guò)程與訓(xùn)練過(guò)程解耦,從而大幅提升了后訓(xùn)練的迭代效率。此外,智譜還提出了全新的異步Agent強(qiáng)化學(xué)習(xí)算法,進(jìn)一步提升強(qiáng)化學(xué)習(xí)的效果,使模型能夠更有效地從復(fù)雜、長(zhǎng)程交互中學(xué)習(xí)。
智譜稱,基于上述創(chuàng)新,GLM-5在主流的開(kāi)放基準(zhǔn)測(cè)試中實(shí)現(xiàn)了SOTA性能。最關(guān)鍵的是,GLM-5在真實(shí)世界編程任務(wù)中展現(xiàn)出前所未有的能力,在處理端到端軟件工程挑戰(zhàn)方面超越了此前所有開(kāi)源基線。
智譜指出,GLM-5在性能與計(jì)算效率上實(shí)現(xiàn)了躍升,不僅在ArtificialAnalysis.ai、LMArena文本與代碼等主要榜單中均達(dá)到SOTA水平,更重塑了真實(shí)世界的編程標(biāo)準(zhǔn)。它突破了SWE-bench等傳統(tǒng)靜態(tài)測(cè)評(píng)的考察邊界,在處理復(fù)雜的端到端軟件開(kāi)發(fā)任務(wù)時(shí),展現(xiàn)出了前所未有的強(qiáng)大能力。
據(jù)GLM-5技術(shù)報(bào)告,GLM-5能夠?qū)崿F(xiàn)性能的大幅躍升,主要得益于以下四大技術(shù)創(chuàng)新:
第一,引入DSA稀疏注意力機(jī)制(DeepSeekSparseAttention,DSA)。這一全新架構(gòu)極大降低了訓(xùn)練與推理成本。此前的GLM-4.5依賴標(biāo)準(zhǔn)MoE架構(gòu)提升效率,而DSA機(jī)制則使GLM-5能夠根據(jù)Token的重要性動(dòng)態(tài)分配注意力資源。在不折損長(zhǎng)上下文理解和推理深度的前提下,算力開(kāi)銷得以大幅削減。得益于此,智譜將模型參數(shù)規(guī)模成功擴(kuò)展至744B(7440億),同時(shí)將訓(xùn)練Token規(guī)模提升至28.5T(28.5萬(wàn)億)。
第二,構(gòu)建全新的異步RL基礎(chǔ)設(shè)施?;贕LM-4.5時(shí)期slime框架“訓(xùn)練與推理解耦”的設(shè)計(jì),智譜的新基建進(jìn)一步實(shí)現(xiàn)了“生成與訓(xùn)練”的深度解耦,將GPU利用率推向極致。該系統(tǒng)支持模型開(kāi)展大規(guī)模的智能體(Agent)軌跡探索,大幅減緩了以往拖慢迭代速度的同步瓶頸,讓RL后訓(xùn)練流程的效率實(shí)現(xiàn)了質(zhì)的飛躍。
第三,提出全新的異步AgentRL算法。該算法旨在全面提升模型的自主決策質(zhì)量。GLM-4.5曾依靠迭代自蒸餾和結(jié)果監(jiān)督來(lái)訓(xùn)練Agent;而在GLM-5中,智譜研發(fā)的異步算法使模型能夠從多樣化的長(zhǎng)周期交互中持續(xù)學(xué)習(xí)。這一算法針對(duì)動(dòng)態(tài)環(huán)境下的規(guī)劃與自我糾錯(cuò)能力進(jìn)行了深度優(yōu)化,這也正是GLM-5能夠在真實(shí)編程場(chǎng)景中表現(xiàn)卓越的底層邏輯。
第四,全面擁抱國(guó)產(chǎn)算力生態(tài)。從模型發(fā)布伊始,GLM-5就原生適配了中國(guó)GPU生態(tài)。智譜已完成從底層內(nèi)核到上層推理框架的深度優(yōu)化,全面兼容七大主流國(guó)產(chǎn)芯片平臺(tái):華為昇騰、摩爾線程、海光、寒武紀(jì)、昆侖芯、天數(shù)智芯與燧原。
智譜表示,“憑借上述進(jìn)步,GLM-5不僅是一個(gè)更強(qiáng)大的模型,更是下一代AI Agent 更高效、更實(shí)用的基礎(chǔ)模型。我們向社區(qū)開(kāi)源GLM-5,以進(jìn)一步推動(dòng)高效的、面向 Agent 的通用人工智能的發(fā)展?!?/p>
2月21日晚間,智譜在“智譜開(kāi)放平臺(tái)”微信公眾號(hào)發(fā)布GLM Coding Plan致歉信,并公布處理和補(bǔ)償方案。
智譜稱,這次改版主要犯了三個(gè)錯(cuò):規(guī)則透明度不夠、GLM-5灰度節(jié)奏太慢、老用戶升級(jí)機(jī)制設(shè)計(jì)粗糙。
GLM Coding Plan是智譜專門為AI編程場(chǎng)景推出的付費(fèi)訂閱套餐服務(wù),開(kāi)發(fā)者訂閱后,可以使用智譜提供的大模型來(lái)輔助寫代碼。套餐等級(jí)通常分為L(zhǎng)ite、Pro、Max三個(gè)等級(jí),對(duì)應(yīng)不同的使用額度和模型權(quán)限。
據(jù)了解,GLM Coding Plan上線即售罄,國(guó)產(chǎn)AI編程模型的付費(fèi)套餐被搶空,在行業(yè)中頗為罕見(jiàn)。
需求火爆導(dǎo)致GLM Coding Plan的用戶體驗(yàn)受到影響。在致歉信中,智譜解釋稱,其近期遭受灰產(chǎn)號(hào)池和黃牛黨沖擊,惡意占用了公司大量資源。同時(shí),GLM-5發(fā)布后,流量超出預(yù)期,公司擴(kuò)容節(jié)奏沒(méi)有跟上,不得已將GLM-5按照Max、Pro、Lite的順序逐步開(kāi)放。
目前Max用戶已經(jīng)全面開(kāi)放,Pro用戶雖已開(kāi)放,但高峰期可能會(huì)因集群負(fù)載較高遇到限流,Lite用戶將會(huì)在節(jié)后非高峰期逐步灰度開(kāi)放。
針對(duì)受到影響的Lite和Pro用戶,智譜支持自主申請(qǐng)退款。
此前在2月12日,智譜發(fā)布新一代旗艦?zāi)P虶LM-5,并在海外走紅。在Coding與Agent能力上,GLM-5取得開(kāi)源SOTA表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近Claude Opus4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)。
在發(fā)布GLM-5后,由于供不應(yīng)求,智譜宣布上調(diào)GLM Coding Plan套餐價(jià)格,中國(guó)區(qū)漲價(jià)30%,海外版漲價(jià)超100%,成為國(guó)內(nèi)首家對(duì)大模型商業(yè)化服務(wù)進(jìn)行提價(jià)的AI原生企業(yè)。
來(lái)源:財(cái)聯(lián)社





掃一掃分享本頁(yè)

