7月28日晚,北京智譜華章科技股份有限公司(以下簡稱"智譜AI")發(fā)布其新一代旗艦大模型GLM-4.5,這是一款專為智能體應用打造的基礎模型,在復雜推理、代碼生成及智能體交互等通用能力上實現能力融合與技術突破,綜合測試性能已躋身全球領先行列。
這款新模型的發(fā)布,代表了AI邁向通用人工智能的一次重要轉變。它不再滿足于扮演一個被動回答問題的“聊天機器人”,而是要成為能夠理解復雜目標、自主規(guī)劃并執(zhí)行多步驟任務的“全優(yōu)生”。例如,模型能夠勝任全棧開發(fā)任務,一鍵生成較為復雜的應用、游戲、交互網頁。在實際例子中,用戶通過z.ai使用該模型時,僅用一句簡單的指令,就可讓GLM-4.5獨立開發(fā)出具備搜索功能的“谷歌”網站、可以發(fā)彈幕的“B站”,甚至直接上線一個完整的“Flappy Bird”小游戲。
在性能評估中,GLM-4.5的表現展示了其架構優(yōu)勢。在涵蓋研究生水平推理和復雜軟件工程解題等12項全球公認的硬核測試中,其綜合得分位列全球第三,在所有國產模型和開源模型中均排名第一。
大型語言模型性能評估表,包含智能體、推理與編碼基準測試數據(圖源:智譜)
該款旗艦大模型發(fā)布僅十小時,便引發(fā)全球外媒關注。價格因素同樣是關注焦點,報道普遍聚焦該模型 “成本更低、性能更優(yōu)” 的特性,部分媒體還對其參數進行了詳細解析與同類對比。目前該系列模型API調用價格低至輸入0.8元/百萬tokens、輸出2元/百萬tokens,遠低于市場主流價格。
28日模型發(fā)布后不到兩個小時,X平臺就在首頁推薦了這款中國大模型。CNBC在28日報道稱:“中國企業(yè)正在研發(fā)的人工智能模型不僅智能化水平提升,使用成本也持續(xù)降低,這與深度求索(DeepSeek)當年震動市場的突破核心優(yōu)勢相呼應。” 路透社28日在報道中提到,作為中國 “AI 六小虎” 之一的智譜,自今年6月被OpenAI“點名”后便備受關注。彭博社表示,OpenAI的挑戰(zhàn)者智譜AI發(fā)布開源模型,試圖在這個蓬勃發(fā)展的行業(yè)中搶占制高點。另一家美國知名科技媒體VentureBeat則在文章中指出:“GLM-4.5的發(fā)布為企業(yè)團隊提供了一個可行的、高性能的基礎模型。對于平衡創(chuàng)新和運營限制的團隊來說,這是一個令人信服的選擇。”發(fā)布后不到12小時,GLM-4.5模型已經位列國際開源社區(qū)Hugging-Face榜單全球第二。《環(huán)球時報》針對于該款模型進行整版報道,受到國內外業(yè)界高度關注。
美國科技網站Techi 認為,中國AI發(fā)展正清晰呈現 “易獲取” 的趨勢:“智譜努力與深度求索、OpenAI等行業(yè)巨頭同臺競技。隨著更多企業(yè)推出開源模型并壓低價格,中國正逐步成為全球AI競爭的核心參與者,力爭占據領先地位。未來幾個月,這些快速變化將帶來何種影響——是催生新的監(jiān)管政策,還是推動新的技術創(chuàng)新,仍有待觀察。”
受到大模型關注的除了這款大模型的性能,還有一個最大亮點是這是首款原生融合模型,首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。
大語言模型的目標是在廣泛領域達到人類認知水平。然而,現有模型仍然算不上真正的通用模型:有些擅長編程,有些精于數學,有些在推理方面表現出色,但沒有一個能在所有任務上都達到最佳表現。GLM-4.5正是朝著統一各種能力這一目標努力,力求在一個模型中集成所有這些不同的能力。大模型的下一個范式,一定是把各種能力整合到一起,成為一個“全優(yōu)生”。
其次這款模型擁有更高的參數效率。GLM-4.5的參數量僅為一些主流模型的一半甚至三分之一,但在多項標準基準測試中表現得更為出色。在衡量模型代碼能力的SWE-bench Verified 榜單上,GLM-4.5系列位于性能/參數比帕累托前沿,這表明在相同規(guī)模下,GLM-4.5系列實現了最佳性能。
目前,這款集高性能、低成本和開源特性于一體的模型已在智譜開放平臺上線。用戶可通過智譜大模型開放平臺使用該模型,其開源版本也將同步登陸Hugging Face與ModelScope平臺。
7月28日晚,北京智譜華章科技股份有限公司(以下簡稱"智譜AI")發(fā)布其新一代旗艦大模型GLM-4.5,這是一款專為智能體應用打造的基礎模型,在復雜推理、代碼生成及智能體交互等通用能力上實現能力融合與技術突破,綜合測試性能已躋身全球領先行列。
這款新模型的發(fā)布,代表了AI邁向通用人工智能的一次重要轉變。它不再滿足于扮演一個被動回答問題的“聊天機器人”,而是要成為能夠理解復雜目標、自主規(guī)劃并執(zhí)行多步驟任務的“全優(yōu)生”。例如,模型能夠勝任全棧開發(fā)任務,一鍵生成較為復雜的應用、游戲、交互網頁。在實際例子中,用戶通過z.ai使用該模型時,僅用一句簡單的指令,就可讓GLM-4.5獨立開發(fā)出具備搜索功能的“谷歌”網站、可以發(fā)彈幕的“B站”,甚至直接上線一個完整的“Flappy Bird”小游戲。
在性能評估中,GLM-4.5的表現展示了其架構優(yōu)勢。在涵蓋研究生水平推理和復雜軟件工程解題等12項全球公認的硬核測試中,其綜合得分位列全球第三,在所有國產模型和開源模型中均排名第一。
大型語言模型性能評估表,包含智能體、推理與編碼基準測試數據(圖源:智譜)
該款旗艦大模型發(fā)布僅十小時,便引發(fā)全球外媒關注。價格因素同樣是關注焦點,報道普遍聚焦該模型 “成本更低、性能更優(yōu)” 的特性,部分媒體還對其參數進行了詳細解析與同類對比。目前該系列模型API調用價格低至輸入0.8元/百萬tokens、輸出2元/百萬tokens,遠低于市場主流價格。
28日模型發(fā)布后不到兩個小時,X平臺就在首頁推薦了這款中國大模型。CNBC在28日報道稱:“中國企業(yè)正在研發(fā)的人工智能模型不僅智能化水平提升,使用成本也持續(xù)降低,這與深度求索(DeepSeek)當年震動市場的突破核心優(yōu)勢相呼應。” 路透社28日在報道中提到,作為中國 “AI 六小虎” 之一的智譜,自今年6月被OpenAI“點名”后便備受關注。彭博社表示,OpenAI的挑戰(zhàn)者智譜AI發(fā)布開源模型,試圖在這個蓬勃發(fā)展的行業(yè)中搶占制高點。另一家美國知名科技媒體VentureBeat則在文章中指出:“GLM-4.5的發(fā)布為企業(yè)團隊提供了一個可行的、高性能的基礎模型。對于平衡創(chuàng)新和運營限制的團隊來說,這是一個令人信服的選擇。”發(fā)布后不到12小時,GLM-4.5模型已經位列國際開源社區(qū)Hugging-Face榜單全球第二。《環(huán)球時報》針對于該款模型進行整版報道,受到國內外業(yè)界高度關注。
美國科技網站Techi 認為,中國AI發(fā)展正清晰呈現 “易獲取” 的趨勢:“智譜努力與深度求索、OpenAI等行業(yè)巨頭同臺競技。隨著更多企業(yè)推出開源模型并壓低價格,中國正逐步成為全球AI競爭的核心參與者,力爭占據領先地位。未來幾個月,這些快速變化將帶來何種影響——是催生新的監(jiān)管政策,還是推動新的技術創(chuàng)新,仍有待觀察。”
受到大模型關注的除了這款大模型的性能,還有一個最大亮點是這是首款原生融合模型,首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。
大語言模型的目標是在廣泛領域達到人類認知水平。然而,現有模型仍然算不上真正的通用模型:有些擅長編程,有些精于數學,有些在推理方面表現出色,但沒有一個能在所有任務上都達到最佳表現。GLM-4.5正是朝著統一各種能力這一目標努力,力求在一個模型中集成所有這些不同的能力。大模型的下一個范式,一定是把各種能力整合到一起,成為一個“全優(yōu)生”。
其次這款模型擁有更高的參數效率。GLM-4.5的參數量僅為一些主流模型的一半甚至三分之一,但在多項標準基準測試中表現得更為出色。在衡量模型代碼能力的SWE-bench Verified 榜單上,GLM-4.5系列位于性能/參數比帕累托前沿,這表明在相同規(guī)模下,GLM-4.5系列實現了最佳性能。
目前,這款集高性能、低成本和開源特性于一體的模型已在智譜開放平臺上線。用戶可通過智譜大模型開放平臺使用該模型,其開源版本也將同步登陸Hugging Face與ModelScope平臺。
本文鏈接:http://m.9105763.cn/v-146-4402.html“北京造”大模型GLM-4.5開源 綜合性能世界領先
相關文章:
朋友圈感謝的文案12-23
體會成長的句子10-17
護士200字個人總結05-15
押運工作年終總結12-14
項目經理廉潔述職報告08-23
電子行業(yè)品管員個人年終總結08-09
五一勞動節(jié)晚會策劃書04-21
在職證明07-27
會計簡歷01-19
小學英語廣播稿12-07
《阿拉丁神燈》讀后感10-11
小學二年級語文老師家長會發(fā)言稿10-05
春天的小學二年級作文02-19
龜兔賽跑續(xù)寫小學作文02-12
越野車比賽作文09-28
做更好的自己作文09-21
2025年3月山東計算機等級考試時間:3月29日-30日01-02
文科生跨考軟件工程研究生,會有導師要嗎12-16
陜西藝術職業(yè)學院宿舍條件怎么樣,有空調嗎(含宿舍圖片)10-08
房產納稅評估范文8篇08-15