騰訊混元Hy3 preview發佈並開源：首個模型Agent -香港商报

香港商报官网 > 广东 > 特别报道

騰訊混元Hy3 preview發佈並開源：首個模型Agent能力大幅提升

2026-04-23

来源：香港商報網

　4 月 23 日，騰訊混元 Hy3 preview 語言模型發佈並開源。這是一個快慢思考融合的混合專家模型，總參數 295B，激活參數 21B，最大支持 256K 上下文長度。據了解，這是混元重建後訓練的第一個模型，也是混元迄今最智能的模型，在複雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。

图片1.jpg

　2026年2月，騰訊混元重建了預訓練和強化學習的基礎設施，以及模型追求實用性的三個原則：

　1、能力體系化：不推崇「偏科」，因為即使是代碼智能體的單一應用，也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。

　2、評測真實性：主動跳出易被「刷榜」的公開榜單，通過自建題目、最新考試、人工評測、產品眾測等多種方式評估和改進模型的「真實戰鬥力」。

　3、性價比追求：實用性離不開商業合理性，深度協同模型架構和推理框架的設計，大幅降低任務成本，讓智能用得起、用得好。

图片2.jpg

　可以視為混元快速探索實用性大模型、解決真實世界問題的一個開端。

　騰訊首席AI科學家姚順雨表示：Hy3 preview是混元大模型重建的第一步。我們希望通過這次開源和發佈，獲得來自開源社區和用戶的真實反饋，幫助我們提升 Hy3 正式版的實用性。與此同時，我們也在繼續擴大預訓練和強化學習的規模，提升模型的智能上限，並通過與騰訊眾多產品的深度Co-Design，持續提升模型在真實場景中的綜合表現，並開始探索特色模型能力。

　目前，Hy3 preview 已在騰訊雲、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發上線，微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續上線。另外，Hy3 preview 支持接入流行的開源智能體產品，如 OpenClaw、OpenCode、KiloCode 等，並已上架騰訊雲大模型服務平台 TokenHub。

图片3.jpg

　主打全面實用性 Agent能力大幅提升

　多個測評結果顯示，Hy3 preview 模型能力全面提升。

　1、出色的上下文學習和指令遵循能力

　在各種真實的生產與生活場景，理解雜亂冗長的上下文並遵從複雜多變的規則是模型的首要挑戰。基於騰訊業務場景的靈感，騰訊混元提出了 CL-bench和 CL-bench-Life 來創新性地評估模型的上下文學習能力，並在 Hy3 preview 顯着地提升了模型上下文學習和指令遵循能力。

　2、複雜推理能力突出，清華數學博士資格考試國內分數最高

　複雜推理能力是模型解決各種問題的基礎。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高難度理工科推理任務中表現突出，並在最新的清華大學求真書院數學博資考(26春) 和全國中學生生物學聯賽(CHSBO 2025) 中取得優異成績，展現了可泛化的強推理能力。

　3、代碼與智能體提升最為顯著，展現出高性價比

　代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益於預訓練及強化學習框架的重建和強化學習任務規模的提升，騰訊混元以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準以及 BrowseComp、WideSearch 等主流搜索智能體基準中取得了有競爭力的結果。

　除了公開榜單，騰訊混元還進一步構建了多個內部的評測集，對模型在真實開發場景中的表現進行評估。結果表明，無論是在後端工程任務集 Hy-Backend，貼近真實用戶開發交互的 Hy-Vibe Bench，還是高難度軟件工程開發任務集 Hy-SWE Max 上，Hy3 preview 均體現出了強競爭力。比較各個開源模型的大小與智能體綜合表現，Hy3 preview 展現出高性價比。

图片4.jpg

　騰訊核心業務已全面接入，多主線AI 產品驗證收益明顯

　正式上線之前，Hy3 preview在騰訊主要AI 業務進行了產品測試，獲得明顯正收益。在元寶端，混元與元寶進行了深度Co-Design。一方面，針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現；另一方面，對文風、文筆、情商、內容組織和內容專業度上進行了精細化調優。模型與產品的深度協同，為用戶帶來了更智能且更具「活人感」的交互體驗。

　在ima知識庫問答和通用問答兩個場景下，測試結果顯示，Hy3 preview 處理長文的能力出色，特別是檢索類任務，在回答信息的準確性、覆蓋度和全面性上表現較好。

　在CodeBuddy、WorkBuddy產品上，Hy3 preview 首 token 延遲降低 54%、端到端時長降低 47%、成功率提升至 99.99%+。實際用戶環境中，Hy3 preview 已穩定驅動最長 495 步的複雜 Agent 工作流，覆蓋文檔處理、數據分析、知識檢索、MCP 工具鏈編排等多樣化辦公場景。

　推理效率提升40%，同等成本智能密度最優

　得益於模型和推理框架上的深度協同，以及在推理框架、算子性能、量化算法等全方面優化，整體推理效率提升40%，Hy3 preview的成本相比上一代模型大幅下降。在騰訊雲大模型服務平台 TokenHub 上，Hy3 preview 輸入價格最低1.2元/百萬tokens，輸入命中緩存價格0.4元/百萬tokens，輸出價格最低4元/百萬tokens。同時，騰訊雲聯合混元推出定製的 Hy3 preview Token Plan 套餐，個人版定價最低28元/月，為Agent開發和打造「龍蝦」應用的提供更具性價比選擇。（記者易小婧）

[责任编辑：锺鴻冰 ]