
快科技3月30日音讯,汉文大模子基准测评SuperCLUE发布2026年3月最新着力,22款国表里主流模子参与角逐。
字节跳跃旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下国内第一,得胜踏进人人第一梯队;小米集团的MiMo-V2系列两款模子均顺利上榜。
本次测评隐蔽数学推理、科学推理、代码生成等六大中枢任务,全面历练模子概述智商。国际闭源模子依旧占据总分前哨,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。
豆包则紧随后来,总分仅与GPT-5.4进出0.95分,完了全目的追逐,在智能体任务运筹帷幄维度更是反超部分国际模子,开云体育官方网站踏进人人前五。
小米这次有两款模子入选测评榜单,其中MiMo-V2-Pro以60.67分位列闭源模子前哨,在数学推理任务中获得84.03分的亮眼得益;开源版块MiMo-V2-Flash虽以49.97分排行靠后,但在代码生成等细分场景中证明出一定后劲。
测评还清楚,国产模子举座证明亮眼,开源赛说念尤为卓越,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模子包揽开源榜前三,大幅最初国际同类模子。

【本文适度】如需转载请务必注明出处:快科技
攀扯裁剪:随性开云体育官方网站
著述本质举报 ]article_adlist--> 声明:新浪网独家稿件,未经授权不容转载。 --> od手机app中国官网入口