
一的参数量,就能在排行榜上跟这些巨无霸掰手腕。谷歌把这叫做“每参数智能”——用更少的参数,达到更高的性能。 从实测数据来看,Gemma 4 31B 在多个关键测试中表现惊艳。MMLU Pro 测试拿到了 85.2% 的成绩,AIME 2026 数学竞赛题目达到 89.2% 的准确率,LiveCodeB
与一再震撼全球AI圈的DeepSeek相比,商汤低调了不少,但也具备自己的独特优势。商汤的“三位一体”战略包括了:算力基础设施(大装置)-大模型研发(日日新大模型)-AI应用,是AI行业不多见的全栈公司。从2020年开始发力大模型,商汤一边推动模型和应用的研发,一边长期投入智算中心AIDC建设,打造了覆盖算力、模型与垂直应用的体系,实现了AI场景全栈覆盖,软硬协同,让商汤AI的综合实力位列行业一流
Gemma 4 的发布,其实也反映了一个更大的背景:美国在开源大语言模型领域相对中国已经落后了。DeepSeek、Qwen 这些中国的开源模型在全球范围内获得了大量关注和使用。英伟达也在推 Nemotron 系列来发展开源 AI 生态。谷歌显然不想在这个战场上缺席。  
当前文章:http://www.pieqimu.cn/rsp2n4/x2c.docx
发布时间:00:59:03

