新闻中心News

马斯克xAI发布Grok 4.1，正面硬刚谷歌与OpenAI并登顶排行榜

作者：P粉602998670 | 点击: | 来源：P粉602998670

1811
2025

北京时间11月18日，就在谷歌即将发布其新一代Gemini模型的前夕，马斯克旗下的人工智能公司xAI，突然发布了其最新的大语言模型Grok 4.1，正面硬刚谷歌与OpenAI。官方宣称，这款前沿模型在对话智能、情感理解等方面树立了新的标杆。马斯克本人也转发并表示，用户将会注意到其在速度和质量上的显著提升。...

北京时间11月18

日，就在谷歌即将发布其新一代gemini模型的前夕，马斯克旗下的人工智能公司xai，突然发布了其最新的大语言模型grok 4.1，正面硬刚谷歌与openai。官方宣称，这款前沿模型在对话智能、情感理解等方面树立了新的标杆。马斯克本人也转发并表示，用户将会注意到其在速度和质量上的显著提升。

登顶大模型竞技场排行榜

根据大模型竞技场（LMArena）最新公布的文本能力排行榜，Grok 4.1的两个版本已成功占据了榜首位置。其中，具备深度思考能力的Grok 4.1 Thinking版本以1483分的Elo分数高居第一，而非推理模式的Grok 4.1则以1465分紧随其后，位列第二。

官方表示，在为期两周的静默发布和盲测中，Grok 4.1在与前代模型的对比评估中，有64.78%的概率被用户偏好选择。

核心升级：情感智能与“人情味”

此次Grok 4.1更新的一个重要方向，是情感智能的提升，这与OpenAI上周发布的GPT-5.1迭代方向不谋而合。xAI官方表示，新模型能够更敏锐地感知用户的细微意图，沟通更顺畅，并保留了其敏锐的智能。在评估情绪智能的EQ-Bench测试中，Grok 4.1的两个版本同样包揽了榜单的前两名。

官方通过案例展示了Grok 4.1在处理情绪类问题时的进步。例如，当用户表达“想念我的猫，心都碎了”时，新模型的回复在细节和同理心上，都比前代模型更加丰富和真实。

在创意写作方面，新版本也表现出了更强的文学表达和戏剧张力。

另一大进步：大幅减少“幻觉”

除了情感智能，Grok 4.1在减少“幻觉”（即生成不符合事实的内容）方面也取得了显著进步。官方表示，在模型的后训练阶段，团队专注于减少信息检索提示中出现的事实性幻觉。数据显示，Grok 4.1的幻觉率已从前代的12.09%，大幅下降至4.22%，减少了近三倍。

为实现这些性能提升，xAI采用了创新的训练方法。他们开发了能够利用前沿的智能推理模型作为“奖励模型”的新方法，从而可以大规模地自主评估并迭代输出结果，优化模型的风格、个性与一致性。

大模型领域的竞争正愈演愈烈。在OpenAI刚刚更新其产品线、谷歌也即将发布其重磅新作之际，大模型竞技场榜首的位置是否会再次易主？一切都还是未知数。

欢迎光临，我们是一家专注中小型企业营销推广服务的公司！

专注企业电商网络营销推广！免费电商SEO诊断，你可信任的网络推广专家

马斯克xAI发布Grok 4.1，正面硬刚谷歌与OpenAI并登顶排行榜

登顶大模型竞技场排行榜

核心升级：情感智能与“人情味”

另一大进步：大幅减少“幻觉”