北京时间11月18日,就在谷歌即将发布其新一代Gemini模型的前夕,马斯克旗下的人工智能公司xAI,突然发布了其最新的大语言模型Grok 4.1,正面硬刚谷歌与OpenAI。官方宣称,这款前沿模型在对话智能、情感理解等方面树立了新的标杆。马斯克本人也转发并表示,用户将会注意到其在速度和质量上的显著提升。...
北京时间11月18

日,
就在谷歌即将发布其新一代gemini模型的前夕,马斯克旗下的人工智能公司xai,突然发布了其最新的大语言模型grok 4.1,正面硬刚谷歌与openai。官方宣称,这款前沿模型在对话智能、情感理解等方面树立了新的标杆。马斯克本人也转发并表示,用户将会注意到其在速度和质量上的显著提升。
登顶大模型竞技场排行榜
根据大模型竞技场(LMArena)最新公布的文本能力排行榜,Grok 4.1的两个版本已成功占据了榜首位置。其中,具备深度思考能力的Grok 4.1 Thinking版本以1483分的Elo分数高居第一,而非推理模式的Grok 4.1则以1465分紧随其后,位列第二。
官方表示,在为期两周的静默发布和盲测中,Grok 4.1在与前代模型的对比评估中,有64.78%的概率被用户偏好选择。
核心升级:情感智能与“人情味”
此次Grok 4.1更新的一个重要方向,是情感智能的提升,这与OpenAI上周发布的GPT-5.1迭代方向不谋而合。xAI官方表示,新模型能够更敏锐地感知用户的细微意图,沟通更顺畅,并保留了其敏锐的智能。在评估情绪智能的EQ-Bench测试中,Grok 4.1的两个版本同样包揽了榜单的前两名。
官方通过案例展示了Grok 4.1在处理情绪类问题时的进步。例如,当用户表达“想念我的猫,心都碎了”时,新模型的回复在细节和同理心上,都比前代模型更加丰富和真实。
在创意写作方面,新版本也表现出了更强的文学表达和戏剧张力。
另一大进步:大幅减少“幻觉”
除了情感智能,Grok 4.1在减少“幻觉”(即生成不符合事实的内容)方面也取得了显著进步。官方表示,在模型的后训练阶段,团队专注于减少信息检索提示中出现的事实性幻觉。数据显示,Grok 4.1的幻觉率已从前代的12.09%,大幅下降至4.22%,减少了近三倍。
为实现这些性能提升,xAI采用了创新的训练方法。他们开发了能够利用前沿的智能推理模型作为“奖励模型”的新方法,从而可以大规模地自主评估并迭代输出结果,优化模型的风格、个性与一致性。
大模型领域的竞争正愈演愈烈。在OpenAI刚刚更新其产品线、谷歌也即将发布其重磅新作之际,大模型竞技场榜首的位置是否会再次易主?一切都还是未知数。
相关推荐:
CMS采集站汇总:打造高效内容管理的全能平台,公众号用ai写作的优劣势
自动写文章的AI,提升效率的创作利器
AI写出来的文章是原创吗?揭秘人工智能的创作之谜
ChatGPTApp怎么调大字体?提升阅读体验,让文字更清晰,智能ai写作软件推荐
AI网站开发与代码创新:引领未来数字化变革的关键,ai文字绕排后字消失
SEO有哪些公司?选择合适的SEO服务商,助力企业网站提升流量和排名,ai候鸟
ChatGPT充值打不开?这几招教你轻松解决问题!,蘑菇拟人ai
AI免费生成:释放创造力的秘密武器
软文AI智能写作:为您开启高效创作新时代,Ai..LiSha
SEO与SEM:开启数字营销的新篇章
域名历史查询:挖掘互联网背后的“数字足迹”,zmc1314ai
AI一键生成文章网页版,让内容创作更简单高效
*解说文案生成器电脑版破解版下载,让你的创作更轻松!,ai设计糕点
ChatGLM-智能对话新时代,开启更智慧的沟通体验
AI写文章查重率高吗?揭秘人工智能写作的奥秘
ChatGPT不能打开EL?揭秘这一困扰背后的真相与解决方案,ai聊天角色扮演软件
Bing学术搜索结果不显示时间?如何解决这一问题,提升学术研究效率!,ai降ai率提示词
用AI批量下载工具,高效管理你的文件和资源
ChatGPT403:引领人工智能新时代,颠覆你的工作与生活方式,第三声ai我就不
免费的信息收集软件,让你的工作事半功倍!,ai用直线工具话直角
SEO师:如何在数字时代为企业赢得流量与销量,十堰网站关键词优化教程
AI缩短短文-提升创作效率,写作新体验,大理拍照ai
在线AI文章生成:内容创作新革命
AI写作续写免费一键生成,让灵感随时爆发
AI助手推进:智能化时代的企业革命,闹钟ai
SEO导航:助力网站提升流量与排名的必备工具,荣昌建筑网站建设
怎么用AI写出令人惊叹的文章?轻松搞定写作难题!
打破创作边界,无限可能无限制生成文章的AI
AI写作一键生成免费:开启智能写作的新时代
用AI创作的文章算原创吗?深度背后的逻辑与意义