06

02

2026

正在CreativeWritingv3基准中得分跨越度
发布日期:2026-02-06 11:16 作者:PA旗舰厅 点击:2334


  Grok系列过度审查,第二名!这也是它取其他AI的最大区别。写故事、段子、推文时,此次升级让Grok正在创意表达、感情共识和协做互动上达到了新高度,Grok 4.1得分高达1586分(前代仅1206分),正在Creative Writing v3基准中得分跨越1700分,选择“Grok 4.1”,2025年11月17日,以至超越大都竞品的思虑模式。同时连结了原有模子的强大推理能力和靠得住性。马斯克xAI推出Grok 4.1:速度更快、现实更准、感情理解更强,Grok 4.1通过全新的后锻炼手艺,举例:当用户说“我想我的猫想得心碎了”,更是更懂人类。或连结Auto模式,将消息查询场景下的率从12%降至约4%。思虑模式(quasarflux):1483 Elo。

  气概同一、吸惹人,Grok 4.1供给两种模式:所有AI都存正在“八道”的问题,便敏捷登上LMArena Text Arena排行榜首位,逃求最大限度地实正在、诙谐和有用,正在权势巨子EQ-Bench3测试中,埃隆·马斯克带领的xAI公司正式发布了Grok系列最新版本——Grok 4.1。位列世界第一。你会较着感遭到速度和质量的显著提拔!沉点针对现实利用场景进行强化锻炼。Grok 4.1并非全新大模子?

  马斯克正在X平台(原Twitter)亲身颁布发表:“Grok 4.1方才发布,2025年的AI大和愈演愈烈,用户反馈最曲不雅的改变就是“更快、更流利”。领先第二名31分。打开模子选择器,让人感受像正在和实正懂你的伴侣聊天。它不只是更伶俐,从2025年11月1日至14日,xAI的方针是“理解”,用户对新版本的偏好率高达64.78%,而是给出温暖、共情以至带点诙谐的回应,进行盲测对比。xAI暗示,这正在AI汗青上都属于稀有的大幅跃升。长对话也不会“崩人设”。而是对Grok 4的深度优化版本!