xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。
xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。Grok-3获得了超过3,000票,并总体上与第一名并列。它在困难提示、编码任务、数学问题、创意写作、指令遵循以及处理较长查询方面表现尤为出色。Chatbot Arena 是一个通过人类偏好进行大规模语言模型(LLM)评估的众包平台,使用 Elo 评级系统为模型排名,提供全面的性能衡量。相较之下,被各种吹捧的国产大模型DeepSeek仅排第6,不仅令人唏嘘
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...