已赶超ChatGPT-3.5？马斯克推出首个大模型“Grok”叫板OpenAI

Hawk Insight

2023-11-06 15:29:56

3.69W

11月5日，马斯克旗下的xAI在X上宣布了其推出首个人工智能模型——“Grok”。据官方介绍，Grok-1在计算推理能力上已超过ChatGPT-3.5。

11月5日，马斯克旗下的xAI在X上宣布了其推出首个人工智能模型——“Grok”。

xAI

马斯克曾多次在公共场合提到，自己小时候就十分痴迷科幻小说《银河系漫游指南》，是该书的忠实粉。在老板的影响下，Grok也带有该科幻小说的元素。官方在介绍Grok时就表示，Grok是一款模仿《银河系漫游指南》的人工智能，Grok几乎可以回答任何问题，甚至可以建议要问什么问题。

马斯克的影响还不止于此。作为个性鲜明的老板，旗下的人工智能也没那么循规蹈矩。xAI特别提醒，Grok是为回答问题而设计的，有点“机智和叛逆的倾向”，并建议那些讨厌幽默的人不要使用它。

和ChatGPT等AI工具一样，Grok也开放给外界使用，以不断改进模型。不过目前，仅对美国用户提供试用Grok原型的机会，且名额有限。

xAI：Grok-1计算推理能力已超过ChatGPT-3.5

xAI是今年7月才成立的人工智能公司。在成立之初，xAI就因为其强大的人才阵容受到外界关注。该公司的团队由马斯克领导，由多位工程师及专家组成。里面不少人员还是微软、谷歌等大型科技企业的前员工。此外，还有美国现任人工智能安全中心主任Dan Hendrycks担任公司的顾问。

在如此多顶尖人才加持下，再加上背靠亿万富翁马斯克，xAI在成立不到四个月就推出了人工智能模型，这一效率是十分惊人的。

尽管开发时间较短，但是根据官方公布的测试结果，Grok的性能却十分优越。

目前为Grok提供动力的“引擎”是Grok-1，这是xAI在过去四个月内开发的大型语言模型（LLM）。Grok-1在这段时间经历了多次迭代。一开始，公司训练了一个具有330亿个参数的原型LLM，也就是Grok-0。xAI表示，这个早期模型在标准语言模型基准上接近Meta的LLaMA 2功能，但仅使用其一半的训练资源。

在过去的两个月里，xAI在推理和编码能力方面取得了显着的进步，最终诞生了功能更加强大的Grok-1。

在推理方面，xAI使用一些标准的机器学习基准对Grok-1进行了一系列评估，这些基准旨在其测量数学和推理能力。在这些基准测试中，Grok-1展现出优秀的能力，超过了其计算类别中的所有其他模型，包括ChatGPT-3.5和Inflection-1。目前，只有使用大量训练数据和计算资源（例如GPT-4）进行训练的模型才能超越Grok-1。

grok

由于这些基准测试可以在网络上找到，xAI不能排除该模型无意中接受了这些基准的训练，因此在2023年匈牙利全国高中决赛中，xAI对其模型以及Claude-2和GPT-4进行了新的评估。结果显示，Grok以59%的成绩通过了考试并获得B等级，Claude-2也取得了接近的成绩，以55%获得B等级，而GPT-4则以68%的成绩获得了B等级。

grok

另外，在编码方面，Grok-1在HumanEval（一个由OpenAI提供用于评估AI对编程问题的解决能力的数据集）编码任务上达到了63.2%，在目前主流的LLM评测数据集——MMLU（一个包含57个多选问答任务的英文评测数据集，涵盖数学、历史、法律等）上达到了73%。

背靠“X”好乘凉？

在介绍Grok的时候，xAI还特地提到其具有一个独特的优势，那就是Grok能够实时访问X平台的信息。

现在，X作为一个全球性社交媒体平台，每日出现及流动的信息是巨大的，这对Grok来说一个巨大的数据库。而且对于人工智能来说，若是想要回答得更像一个人类，那就需要从大量人类对话中进行学习，这也能从X上得到训练。

Grok还沿袭了马斯克讲话大胆的特质。xAI表示，Grok还可以回答其他大多数人工智能系统拒绝回答的尖锐问题。xAI认为，设计对各种背景和政治观点的人都有用的人工智能工具非常重要。今年4月份在接受采访时马斯克就曾表示，他担心现有的人工智能公司会优先考虑“政治正确”的系统。

不过，X上充斥的信息不全是优质信息，也含有大量垃圾信息。怎么鉴别信息真假，以及在训练模型中如何规避虚假信息，这对于Grok及背后的Xai团队来说也是一个挑战。

自去年11月马斯克以440亿美元收购推特以来，就一直饱受争议。其中最为让人诟病的就是，由于马斯克放宽了内容审核规则，恢复了许多被禁止的用户，使得平台上的仇恨/负面言论有所增加。根据追踪网上虚假信息的Newsguard的一项研究表明，在马斯克收购推特之后的一个星期内，那些最受欢迎却最不可信的帐户在互动参与度方面上升了将近60%。而且在马斯克接手后解禁的上千个帐户中，有超过三分之一的账户在被解禁后还散播过仇恨或者虚假信息。

而马斯克对此却予以否认。在今年4月份接受媒体采访时他声称，公司正致力于删除机器人账户，在他接手后推特上的虚假信息减少了。他称：“我的经验是虚假信息减少了，而不是增多了。”

不管虚假信息是增多了还是减少了，不可否认的是，X上确实充斥着不少虚假信息。在这种情况下，X对于Grok来说，就是一把双刃剑，最终是利大于弊还是弊大于利还有待观察。

近日在英国举行的人工智能峰会上，马斯克表示，人工智能将是历史上最具颠覆性的力量，但他的结论是人工智能最终将“成为一股向善的力量”。

xAI成立之际，就曾说过该公司的目标是了解宇宙的真实本质。目前来看，这一初衷尚未改变。此次xAI官方在介绍Grok时提到，研发Grok是因为希望创建人工智能工具来帮助人类寻求理解和知识。公司希望在遵守法律的前提下，为用户提供人工智能工具。xAI希望Grok成为任何人强大的研究助手，帮助他们快速访问相关信息、处理数据并提出新想法。

xAI：“我们的最终目标是让我们的人工智能工具协助追求理解。”