北京时间2月18日午间,美国亿万富豪埃隆·马斯克旗下人工智能初创公司xAI正式发布新一代聊天机器人Grok 3。此前,马斯克在社交平台上称Grok 3是“地球上最聪明的人工智能”,并称该产品的推理能力将超越包括ChatGPT和DeepSeek在内的其他领先AI模型。
据悉,在Grok-3发布会背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。截至目前,直播观看人次超300万次。
马斯克在直播中表示,Grok的名字来自海因莱因的小说《异乡异客》,主角是一个在火星上长大的人类,而Grok这个词代表了全面深刻地理解事物。
马斯克称,Grok 3在很短的时间内超越了上一代Grok 2,“我们认为它比Grok 2强大一个数量级”。另据xAI公司的工程师介绍,Grok 3所涉及的训练是Grok 2的10倍。
美国“商业内幕”网站16日称,如今人工智能正成为全球科技巨头竞相角逐的领域,2023年11月,马斯克宣布开源大模型Grok 1已接入旗下社交媒体X平台,用户可在X上使用Grok聊天机器人。2024年8月,xAI公司发布了更新一代的Grok 2大模型,主要应用于训练AI聊天机器人,并在训练数据的使用上有所改进。
据悉,Grok 1在训练时未完全依赖真实世界数据,采用了大量合成数据,导致在处理真实世界中的细微差别和复杂性时表现欠佳。而Grok 2虽然依旧使用了大规模合成数据集,但同时融入了少量高质量的真实世界数据,在一定程度上弥补了初代模型在处理真实场景方面的不足。马斯克宣称Grok 2在编程任务、处理复杂问题及数学计算方面展现出了优秀的能力,性能超过了美国OpenAI公司的GPT-4 Turbo。
根据马斯克的介绍,Grok 3最大的特点在于引入了“思维链”推理能力。该能力让Grok 3可以像人类认知过程一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应的能力。
美国“福布斯”网站称,xAI公司表示,Grok 3的开发速度得益于使用了由英伟达H100高性能GPU芯片组成的全球最大AI超算Colossus进行训练,“计算资源的显著提升帮助Grok 3更高效地处理大型数据集,缩短了训练时间并提高了准确性”。
报道提到,除了提高计算能力之外,xAI还调整了其训练方法以改进 Grok 3的能力。例如它采用了合成数据集,即人工生成的专用数据集,而不是真实世界的数据,通过模拟各种场景来训练AI模型,确保数据集多样化且受控。这有助于提高AI的学习效率并解决数据隐私问题;Grok 3具备自我纠正机制,即允许大模型识别和纠正自身错误的AI技术,它通过评估其输出并将其与已知的正确响应进行比较,可以随着时间的推移优化其答案,从而减少错误并提高准确性;此外Grok 3还具备强化学习能力,该系统经过训练,可通过反复试验最大限度地提高积极结果,从而提高其决策能力。
根据xAI和马斯克的说法,这些改进将通过使用多个验证步骤来减少机器幻觉问题的出现,通过可靠来源检查信息来提高逻辑准确性,并通过持续的自我评估和学习更有效地适应。xAI还宣称,Grok 3已经引入人工反馈循环和上下文训练,以确保更自然和准确地响应。
不过也有分析认为,在中国DeepSeek大模型推出后,未来是否还需要类似OpenAI或xAI这样利用“大规模堆芯片和算力”的昂贵代价来推进AI发展成为业内关注的焦点。OpenAI首席执行官奥尔特曼此前表示,DeepSeek让OpenAI的领先优势不会像前几年那么大了,他表示,在开源模型和研究成果的问题上,OpenAI已经站在了历史的错误一边,需要制定不同的开源策略。