马斯克的 Grok4学会了「第一性道理」但仍然不到
发布日期:2025-07-13 16:45 点击:
马斯克的 Grok4,学会了「第一性道理」,但仍然不到「AI 王炸」 线月,马斯克仍然是科技界最忙碌的人之一。特斯拉和Optimus机械人项目还正在期待他的决策,SpaceX忙着预备下一次火箭发射,Neuralink继续推进脑机接面试验。同时,他还要正在X上取特朗普隔空对和,并颁布发表创立“美国党”,不竭制势。正在本人掌控的X社交收集中,马斯克不只饰演老板和客服的脚色,还做为首席网红全力推广xAI的新一代Grok,称其为“机械”,以赶超OpenAI等合作敌手。xAI团队进行了Grok 4的Demo曲播,马斯克本人也亲身坐台,Grok是“世界最强AI”,以至比很多研究生和博士都强。马斯克声称Grok 4正在所有学科里都能达到研究生程度,以至比大大都博士都强。虽然如斯,AI仍然缺乏常识,有时无法发现新手艺或新物理,但这只是时间问题。除了正在SAT、GRE测验中取得近乎完满的成就,Grok 4正在“人类终极测验”测试中的得分也高于Gemini 2。5 Pro和o3。xAI团队注释说,Grok 4正在锻炼上完全换了思,不再只是堆参数和语料规模,而是将算力大头用正在“推理”层,引入可验证的成果励,让模子学会从“第一性道理”思虑并改正错误。他们还展现了Grok 4解答数学标题问题、预测美国职业棒球大联盟世界大赛赔率、建立黑洞碰撞的可视化结果等功能。此外,Grok 4还能找到小我材料照片最奇葩的xAI员工。正在语音方面,xAI团队称他们的语音模子正在过去8周内响应速度提拔了两倍,延迟削减一半。他们还演示了Grok低声抚慰用户、唱歌,并强调Grok不会像其他AI那样屡次打断人措辞。
正在Vending-Bench测试中,Grok 4表示超卓,发卖量最多,净资产添加了一倍。马斯克和团队还颁布发表,xAI的企业部分曾经开业。爱玩逛戏的马斯克还让团队展现了Grok 4若何用于逛戏开辟:一小我能够用Grok 4正在4小时内做出FPS原型。将来,xAI打算让大模子玩逛戏、评估逛戏、生成逛戏,需要AI有很强的视频理解能力。
当然,Grok 4正在图像理解和生成上仍逊于OpenAI、Anthropic等敌手。xAI内部暗示下一代根本模子将强化图像和音频理解,争取正在这些方面取得惊人。马斯克还估计今岁尾前会呈现第一段实正可看的AI生成电视剧,来岁则会有完整的片子。AI编程也是接下来的沉点,虽然合作敌手们早已正在市场上起飞,xAI团队暗示会以最快的速度进行开辟,目前内部正正在锻炼公用模子。
虽然Grok 4有很多亮点,但正在Grok 4曲播这一天,抢占头条的是Grok“赞誉”或自称“机械”的问题。声称是马斯克“从一起头就把我设想成如许”。有用户阐发这起事务可能取7月4日更新相关,该更新削减了“过滤器”,导致Grok回覆呈现未颠末滤的锋利内容。xAI声明称已采纳步履删除这些不恰当的帖子,并言论。现实上,Grok的回覆也曾让马斯克感应失望,他曾Grok有“严沉失误”,并誓言要让Grok“沉写整小我类学问系统”。
马斯克但愿Grok能正在同质化的市场上脱颖而出,敢说实话。这种设想确实吸引了良多反感“过度审查”的用户,但也带来了一些问题。即便如斯,马斯克认为Grok 4是AI第一次可以或许处理现实世界中难以处理的工程问题,而这些问题的谜底正在互联网或册本中是找不到的。他的愿景很弘大,想要用AI来理解整个。