当前位置:首页 > 闻站

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

闻站

机器人端侧模型的十字路口

作者|朱可轩编辑|陈彩娴自 2023 年以来,以大模型为代表的人工智能与以具身智能为代表的机器人成为科技发展的两股重要力量。与此同时,将人工智能算法、尤其是大模型应用于进一步提升机器人智能水平也成为一 ...

闻站

大阪世博会中国馆举行中国电影日活动

来源标题:大阪世博会中国馆举行中国电影日活动新华社东京5月25日电记者胡晓格)中国电影日活动25日在大阪世博会中国馆举行,这是中国电影活动首次在世博会平台举办。中日电影界代表以及世博会各场馆代表等百余 ...

闻站


我要啦免费统计