当前位置:首页 > 全报

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

全报

体育中考「上难度」,视觉 AI 下场「减负」

“组织体育中考30年了,今年是第一年没有遇到12345投诉的考试。”“监考17年,第一次能准点吃饭,提前下班。”上面这些评价,来自今年北京市部分体育中考考场裁判老师。每年3月到5月,是各地学校组织体育 ...

全报


我要啦免费统计