当前位置:首页 > 乐榜

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

乐榜

月之暗面发布首款数学模型 k0

今天,在京东科技大厦,月之暗面创始人杨植麟宣布 Kimi 数学模型 k0-math 正式发布,其数学能力对标OpenAI o1系列,还公布了截止2024年10月 Kimi 月活超过 3600万。杨植麟 ...

乐榜

刚刚,云天励飞上市!

ChatGPT的横空出世,重燃了人工智能赛道的火,一边是狂热投资者纷涌而至,一边是大国博弈下,国家战略层面的高度关注。最近,云天励飞CEO陈宁博士忙得不可开交,前脚接待了省级领导,后脚又赶去接待科技部 ...

乐榜


我要啦免费统计