当前位置:首页 > 风台深

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

风台深

实测丨年底了,我用 AI 做了一份年终总结。

去年11月,自由画布在百度世界大会上首次亮相,各种 AI 新招式也是吊足了人们的胃口。经过了一段时间的等待,我终于拿到了它的内测资格,成为了首批探索者。激动之余,我和自由画布的相关负责人讨教了一下用法 ...

风台深

月之暗面发布首款数学模型 k0

今天,在京东科技大厦,月之暗面创始人杨植麟宣布 Kimi 数学模型 k0-math 正式发布,其数学能力对标OpenAI o1系列,还公布了截止2024年10月 Kimi 月活超过 3600万。杨植麟 ...

风台深


我要啦免费统计