当前位置:首页 > 料点

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

料点

IDEA研究院发布DINO

计算机视觉技术在真实世界的应用场景十分广泛。然而,过去主流的小模型方案,难以应对碎片化、多变的长尾需求,限制了技术落地规模。源自自然语言研究的Transformer架构诞生后,视觉模型与之结合,走上一 ...

料点

别再声讨零一万物了

最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...

料点


我要啦免费统计