别再声讨零一万物了2025-08-10 11:35最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...爆站
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线2025-08-10 11:25大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...爆站
智谱AI狂飙:与商业化博弈的一年2025-08-10 10:49【雷峰网(公众号:雷峰网)】“这一年时间过得太快了。”2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红 ...爆站
谁将替代 Transformer?2025-08-10 10:02【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...爆站
英国航空高管:为提振客运需求,希望英国加入中国的30天免签入境计划2025-08-10 10:01[文/观察者网 熊超然]随着免签“朋友圈”不断扩大,“中国游”、“中国购”持续升温,也让世界看到了一个更加自信、开放和强大的中国。据路透社当地时间7月9日报道,英国航空British Airways) ...爆站
谁将替代 Transformer?2025-08-10 09:57【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...爆站
"寻数计划"已发布,面向全社会征集高质量大模型语料数据2025-08-10 09:56一、“寻数计划”简介如果您有大模型所需的丰富语料数据资源,如果您有标准化的高质量精标语料数据产品,如果您愿意以多元化方式参与大模型高水平语料数据要素建设,诚邀您加入“寻数计划”。“寻数计划”是大模型语 ...爆站
"寻数计划"已发布,面向全社会征集高质量大模型语料数据2025-08-10 09:50一、“寻数计划”简介如果您有大模型所需的丰富语料数据资源,如果您有标准化的高质量精标语料数据产品,如果您愿意以多元化方式参与大模型高水平语料数据要素建设,诚邀您加入“寻数计划”。“寻数计划”是大模型语 ...爆站
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍2025-08-10 09:35编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...爆站
“寒冬”还是“拂晓”?第四范式成功上市率先交卷2025-08-10 09:24作者丨孙溥茜编辑丨陈彩娴AI科技评论消息,今天,第四范式以“6682”为股票代码,正式在香港联合交易所挂牌上市。第四范式是从去年年底大模型浪潮兴起以来首家成功上市的国内AI公司。值得注意的是,第四范式 ...爆站