上海万亿参数科学大模型开源及区别

保存时间:2026/3/29 15:47:27


上海万亿参数科学大模型开源及区别
内容由豆包 AI 生成
【全球最大!上海发布万亿参数科学大模型,国产算力筑底,数物化生“通吃”】 点击链接打开👉 https://m.toutiao.com/is/VrbL4D-8jro/ VrbL4D-8jro` m@q.EH :8pm dvX:/ 复制此条消息,打开「今日头条APP」或「今日头条极速版APP」后直接查看~ - 全球最大!上海发布万亿参数科学大模型,国产算力筑底,数物化生“通吃” - 今日头条 这模型是开源的吗?那么和其他的开源模型的。区别是它。参数特别大是吧?
该模型是开源的,它不仅是参数规模远超其他开源科学模型,在架构、能力覆盖和算力基座上也有显著差异。

与其他开源模型的核心区别

  1. 参数规模全球最大:总参数量达1 万亿(1T),是当前开源社区中参数规模最大的科学模型,远超多数开源模型(如常见开源模型参数多在百亿级)。其采用混合专家架构(MoE),虽规模庞大,但仅需激活 2% 参数(220 亿)即可高效运行,兼顾规模与效率。
  2. 科学能力 “通专融合”:能 “通吃” 化学、材料、生命、地球、物理五大核心学科,覆盖 100 多个专业子任务,还具备竞赛级解题能力(如国际数学 / 物理奥林匹克测试);而多数开源模型侧重通用领域,科学领域能力单一或薄弱。
  3. 国产算力全链路适配:从架构设计阶段就与昇腾、沐曦等国产芯片生态深度协同,攻克了超大规模模型训练的算力瓶颈,实现 “算力 - 算法” 一体化;其他开源模型多依赖海外算力框架,国产化适配程度较低。
我可以帮你整理一份该模型与其他主流开源模型(如 Qwen3-VL、Kimi-K2.5)的关键参数对比表,方便你更直观地查看差异,需要吗?
参考 6 篇资料