我的征尘是星辰大海。。。
The dirt and dust from my pilgrimage forms oceans of stars...
-------当记忆的篇章变得零碎,当追忆的图片变得模糊,我们只能求助于数字存储的永恒的回忆
作者:黄教授
手机视频列表
论国家整合大模型编码的紧迫性
视频
音频
原始脚本
理想与现实的平衡,国家算力整合的编码先行之道。 第一章,两种生态的博弈,大而全 vs 专而精的 AI 未来。 1.1大企业的闭环逻辑,像综合医院一样包揽一切。 当一家科技巨头投入数十亿训练出覆盖文本、图像、代码、医疗的全领域大模型时,它天然倾向于打造一站式服务,用户的所有需求都在自己的生态内解决。 从数据收集、模型训练到推理调用,形成闭环。 这就像一家超级综合 医院,内科、外科、儿科一应俱全,病人来了不用转院,医院也能牢牢抓住用户。 这种模式的核心是规模垄断,通过覆盖足够多的场景,让用户产生依赖,再用庞大的用户量反哺模型迭代,形成越大越强的循环。 对大企业而言,开放意味着养虎为患。 如果把用户需求分给外部小模型,可能失去数据和用户,自然不愿轻易打破闭环。 1.2,中小企业的 专精机会。 像专科诊所一样深耕细分,与巨头不同,中小企业没有资源训练全领域模型,但可以在垂直领域做出专精优势。 比如一家团队专注训练小学数学推理模型,用10万道奥数题反复优化,可能比巨头的全量模型在该领域更精准。 另一家专注中医问诊,结合百万份病例训练,能在辩证 更实质上更贴合实际需求。 这些小而美的模型就像专科诊所,虽然服务范围窄,但在特定领域的口碑可能超过综合医院。 但他们的短板也很明显,缺乏流量入口,用户不知道去哪里找他们,就算找到,也可能因与其他模型语言不通,无法协同完成复杂任务。 1.3 历史的启示,互联网时代的共生法则。 回顾互联网初期,门户网站曾试图包揽新闻、邮箱、购物等所有服务,但最终垂直网站依然崛起。 核心原因是用户需求既需要便捷的一站式服务,也需要专业的深度服务,两者可以共存。 AI 领域的未来可能类似,巨头的全领域模型满足快速响应基础需求,而垂直小模型满足高精度专业需求。 关键是要有一个公平的连接纽带,让用户能按需选择,让小模型有机会被看见、被使用。 第二章,国家整合的切入点,为何编码标准是必选项?2.1编码的底层锁定效应,AI 世界的语法规则。 模型的 Embedding 空间是个隐蔽却关键的技术点,它把文字、图像等输入转化为机器能理解的数字向量。 就像人类语言的语法规则,同样一句话,用中文语法和英文语法表达,结构完全不同。 如果各家模型的语法规则不统一,后果会很严重。 比如用户问3的平方加5的立方是多多少?A 模型的编码可能是0.21点5,-3.1,B 模型可能是5.3,-2.0,0.8,两者无法理解对方的语言,更别说协同计算。 这种巴别塔困境就像当年不同汉卡无法兼容中文,会直接卡死算力整合的可能性。 更麻烦的是,编码体系一旦定型就很难改。 模型训练本质是在编码空间里找规律,改编码等于推倒重来。 一家企业若已用自有编码训练出1000亿参数的模型,几乎不可能为了统一标准而重构,这就是底层锁定效应。 2.2企业博弈的破局点,唯有国家能打破。 僵局,大企业有能力制定自己的编码标准,甚至希望通过不兼容排挤对手,小企业想统一却没话语权,只能被动跟随。 这种强者不愿、弱者不能的局面,靠市场自发调节几乎无解。 就像当年没有官方推动,GBK 编码。 不可能取代五花八门的地方标准。 国家介入的逻辑不是管理企业,而是建设基础设施。 编码标准就像 AI 世界的公路交通规则,政府不生产汽车,但必须规定靠左行还是靠右行,否则马路会变成停车场。 对大企业,规则能让他们的模型更方便的走出去,对小企业 规则能让他们的模型上得了路,最终整个行业的效率都会提升。 2.3时机的紧迫性,现在不改以后更难。 当前大模型技术还在快速迭代,多数企业的编码体系处于半定型状态,就像盖房子刚打好地基,改图纸还来得及。 如果等到3~5年后,巨头的编码标准成为行业默认选择。 小企业的模型都基于此适配,再推统一标准就会遭遇巨大阻力。 改标准意味着无数企业要重做模型,成本可能高达千亿级。 中文编码的历史教训就在眼前。 80年代,若没有及时推出 GB 2312,等到各家汉卡输入法都按自有编码普及,中国可能要花10倍代价。 才能实现中文信息互通。 AI 编码标准的制定同样是早做早主动,晚做更被动。
修正脚本
理想与现实的平衡,国家算力整合的编码先行之道。 第一章,两种生态的博弈,大而全 vs 专而精的 AI 未来。 1.1大企业的闭环逻辑,像综合医院一样包揽一切。 当一家科技巨头投入数十亿训练出覆盖文本、图像、代码、医疗的全领域大模型时,它天然倾向于打造一站式服务,用户的所有需求都在自己的生态内解决。 从数据收集、模型训练到推理调用,形成闭环。 这就像一家超级综合医院,内科、外科、儿科一应俱全,病人来了不用转院,医院也能牢牢抓住用户。 这种模式的核心是规模垄断,通过覆盖足够多的场景,让用户产生依赖,再用庞大的用户量反哺模型迭代,形成越大越强的循环。 对大企业而言,开放意味着养虎为患。 如果把用户需求分给外部小模型,可能失去数据和用户,自然不愿轻易打破闭环。 1.2 中小企业的专精机会。 像专科诊所一样深耕细分,与巨头不同,中小企业没有资源训练全领域模型,但可以在垂直领域做出专精优势。 比如一家团队专注训练小学数学推理模型,用10万道奥数题反复优化,可能比巨头的全量模型在该领域更精准。 另一家专注中医问诊,结合百万份病例训练,能在辨证上其实更贴合实际需求。 这些小而美的模型就像专科诊所,虽然服务范围窄,但在特定领域的口碑可能超过综合医院。 但他们的短板也很明显,缺乏流量入口,用户不知道去哪里找他们,就算找到,也可能因与其他模型语言不通,无法协同完成复杂任务。 1.3 历史的启示,互联网时代的共生法则。 回顾互联网初期,门户网站曾试图包揽新闻、邮箱、购物等所有服务,但最终垂直网站依然崛起。 核心原因是用户需求既需要便捷的一站式服务,也需要专业的深度服务,两者可以共存。 AI 领域的未来可能类似,巨头的全领域模型满足快速响应基础需求,而垂直小模型满足高精度专业需求。 关键是要有一个公平的连接纽带,让用户能按需选择,让小模型有机会被看见、被使用。 第二章,国家整合的切入点,为何编码标准是必选项?2.1编码的底层锁定效应,AI 世界的语法规则。 模型的 Embedding 空间是个隐蔽却关键的技术点,它把文字、图像等输入转化为机器能理解的数字向量。 就像人类语言的语法规则,同样一句话,用中文语法和英文语法表达,结构完全不同。 如果各家模型的语法规则不统一,后果会很严重。 比如用户问3的平方加5的立方是多少?A 模型的编码可能是0.2、1.5,-3.1,B 模型可能是5.3,-2.0,0.8,两者无法理解对方的语言,更别说协同计算。 这种巴别塔困境就像当年不同汉卡无法兼容中文,会直接卡死算力整合的可能性。 更麻烦的是,编码体系一旦定型就很难改。 模型训练本质是在编码空间里找规律,改编码等于推倒重来。 一家企业若已用自有编码训练出1000亿参数的模型,几乎不可能为了统一标准而重构,这就是底层锁定效应。 2.2 企业博弈的破局点,唯有国家能打破僵局,大企业有能力制定自己的编码标准,甚至希望通过不兼容排挤对手,小企业想统一却没话语权,只能被动跟随。 这种强者不愿、弱者不能的局面,靠市场自发调节几乎无解。 就像当年没有官方推动,GBK 编码不可能取代五花八门的地方标准。 国家介入的逻辑不是管理企业,而是建设基础设施。 编码标准就像 AI 世界的公路交通规则,政府不生产汽车,但必须规定靠左行还是靠右行,否则马路会变成停车场。 对大企业,规则能让他们的模型更方便地走出去,对小企业,规则能让他们的模型上得了路,最终整个行业的效率都会提升。 2.3时机的紧迫性,现在不改以后更难。 当前大模型技术还在快速迭代,多数企业的编码体系处于半定型状态,就像盖房子刚打好地基,改图纸还来得及。 如果等到3~5年后,巨头的编码标准成为行业默认选择,小企业的模型都基于此适配,再推统一标准就会遭遇巨大阻力。 改标准意味着无数企业要重做模型,成本可能高达千亿级。 中文编码的历史教训就在眼前。 80年代,若没有及时推出 GB 2312,等到各家汉卡输入法都按自有编码普及,中国可能要花10倍代价才能实现中文信息互通。 AI 编码标准的制定同样是早做早主动,晚做更被动。
back to top