保存时间:2026/3/29 20:11:44
| 公司 | 核心策略 | 技术先进性 | 商业目标 | 关键动作 / 许可证 | 代表模型 |
|---|---|---|---|---|---|
| Meta | 从开源转向闭源(2025 年 7 月) | 曾达顶尖水平(Llama 4 支持多模态、1000 万令牌上下文),但内部测试显示性能未达预期,被中国 DeepSeek 超越 | 1. 控制技术闭环,为 AR 眼镜等 “个人超级智能” 硬件铺路,最大化商业收益2. 回收百亿级研发成本,缓解商业回报焦虑 | 1. 此前 Llama 系列用 “Meta Llama 3 社区许可协议”,限制 MAU 超 7 亿的企业需单独申请商业许可,排除谷歌、微软等竞品2. 2025 年扎克伯格宣布 “谨慎选择开源内容”,停止核心模型开源 | Llama 3、Llama 4(转向闭源前的最后开源系列) |
| 谷歌 | 闭源为主,混合策略(核心闭源 + 小模型开源) | 核心模型(Gemini)技术顶尖,开源小模型(Gemma)性能适配基础场景 | 1. 保护核心算法与高质量私有数据集,维持垂直领域(如医疗、金融)竞争壁垒2. 2025 年终止 Android 开源项目(AOSP),节约维护成本并强化 GMS 服务绑定,提升广告收入 | 1. 核心模型仅通过 API 提供服务,不开放源码2. 终止 AOSP 公开分支维护,仅保留 GPL 协议要求的开源部分(如 Linux 内核驱动) | Gemini(闭源核心)、Gemma(开源小模型)、Android 系统(原开源,2025 年起闭源) |
| OpenAI | 完全闭源 | 核心模型(GPT-4)技术顶尖,在理解、推理、代码能力上长期领先 | 1. 通过订阅制(如 ChatGPT Plus)、API 调用收费快速回收成本(GPT-4 训练成本超 1 亿美元)2. 强调安全与伦理,规避模型滥用风险 | 1. 主要模型不开放源码,仅提供 API 访问2. 2020 年将 GPT-3 独家许可给微软,仅微软可访问其源代码 | GPT-3、GPT-4 |
| 阿里云 | 开源为主,布局闭源 | 1. 开源模型达顶尖水平:Qwen1.5-110B 在 MMLU 等测评中超越 Meta Llama-3-70B,通义千问 2.5 在中文语境下赶超 GPT-4 Turbo2. 闭源模型处于布局阶段,暂未公开核心性能 | 1. 以开源构建开发者生态,通义开源模型累计下载量超 700 万,服务企业超 9 万,带动上游云算力销售2. 覆盖多行业场景(天文、矿山、医疗等),通过行业解决方案变现 | 1. 开源模型采用宽松协议:万相 2.1 用 Apache2.0 协议,开放全部推理代码和权重;Qwen 系列用 MIT 许可证2. 坚持 “每日一开源” 策略,加速吸引全球开发者 | 通义千问 2.5(闭源布局中)、Qwen1.5-110B(开源)、万相 2.1(开源) |
| 百度 | 闭源为主 | 闭源模型(文心系列)在中文处理、多模态能力上领先,李彦宏称 “闭源模型能力会持续领先” | 1. 靠闭源模型探索商业模式,通过 API 调用、定制化服务收费,聚集算力与人才2. 认为开源模型迭代依赖社区贡献有限,与传统软件开源逻辑不同 | 1. 核心模型不开放源码,仅提供对外服务接口2. 未公开闭源模型具体许可条款,侧重商业合作定制 | 文心一言(ERNIE)系列 |
| DeepSeek(中国) | 完全开源 | 技术达顶尖水平:仅用 550 万美元训练成本便超越 Meta Llama 4,DeepSeek-R1 成本仅为 OpenAI o1 的 3% | 1. 以开源吸引全球合作,规避数据合规顾虑(如 HIPAA、SOC2 认证)2. 通过低成本优势(训练成本远低于 OpenAI)扩大市场份额,构建开发者社区 | 1. 模型用 MIT 许可证,在 GitHub 开放源代码,允许免费使用、修改、商业分发2. 接受社区拉取请求,鼓励开发者参与迭代 | DeepSeek-V3、DeepSeek-R1 |
| 360、智谱等 | 360 坚持开源;智谱采取混合策略(小模型开源 + 核心闭源) | 1. 360 开源模型侧重生态协作,暂未达全球顶尖水平2. 智谱开源小模型适配基础场景,核心闭源模型性能对标行业主流 | 1. 360:相信开源力量,认为未来 1-2 年开源会赶超闭源,通过生态合作弥补技术差距2. 智谱:用开源小模型吸引开发者,核心模型通过商业服务盈利 | 1. 360 未公开具体开源协议,侧重社区共建2. 智谱开源小模型采用宽松许可,核心模型不开放源码 | 360 大模型(开源)、智谱清言(核心闭源)、智谱小模型(开源) |
| 公司 | 核心模型 API | 计费单位 | 基础定价(美元) | 典型场景单任务成本(估算) | 免费额度 / 优惠 | 关键备注 |
|---|---|---|---|---|---|---|
| OpenAI | GPT-4o(文本) | 每 1000 tokens | 输入 / 输出统一 0.01 | 街头霸王 III 战斗:0.025 美元 / 场;法律合同分析(5000 tokens):0.05 美元 | 新开发者赠 5 美元试用额度;月调用超 1000 万 tokens 可申请定制折扣 | 长上下文处理(超 128k tokens)无额外溢价,非英语场景 token 消耗增加 15%-20% |
| OpenAI | GPT-4o-mini(文本) | 每 1000 tokens | 0.0005 | 街头霸王 III 战斗:0.0011 美元 / 场;基础文案生成(2000 tokens):0.001 美元 | 同 GPT-4o | 性价比最高模型,ELO 评分 1670.89,适合非高精度需求场景 |
| Gemini 1.5 Pro(多模态) | 每 1000 字符 | 标准版 0.00025;128k 上下文窗口需额外付费 | 金融研报分析(完整 PDF + 图表,10 万字符):约 0.025 美元;代码生成(3000 字符):0.00075 美元 | 新用户赠 300 美元云服务 credit(含 API 调用) | MoE 架构优势显著,处理 50 万 token 代码分析成本仅为 Claude 3.5 的 1/3 | |
| Anthropic | Claude 3 Haiku(视觉) | 每 1000 tokens | 标准请求 0.0025;复杂推理 0.006 | 街头霸王 III 战斗:0.00725 美元 / 场;内容审核(4000 tokens,需高危过滤):0.0288 美元 | 无公开免费额度,企业用户可谈批量折扣 | 按任务复杂度分级定价,代码生成场景比 OpenAI 节省 18% 成本 |
| Mistral | Pixtral-12B(文本) | 每 1000 tokens | 0.0015 | 街头霸王 III 战斗:0.00345 美元 / 场;产品描述生成(2500 tokens):0.00375 美元 | 无固定免费额度,开源社区用户可获测试资源 | 非视觉任务成本比同级别视觉模型低 30%,支持本地部署与 API 调用双模式 |
| Mistral | Pixtral-large(视觉) | 每 1000 tokens | 0.002 | 街头霸王 III 战斗:0.006 美元 / 场;图像场景分析(3500 tokens):0.007 美元 | 同 Pixtral-12B | 视觉推理能力接近 GPT-4o,成本仅为其 1/5 |
| 阿里云 | 通义千问(闭源,企业版) | 每 1000 tokens | 0.0012(中文);0.0018(英文) | 中文新闻摘要(3000 tokens):0.0036 美元;跨境电商文案(4000 tokens,中英混合):0.0068 美元 | 企业用户首月赠 100 万 tokens 免费额度 | “国际 API 平替计划” 用户迁移成本降低 90%,中文语境处理成本比 GPT-4o 低 40% |
| 公司 | 核心 API 成本(美元 / 1K tokens) | 2024-2025 年研发投入(估算) | 盈利状态 | 关键判断依据 | 潜在风险 / 优势 |
|---|---|---|---|---|---|
| OpenAI | GPT-4o:输入 0.01 / 输出 0.03;GPT-4o-mini:0.0005 | 超 150 亿美元(含微软算力支持) | 潜在盈利(未公开明确盈利) | 1. 2024 年收入 37 亿美元,主要来自 API 订阅与 ChatGPT Plus(月费 20 美元);2. GPT-4o 规模化后边际成本下降,高频用户定制折扣提升付费转化率;3. 但百亿级研发投入仍需时间覆盖,暂未实现净利润转正。 | 优势:技术壁垒高,企业客户付费意愿强;风险:研发持续烧钱,商业化速度不及预期。 |
| Google(Gemini) | Gemini 1.5 Pro:标准版 0.00025(128K 上下文额外付费);Gemini Flash-Lite:0.000075/1K tokens | 750 亿美元(2025 年 AI 总投资计划) | 间接盈利(依托谷歌生态变现) | 1. API 定价极低,核心目的是带动谷歌云服务(如算力租赁)与广告业务;2. Gemini 集成于 Search、Workspace 等产品,提升用户粘性,间接增加营收;3. 单独 API 业务暂不盈利,但整体生态反哺效应显著。 | 优势:生态协同性强,隐性收益高;风险:API 低价策略挤压利润空间,技术投入回报周期长。 |
| Anthropic(Claude) | Claude 3 Haiku:标准 0.0025 / 复杂推理 0.006;Claude 3 Opus:0.015/1K tokens | 超 50 亿美元(主要来自谷歌投资) | 亏损(依赖外部投资) | 1. API 定价高于 OpenAI,但用户规模较小,2024 年营收未公开且推测低于 10 亿美元;2. 复杂推理与内容审核场景成本高(高危过滤额外加收 20% 费用),边际收益低;3. 尚未形成稳定盈利模式,需持续依赖谷歌等投资方注资。 | 优势:安全过滤能力强,垂直领域(如法律)有竞争力;风险:营收规模小,盈利依赖外部资金。 |
| 阿里云(通义千问) | 中文 0.0012 / 英文 0.0018(企业版) | 超 1000 亿元(阿里三年 AI 总投入 3800 亿元的一部分) | 间接盈利(依托云业务分摊成本) | 1. API 定价仅为 OpenAI 的 1/25,核心目的是吸引企业客户使用阿里云算力与定制服务;2. 开源模型(如 Qwen 系列)带动上游云服务器销售,2024 年 AI 相关云业务收入增长超 40%;3. 单独 API 业务微利,但云生态整体盈利覆盖 AI 研发成本。 | 优势:中文场景成本优势显著,云业务支撑强;风险:低价策略压缩 API 利润,开源投入持续烧钱。 |
| 百度(文心一言) | 企业版约 0.00028 美元 / 1K tokens(0.002 元) | 超 1800 亿元(百度近十年累计研发投入) | 亏损(API 收入覆盖不了研发) | 1. API 定价极低,2024 年公开数据显示文心一言相关收入不足 10 亿元;2. 闭源模型研发成本高,且未形成规模化付费用户群体;3. 主要依赖百度搜索、智能云等业务补贴 AI 研发,单独 AI 板块持续亏损。 | 优势:中文处理能力领先,有稳定流量入口;风险:商业化进度慢,研发成本高企。 |
| DeepSeek | 开源免费(基础版)/ 企业定制收费(未公开具体 API 价) | 约 10 亿美元(2024-2025 年) | 潜在盈利(理论盈利模型跑通) | 1. 理论数据:R1 推理系统日利润 47.5 万美元(约 346 万元),成本利润率 545%,依赖 GPU 利用率优化(跨节点专家并行技术)与夜间资源调配;2. 实际收入虽低于理论值,但开源吸引开发者生态,企业定制服务(如医疗、金融)已产生稳定收益;3. 是少数公开披露 “理论盈利” 的初创公司,成本控制能力行业领先。 | 优势:成本控制极致,开源生态带动商业化;风险:实际营收规模未公开,盈利稳定性待验证。 |
| 昆仑万维(天工) | 开源免费(如 Skywork-R1V 2.0)/ 企业版未公开定价 | 15.4 亿元(2024 年研发费用,同比 + 59.5%) | 明确亏损 | 1. 2024 年净利润亏损 15.95 亿元,主要因 AI 研发投入增加(15.4 亿元)+ 投资损失 8.2 亿元;2. 开源模型未产生直接 API 收入,AI 应用(如短剧、音乐)处于探索期,营收贡献不足 5%;3. 依赖游戏业务(收入占比 9.6%)与海外投资补贴 AI,盈利前景不明。 | 优势:多模态布局早(音乐、3D),海外收入占比 88%;风险:研发投入高,AI 业务短期难盈利。 |
| 润和软件 | 行业定制 API 未公开(基于润和智数等产品) | 未公开(2024 年净资产收益率 4.75%) | 盈利(依托行业应用) | 1. 聚焦 IT 服务与金融科技,AI API 嵌入行业解决方案(如智研、智造),2024 年净利率 5.16%;2. 研发投入集中在垂直场景,成本低且客户付费意愿强(金融行业客单价高);3. 是少数明确实现 AI 相关盈利的公司,依赖行业定制而非通用 API。 | 优势:垂直领域(金融)落地能力强,盈利模式清晰;风险:通用大模型技术储备弱,增长天花板低。 |
| 合合信息 | 智能文字识别 API 未公开(基于 acge 模型) | 未公开(2024 年净资产收益率 42.96%) | 盈利(垂直场景高毛利) | 1. 聚焦智能文字识别,API 嵌入金融、政务等场景,2024 年毛利率 83.8%、净利率 24.62%;2. 垂直模型研发成本低,且客户(如银行)付费能力强,无需依赖低价策略;3. 盈利不依赖通用大模型,而是细分场景的技术落地,利润稳定性高。 | 优势:垂直场景技术壁垒高,毛利超 80%;风险:业务范围窄,受行业周期影响大。 |
| 公司 | API 调用成本 | 研发投入情况 | 盈利情况 |
|---|---|---|---|
| OpenAI | GPT-4 按 token 计费,约$0.03/1K tokens;GPT-4 Turbo版本每千tokens输入收费$0.01,输出$0.03;GPT-3.5 Turbo输入Token价格约为$0.0015 / 千 Token,输出为 $0.002 / 千 Token | OpenAI 研发投入巨大,但其具体研发投入金额未完全公开 | 未明确公开盈利情况,由于研发成本高昂,短期内可能难以实现大规模盈利 |
| Gemini Pro 2.5 标准版每千字符收费$0.00025美元,128K上下文窗口需额外付费;Gemini Flash-Lite每百万token成本低至$0.075 | Google 作为科技巨头,在 AI 领域投入大量资源,具体研发投入金额未单独针对大模型明确披露 | Google 整体业务盈利,但大模型业务对公司整体盈利的具体贡献不明确 | |
| Anthropic | Claude 3.5 的成本区间为$0.008-$0.024/1K tokens | 研发投入情况未公开 | 未公开盈利情况,其商业模式和盈利状况尚不明确 |
| 文心一言 | 企业版定价为 0.002 元 / 千 tokens(约 $0.00028) | 百度在 AI 领域有持续的研发投入,但大模型具体研发投入金额未明确 | 百度整体业务有盈利,但大模型业务的盈利情况未单独披露 |
| 深度求索 | 输入 Token 价格约为 0.0003 元 / Token,输出为 0.0006 元 / Token | 研发投入情况未公开 | 未公开盈利情况 |