今年最期待的大模型——GPT-5上线，美国大模型混战白热化！

Hawk Insight

2025-08-08 11:12:34

1.35W

即时起，GPT-5在平台上作为默认模型向用户免费放开使用。

8月7日，OpenAI 正式对外发布其新一代旗舰模型 GPT-5，并宣布即时在 ChatGPT 平台上作为默认模型向免费与付费用户放开使用，同时在未来一周内向企业（Enterprise）与教育（Edu）付费方案全面上线。

今年最期待的大模型——GPT-5上线，美国大模型混战白热化！

今年最期待的模型——GPT-5重磅上线！

OpenAI 将 GPT-5 定位为公司“首个一体化”系统：即把其 o 系列在推理与长期“思考/测试时计算”（test-time compute）方面的能力，与 GPT 系列在快速响应与交互上的优势融合在同一模型与产品体验中。

今年最期待的大模型——GPT-5上线，美国大模型混战白热化！

公司 CEO Sam Altman 在发布会与公开渠道将 GPT-5 描述为“有史以来最好的模型”、“朝通用人工智能（AGI）方向迈出的重要一步”，并强调这次发布的实用性改进和显著降低的错误率。

OpenAI称，GPT-5 在编程类与通用推理类测试获得了行业顶尖成绩：在 SWE-bench Verified（软件工程类评测）上 GPT-5 在开启“chain-of-thought/ thinking”模式下得分为 74.9%，在 Aider Polyglot（多语言编程能力评估）为 88%，并且公司宣称 GPT-5 的“幻觉率”（hallucination rate）显著下降到约 4.8%，远低于此前 GPT-4o 与 o 系列报告的两位数水平。OpenAI 同时展示了 GPT-5 在医学/健康建议、数学/科学推理与代码生成场景的多项改进，并强调新模型能以更长上下文（百万级 token）处理更复杂的任务。

今年最期待的大模型——GPT-5上线，美国大模型混战白热化！

GPT-5发布引起资本市场轰动

GPT-5发布后，美股盘后和隔夜市场迅速发酵。投资者普遍将其视为OpenAI商业化路径的加速信号，市场对于AI赛道尤其是算力、云服务与企业级软件的短期需求预期出现显著上修，隔夜交易时段相关板块的ETF与龙头股在消息公布后的买盘明显增强。

微软作为OpenAI的重要战略伙伴，被市场认为将率先在Microsoft 365 Copilot、GitHub Copilot等旗舰产品中无缝集成GPT-5，这一预期直接推高了投资者对微软企业级订阅收入和客户粘性的乐观判断。在隔夜美股盘后交易中，微软股价虽未出现剧烈跳涨，但资金流向数据显示其买盘占比在消息发布后的两个小时内持续高于当日平均水平。

今年最期待的大模型——GPT-5上线，美国大模型混战白热化！

此外，AWS母公司亚马逊意外获得市场关注，尽管GPT-5核心仍托管在微软Azure云上，但亚马逊在发布会前后宣布AWS将支持部分OpenAI开放模型，使其在AI生态竞争格局中的能力边界被重新评估，推动亚马逊股价在正股交易时段上涨约3.7%，为当日表现最突出的科技蓝筹之一。

芯片与算力基础设施板块在隔夜市场的情绪同样明显提振。GPT-5的“thinking”模式以及更长上下文、多模态处理能力意味着单次推理调用的算力消耗将显著高于前代模型，从而直接利好GPU及专用AI加速卡的需求曲线。

在英伟达、AMD等代表性标的上，虽然隔夜盘后涨幅有限，但期权市场隐含波动率迅速走高，显示短期交易者已开始押注后续交易日的上行行情。此外，数据中心建设与高性能计算（HPC）设备的供应链厂商在亚洲与欧洲的股指期货交易中也受到带动，部分半导体设备类企业在隔夜欧洲市场上涨超过2%。

不过，市场也有分化。

部分机构在第一时间发布研报提醒，尽管GPT-5在多项基准测试中表现优异，但相较于GPT-4的跨代跃迁幅度，整体性能提升更偏向于“定向强化”而非全方位革命。这意味着从技术突破到收入兑现仍存在不确定性，尤其是企业客户在大规模部署时需权衡边际运行成本与性能提升的收益。由于GPT-5在推理模式下可能显著拉长响应时间并增加调用成本，如何在定价与算力消耗之间找到平衡，将直接影响OpenAI及其合作伙伴的盈利质量。

美国AI模型“大混战”

今年以来，美国大模型混战如火如荼，GPT-5的发布，更是将这场战役推向白热化。

2025年2月底，OpenAI推出了 GPT-4.5（代号“Orion”），作为GPT-4o的迭代升级，强调更自然的对话体验与视觉能力，并首次对多个语言提供支持。不久之后，OpenAI在4月初调整了大模型发布节奏，发布更轻量的o3与o4-mini版本，为GPT-5做预热。

与此同时，Google在2025年初持续推进其 Gemini 系列模型。2025年1月发布了 Gemini 2.0 Flash 默认模型，并随后推出更具弥合能力的 Gemini 2.0 Pro（具备“Deep Think”思考模式），以及 1 百万 token 的超长上下文窗口支持。之后，又推出了多模态、高效的 Gemini 2.5 Flash 和 2.5 Pro，并于6月上线了 Gemini 2.5 Flash-Lite 和开放研究版 Gemma 3，进一步扩大了其技术覆盖与开发者可访问性。

Anthropic并未缺席这一竞赛。其 Claude 系列从2023年初发布首版后，持续迭代推动能力提升。2024年3月推出 Claude 3 (包含Haiku、Sonnet、Opus 三版本)，其中 Opus 具备最强推理能力。2025年2月推出 Claude 3.7（Sonnet）具备混合推理模式；5月推出 Claude 4（Opus 和 Sonnet 版本），带来了“Extended thinking”与并行工具使用能力；8月初紧随 GPT-5 发布的是 Claude Opus 4.1。