OpenAI发布新一代低成本推理模型

OpenAI于周五推出新一代人工智能"推理"模型o3-mini，这是该公司o系列推理模型家族的最新成员。该模型在12月首次预览时，同步展示了一个性能更强的系统o3。

与大多数大语言模型不同，o3-mini等推理模型在输出结果前会进行全面的事实核查，这有助于避免常见错误。虽然推理过程需要更长时间，但在物理等专业领域的可靠性显著提升。

o3-mini专门针对科学（Science）、技术（Technology）、工程（Engineering）、数学（Mathematics）（简称STEM）问题进行优化。OpenAI表示，该模型在功能上与o1系列相当，但运行速度更快，成本更低。

外部测试显示，超过半数用户更倾向于选择o3-mini的答案而非o1-mini。在A/B测试中，o3-mini在处理复杂问题时的重大错误率降低39%，同时响应速度提升24%，答案表述更加清晰。

从周五开始，所有ChatGPT用户均可使用o3-mini。其中：

o3-mini通过OpenAI的应用程序接口（API）向特定开发者开放，初期不支持图像分析功能。开发者可根据具体需求选择低、中、高三种推理强度级别。

定价方面：

这一定价比o1-mini低63%，也具有市场竞争力。相比之下，DeepSeek的R1模型定价为：输入0.14美元/百万令牌，输出2.19美元/百万令牌。

在高强度推理模式下，o3-mini在多个测试中展现出优秀性能：

在安全性方面，o3-mini采用"深思熟虑的对齐"方法，确保模型在响应时严格遵循安全政策。据OpenAI介绍，该模型在安全性和防护能力方面显著超越了旗舰模型GPT-4o。