OpenAI于周五推出新一代人工智能"推理"模型o3-mini,这是该公司o系列推理模型家族的最新成员。该模型在12月首次预览时,同步展示了一个性能更强的系统o3。
与大多数大语言模型不同,o3-mini等推理模型在输出结果前会进行全面的事实核查,这有助于避免常见错误。虽然推理过程需要更长时间,但在物理等专业领域的可靠性显著提升。
o3-mini专门针对科学(Science)、技术(Technology)、工程(Engineering)、数学(Mathematics)(简称STEM)问题进行优化。OpenAI表示,该模型在功能上与o1系列相当,但运行速度更快,成本更低。
外部测试显示,超过半数用户更倾向于选择o3-mini的答案而非o1-mini。在A/B测试中,o3-mini在处理复杂问题时的重大错误率降低39%,同时响应速度提升24%,答案表述更加清晰。
从周五开始,所有ChatGPT用户均可使用o3-mini。其中:
o3-mini通过OpenAI的应用程序接口(API)向特定开发者开放,初期不支持图像分析功能。开发者可根据具体需求选择低、中、高三种推理强度级别。
定价方面:
这一定价比o1-mini低63%,也具有市场竞争力。相比之下,DeepSeek的R1模型定价为:输入0.14美元/百万令牌,输出2.19美元/百万令牌。
在高强度推理模式下,o3-mini在多个测试中展现出优秀性能:
在安全性方面,o3-mini采用"深思熟虑的对齐"方法,确保模型在响应时严格遵循安全政策。据OpenAI介绍,该模型在安全性和防护能力方面显著超越了旗舰模型GPT-4o。