深度探索(DeepSeek)的聊天机器人应用于2025年1月在苹果应用商店和谷歌应用商店排行榜上名列前茅。该公司采用计算效率更高的技术训练AI模型,引发华尔街分析师和技术专家对美国AI领导地位的讨论,以及对AI芯片需求持续性的思考。
深度探索的主要投资方是中国量化对冲基金高瓴投资(High-Flyer Capital Management)。该基金创始人梁文峰在浙江大学期间开始接触交易领域,并于2019年将高瓴投资发展为专注AI算法的对冲基金。
2023年,高瓴投资成立深度探索实验室研究AI工具。随后在高瓴投资支持下,实验室独立成为深度探索公司。
深度探索自主建设数据中心集群进行模型训练。受美国硬件出口限制影响,公司使用性能较弱的英伟达H800芯片替代H100芯片进行模型训练。公司积极从中国顶尖高校招募AI领域博士研究生,并吸纳多领域人才以提升技术应用范围。
2023年11月,深度探索首次发布DeepSeek Coder、DeepSeek LLM和DeepSeek Chat等模型。2024年春季推出的DeepSeek-V2系列在AI基准测试中表现优异,运行成本显著低于同类产品,迫使字节跳动和阿里巴巴等竞争对手调整定价策略。
2024年12月发布的DeepSeek-V3模型性能超越Meta的Llama等开源模型和OpenAI的GPT-4等闭源模型。2025年1月推出的R1推理模型在关键指标上可与OpenAI的o1模型相媲美,具备自我核查能力,在物理、科学和数学等领域表现更为可靠。
深度探索的低价策略引发业界争议。公司声称这归功于效率突破,但部分专家对此持怀疑态度。据Hugging Face平台数据显示,基于R1开发的衍生模型已超500个,累计下载量达250万次。
公司的成功影响了行业格局,导致英伟达股价大幅下跌,引发OpenAI CEO Sam Altman的回应。微软已将深度探索纳入Azure AI Foundry服务体系。尽管模型持续改进可期,但美国政府对外国AI影响力的警惕正在增强。