智东西
编译 江宇
编辑 李水青
智东西4月17日消息,今日,据外媒The Information报道,DeepSeek正首次寻求外部融资,目标估值超过100亿美元(约合人民币681.8亿元)。
据多位知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元(约合人民币20.5亿元),以补充资金储备,应对AI大模型研发日益高昂的成本竞争。
如果本轮融资落地,DeepSeek将首次引入外部资本,也意味着其长期坚持的“自我供血”模式出现转变。DeepSeek由母公司幻方量化孵化并持续输血,过去曾拒绝多家国内头部VC和科技巨头的投资邀约。
这一转向背后,一方面是资金压力加大,另一方面或许也与其近期的人才流失有关。
自2025年初,DeepSeek-R1模型爆红以来,DeepSeek尚未推出新一代模型,同时多位核心研究人员相继离开。其中,DeepSeek V3模型重要贡献者罗福莉已加入小米负责AI业务,另一位核心研究员郭达雅则跳槽至字节跳动,薪资大幅提升。
引入外部资金后,DeepSeek有望加大算力投入,继续推进前沿模型研发,同时通过更具竞争力的薪酬体系稳定核心团队。
不过,这笔融资也可能面临一定不确定性。知情人士称,部分美国投资机构在是否参与投资上态度相对谨慎。此前,美国国会曾对DeepSeek提出过相关质疑,但目前该公司并未被纳入任何美国贸易限制名单。
产品层面,DeepSeek原计划于今年2月发布下一代旗舰模型DeepSeek V4,但因工程问题多次推迟。
报道称,其团队正在投入大量精力,使模型能够直接适配华为昇腾芯片运行,这一调整也拖慢了进度——此前其模型主要基于英伟达芯片。
行业环境的变化同样构成压力来源。当前AI模型迭代速度持续加快,中美科技巨头凭借资金优势不断加码,对初创公司形成挤压,这也被认为是DeepSeek转向融资的重要背景。
值得一提的是,DeepSeek此前推出的R1模型曾以更低成本实现接近海外顶级模型的性能,引发市场广泛关注,并一度引起资本市场对高端AI芯片长期需求的重新审视。该模型主要基于A100、H800等上一代芯片训练完成,这些芯片原本用于其母公司幻方量化的数据训练。
另据The Information此前报道,DeepSeek正在使用英伟达最新一代Blackwell芯片训练下一代模型,不过该类芯片目前受到出口管制影响,获取存在一定限制。
来源:The Information