DeepSeek：从量化投资到AI大模型的“黑马”崛起

author 02-07 13 2条评论

默认

摘要： DeepSeek的横空出世，在短短几周内使其从默默无闻跃升为AI大模型领域的顶流，甚至引发了华尔街的震荡。这并非偶然，而是多年技术积累和战略布局的结果。DeepSeek脱胎于量...

DeepSeek的横空出世，在短短几周内使其从默默无闻跃升为AI大模型领域的顶流，甚至引发了华尔街的震荡。这并非偶然，而是多年技术积累和战略布局的结果。

DeepSeek脱胎于量化投资公司幻方量化，后者自2015年成立以来，一直致力于将AI技术应用于金融投资。在多年的实践中，幻方量化积累了丰富的AI技术和海量数据，并构建了强大的AI算力集群，这为DeepSeek的诞生奠定了坚实的基础。在2023年，DeepSeek正式成立，并快速迭代推出DeepSeek Coder、DeepSeek LLM以及具有突破性意义的DeepSeek-V2和DeepSeek-R1等大模型产品。DeepSeek-V2凭借其创新的多头潜在注意力机制和极具竞争力的价格，引发了业界的价格战，并受到了硅谷的关注。DeepSeek-R1更是对标OpenAI的顶级模型，在性能上与其不相上下，同时大幅降低了训练和运行成本。

DeepSeek的成功，并非一蹴而就，也经历了诸如2021年因业绩回撤而致歉的挫折。但这些经验教训，反过来促使了DeepSeek在技术上的不断精进和突破。

DeepSeek的崛起，对整个AI大模型行业，特别是对英伟达为首的GPU厂商，都造成了巨大的冲击。然而，DeepSeek的长期影响力和可持续性仍有待观察。虽然其在技术上取得了显著的进步，但在国产大模型与国际先进水平之间的技术代差，以及对算力需求的减少程度等问题，仍需进一步验证。业内人士建议，应理性看待DeepSeek的成就，避免情绪化，并持续关注其后续发展。

标签：人工智能 AI大模型量化投资金融科技 AI技术