
DeepSeek:从量化投资到AI大模型的“黑马”崛起
DeepSeek的横空出世,在短短几周内使其从默默无闻跃升为AI大模型领域的顶流,甚至引发了华尔街的震荡。这并非偶然,而是多年技术积累和战略布局的结果。
DeepSeek脱胎于量化投资公司幻方量化,后者自2015年成立以来,一直致力于将AI技术应用于金融投资。在多年的实践中,幻方量化积累了丰富的AI技术和海量数据,并构建了强大的AI算力集群,这为DeepSeek的诞生奠定了坚实的基础。 在2023年,DeepSeek正式成立,并快速迭代推出DeepSeek Coder、DeepSeek LLM以及具有突破性意义的DeepSeek-V2和DeepSeek-R1等大模型产品。DeepSeek-V2凭借其创新的多头潜在注意力机制和极具竞争力的价格,引发了业界的价格战,并受到了硅谷的关注。DeepSeek-R1更是对标OpenAI的顶级模型,在性能上与其不相上下,同时大幅降低了训练和运行成本。
DeepSeek的成功,并非一蹴而就,也经历了诸如2021年因业绩回撤而致歉的挫折。但这些经验教训,反过来促使了DeepSeek在技术上的不断精进和突破。
DeepSeek的崛起,对整个AI大模型行业,特别是对英伟达为首的GPU厂商,都造成了巨大的冲击。然而,DeepSeek的长期影响力和可持续性仍有待观察。虽然其在技术上取得了显著的进步,但在国产大模型与国际先进水平之间的技术代差,以及对算力需求的减少程度等问题,仍需进一步验证。业内人士建议,应理性看待DeepSeek的成就,避免情绪化,并持续关注其后续发展。
发表评论