DeepSeek是什么?如何颠覆美国、硅谷AI布局(组图)
中国大陆AI新创公司DeepSeek推出的最新模型DeepSeek-R1,以突破性的性能比拟知名模型如OpenAI的ChatGPT和Meta的Llama模型,在一些应用领域中,性能甚至已经超越业界所谓的领先系统,而成本却不到2亿新台币,远低于动辄数亿美元的传统AI模型训成本成为矽谷和全球热议焦点。
中国AI新星震撼矽谷,DeepSeek重塑AI发展格局。 (示意图:shutterstock/达志)
成本效益惊人
DeepSeek-R1在数学、程式设计与复杂问题解决等任务中的推理表现,已与OpenAI的o1等领先模型匹敌,甚至在部分指标上超越,而模型开发成本仅约600万美元(约新台币1.97亿元),模型的开发仅耗时两个月,而且使用的是辉达(Nvidia)相对较旧的H800 GPU晶片进行训练,相较于Meta和OpenAI等美国科技巨头动辄数亿美元的训练开支,显得格外高效。
开源策略
这一突破引发了对AI产业竞争格局的广泛讨论。分析人士认为,DeepSeek-R1可能促使业界从一味追求超大模型的竞赛,转向更重视效率与设计的策略。
DeepSeek采用开放原始码的做法,完全开源使得DeepSeek-R1可以让全世界的开发人员都能使用,挑战了当前以封闭为主的AI产业现状,不仅提升了技术透明度和降低门槛,还为研究人员和开发者提供了深入参与的机会,有望掀起新一波的开源AI发展浪潮。
DeepSeek的AI助手应用最近快速登上手机应用商店排行榜首,显示出广大用户对这项技术的兴趣与支持。 DeepSeek-R1的中国背景为这一技术突破增添了地缘政治色彩。在美中科技竞争日益激烈的背景下,这一进展既引发对技术领先地位的关注,也彰显全球创新的多样性。
中国AI崛起美科技股重挫
路透社报导指出,受到中国大陆DeepSeek-R1 AI模型快速崛起影响,纳斯达克指数期货周一(27日)大幅下挫,AI相关股卖压涌现,其中辉达(Nvidia)跌幅最大,DeepSeek的App已经超越ChatGPT,成为美国苹果App Store下载量最高的免费应用程式。
使用低成本晶片与更少的资料训练,冲击了原先市场对于AI需求,将推动晶片制造与数据中心产业增长的预期,辉达股价在盘前交易中暴跌6.9%,超微与美光分别下跌3.7 %与6.4%。微软与Meta跌幅均为3.3%,Google母公司Alphabet下跌3.2%,苹果跌1.4%。 AI伺服器制造商戴尔与美超微(Super Micro Computer)则各下跌约8%。