上周末,中国人工智能模型Deepseek引发业界地震,在美国,多家头部科技公司股份应声大跌 。
这款AI对话机器人产品由中国一家人工智能初创公司推出,并以开源模式与全球开发者共享,用户可以免费使用与修改、也可以应用于商业目的。
据称,其开发成本低廉,性能堪比世界最领先的AI模型 。
继中国社交软件"小红书"一度于上周成为苹果公司应用商店下载榜的第一名之后,这几天,DeepSeek一举超越了ChatGPT等AI巨头 -- 中国产品再次登顶该榜。
这家之前并不广为人知的软件,短短几天,就成为了各大媒体争相报道的焦点,引发社交媒体的热议。
何以横扫业界?
此前,在OpenAI 于2022 年末推出 ChatGPT后,虽然中国搜索引擎公司"百度"发布了类似的中文聊天机器人,但不久后热度有所减退,人们总体上认为中美在人工智能方面还存在着不小的差距。
而现在,DeepSeek 模型的质量和成本效益似乎颠覆了这一认知。
据称,DeepSeek-R1的使用成本比 OpenAI o1 模型低 20 到 50 倍,并且DeepSeek-V3 和 DeepSeek-R1 两个模型都受到了美国硅谷高管和科技工程师的好评,被认为与 OpenAI 和 Meta 最先进的模型不相上下 。
不过,怀疑的声音则表示,DeepSeek的成本并非如其所说之低。
Scale AI首席执行官Alexandr Wang曾表示DeepSeek拥有5万块英伟达H100芯片。
伯恩斯坦(Bernstein)的研究人员表示,DeepSeek V3 模型的训练总成本远高于该公司所称的用于计算能力的 558 万美元,其备受好评的 R1 模型的培训成本也未披露 。
DeepSeek 的开发者是谁?
根据DeepSeek应用程序的对话以及其官方信息,深度求索(DeepSeek)公司位于中国杭州,"是一家专注于实现AGI的中国的人工智能"(注,AGI指通用人工智能,即artificial general intelligence)。
该公司成立于2023年。其官微的第一篇文章发布于2023年11月3日,主题为"可能是最强的开源代码大模型", 内文称:(公司)成立半年后,DeepSeek 带着代码大模型与大家见面了。免费商用,完全开源。
根据中国政 府网发布的信息,1 月 20 日,DeepSeek公司创始人梁文锋出席了由中国总理李强主持的"专家、企业家和教科文卫体等领域代表座谈会"。 去年,百度首席执行官李彦宏也出席了类似的研讨会。
值得注意的是,梁文锋参加会议的第二天,1月21日,是该公司公开推出DeepSeek-R1的日子。这家公司官微于当天发布文章表示,其DeepSeek-R1在性能上"对标OpenAI-o1正式版"。
人们如何反应?
如果DeepSeek开发成本远低于美国的顶级产品,而性能相差不大 -- 在这两者之间,市场会选择什么?股市已经给出了回答。
在DeepSeek手机APP的注册页面,可以看到,该软件可以接受电子邮件、苹果账号、谷歌账号的登陆,不过在手机号码登陆处,显示只接受中国大陆的号码。
另外,它的自我审核,包括符合"社会主义核心价值观"的自我要求,对政治或中国领导人有关敏感话题的回避,也受到一些用户的关注。
同时,目前从海外用户处所收集到的一些声音也包括:够用就行,普通人大多不在乎这些。
这款某种程度上受到限制的AI产品,其未来的发展趋势如何,有待进一步观察。