1月27日,就在中国即将迎来农历新年时,1月27日,一则“DeepSeek应用超越ChatGPT,登顶苹果美国区免费App下载排行榜”的消息引爆市场,海内外的技术同行,投资机构都在讨论这家被称为“大模型版拼多多”的中国公司。
近年来,包括微软、谷歌、Meta、亚马逊和特斯拉在内的科技巨头一直在增加和AI相关的投资。这一些企业预计将于2025年在AI领域总共投资约2000亿美元,其中大部分投资用于数据中心的建设。
中国人工智能初创公司DeepSeek“现象级”的崛起,“意外”地“掀翻”了美国科技股,并引发了市场对美国技术主导地位的质疑。
当天美股盘前,英伟达股价大跌超过12%,市值蒸发预计将超3000亿美元,这比AMD和英特尔的市值总和还要高。目前AMD市值约为2000亿美元,英特尔市值不到900亿美元。
此外,微软、谷歌、Meta和亚马逊股价跌幅在4%至6%,台积电美股ADR也重挫超7%!这令美股主要科技公司当天市值或共计蒸发上万亿美元。而未来一周,包括Meta、微软、苹果在内的科技公司都将公布财报。
瑞士联合私立银行董事总经理 Vey-Sern Ling 表示:“DeepSeek 表明,开发低成本的高性能 AI 模型是可能的。这可能会动摇整个 AI 供应链的投资逻辑,因为目前这一供应链主要由少数超大规模企业的高额支出驱动。”
“火”到海外之后,A股今日多只相关概念股开盘大涨。其中既包括网传DeepSeek的股东,又包括网传DeepSeek的合作方。而算力硬件股持续走低,铜高速连接、CPO等方向领跌,仕佳光子跌超16%,兆龙互连、天孚通信等跌超10%。
据悉,DeepSeek推理大模型DeepSeek-R1发布已逝去近一周时间,开源模型DeepSeek-V3也已经发布了近一个月。DeepSeek-V3在仅使用2048块H800 GPU的情况下,完成了6710亿参数模型的训练,成本仅为557.6万美元,远低于其他顶级模型如GPT-4的10亿美元。
DeepSeek是幻方量化旗下的AI公司,成立于2023年7月,是一家注册在杭州的创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
DeepSeek-R1-Zero展示的无SFT的强化学习技术为大模型开发者提供了一种新的训练范式,即通过强化学习来激发模型的内在潜力,从而在多个领域实现更高效、更精准的推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。对于小模型,DeepSeek-R1-Distill系列通过知识蒸馏技术,成功将大模型的推理能力传递给小模型,实现了小模型在推理任务上的显著提升,引领了小模型的发展方向。
在数据训练方面,DeepSeek却下足了功夫。它在14.8万亿高质量token上进行了预训练,丰富的数据来源和严格的数据筛选,使得DeepSeek的模型能够学习到更广泛、更准确的知识,从而在各项任务中表现出色。
DeepSeek页面极为简洁,主框上只有深度思考、联网搜索、发送三个按钮。公开信息数据显示,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
从常规的新闻搜索功能来看,DeepSeek的亮点在于,总结简洁,而且重点突出,收集的内容也不局限于国内平台。
与此同时,DeepSeek的数学题解答能堪称快速、准确。除了能够正确回答问题,还能详细展示思考步骤,部分问题还能反复验证答案,甚至使用其他方式再计算一次。
在人工智能方面的持续投入也在不断推动这些巨头企业的估值。但DeepSeek正在以低成本的方式颠覆目前AI市场的格局,这引发了长期资金市场的恐慌,也代表着未来人工智能科技公司的估值可能迎来重构。
DeepSeek-R1 API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,远低于可比大模型API服务。DeepSeek-R1的超高的性价比API定价有助于开发者在使用后加速模型的功能迭代,从而解决目前模型存在的不足。
《》则称,如果最好的开源技术来自中国,美国研发人员将在这些技术的基础上构建他们的系统。从长远来看,这可能会让中国成为研发AI的中心。
新加坡机构Aletheia Capital消费和互联网业务主管Nirgunan Tiruchelvam 表示,过去硅谷投入巨额资本和运营费用被认为是应对人工智能发展的新趋势最合适方式,但DeepSeek的产品“严重违背了这一逻辑”,它让人怀疑投入人工智能的大量资源是否值得。
值得关注的是,DeepSeek的模型是使用易于访问的开源技术构建的。这引发了市场对美国人工智能技术领先中国多年观点的质疑。
本月亦有消息称 Facebook 母公司 Meta 成立了四个专门研究小组来研究 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。
1 月 27 日消息,据 CNBC 报道,微软首席执行官萨提亚・纳德拉在瑞士达沃斯的世界经济论坛上表示:“DeepSeek 的新模型令人印象非常深刻,尤其是在如何高效开发开源模型并进行推理计算方面,它的计算效率很出色。我们应当非常、非常认真地对待来自中国的这些技术进展。”
在之前,Meta创始人兼CEO马克·扎克伯格便在一档播客节目中表示,DeepSeek的大模型非常先进,中国正在全力冲刺,美国科技行业虽然暂时领先,但两者差距很小。
“虽然英伟达等公司目前占据技术制高点,但DeepSeek的崛起,提醒我们人工智能的主导地位尚无定论。”盛宝银行市场首席投资策略师Charu Chanana表示,“竞争正在加剧,虽然DeepSeek现在可能不构成重大威胁,但这表明未来的竞争对手将发展得更快,并更快地挑战老牌科技巨头公司。本周的科技公司财报将是一个巨大的考验。”
黑崎资本首席战略官陈兴文和记者说,DeepSeek的低成本意味着大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而英伟达等硬件商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生一定的影响。DeepSeek此次大规模开源行动引发的行业震动,本质上是技术浪潮对传统AI研发范式的结构性冲击。
除了技术上的创新,DeepSeek的开源模式也是其迅速崛起的主要的因素之一。在AI领域,开源意味着共享和协作,能够吸引全球开发者的参与和贡献,加速技术的迭代和创新。
DeepSeek自成立以来,一直秉持着开源的理念,先后开源了多个版本的模型,如DeepSeek-V2、DeepSeek-V3等。这些开源模型不仅为全球开发者提供了免费、高效的AI工具,也促进了AI技术的普及和应用。通过开源,DeepSeek吸引了大量来自世界各地的开发者和研究人员,形成了一个庞大的社区生态。大家在这个社区同交流、分享经验,不断推动DeepSeek模型的优化和改进。
这种开源模式不仅让DeepSeek在全世界内获得了广泛的认可和支持,也为中国AI技术的发展赢得了良好的国际声誉。慢慢的变多的国际开发者开始关注和参与到中国AI开源项目中来,为中国AI技术的创新和发展注入了新的活力。
DeepSeek验证了中国AI企业“用架构创新压缩技术代差”的可能性,评价其“使美国芯片封锁沦为战略败笔”,周鸿祎更直言这是“中国突破硅谷技术铁幕的里程碑”。长期资金市场对此的剧烈反应更是必然。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
“太想回国了!”湖南商人哽咽讲述撤离曼德勒:连开十多小时不敢停,途中遭遇持枪收费
刚刚,青岛官宣中考政策!山东11地市政策已落地!2025山东中考新政全盘点!
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
128GB+2TB 14999元!极摩客首发AMD锐龙AI Max+ 395迷你机 变身AI超算