来源:
大纪元
前几天,DeepSeek的消息引发了美国金融市场的风波。大陆媒体和小粉红更是兴奋地将DeepSeek吹捧为所谓的“中国AI崛起的象征”。
然而,在一片喧嚣之中,DeepSeek也身陷诸多质疑和批评——其技术突破是否真正具有创新性?团队的透明度是否足够?市场营销是否存在夸大成分?
技术突破来自对美国技术的“盗用”?
中方高调宣称DeepSeek的技术突破来自于中国的自主创新,但据海外媒体报导,ChatGPT的所有者微软和OpenAI认为,DeepSeek不当获取了自己的核心数据和模型。
OpenAI1月29日表示,它们已掌握证据,显示DeepSeek盗用其模型进行开发。
白宫人工智慧与加密特使大卫·O·萨克斯(David Sacks)也表示,有大量证据表明DeepSeek利用OpenAI的模型输出数据,建立了自己的训练集,而这种方法在业界被称为“蒸馏”或“模型复现”。
从当前公开信息来看,DeepSeek的核心技术框架,如大规模预训练、Transformer架构和优化算法,确实与OpenAI、Google DeepMind等公司的研究成果有相似之处。
据新唐人报导,一名AI专业人员透露:DeepSeek确实有一些原创技术,包括减少了对GPU的使用,但在数据上主要是用了60万长链条数据集,其中大部分是蒸馏获得的,然后结合了多轮投票增强学习,变成了自己的东西。什么意思呢?就是说,这是一个比较聪明的小偷或抄作业的,但还是做了。
实际上,DeepSeek自己也招了。很多人在问它是谁的时候,它有时回答自己是ChatGPT,有时说是GPT-4,还老老实实地交代自己使用了OpenAI的哪些工具。
据悉,目前微软和OpenAI正在进行深入调查,同时已经封禁了与DeepSeek相关的可疑账户。如果证据确凿,这可能是近年来AI领域最大的数据盗窃案之一。
DeepSeek的真实实力究竟如何?
DeepSeek号称是国内少数能够“对标GPT-4”的模型之一,但实际体验后,许多用户发现其表现仍然存在较大的差距。尽管官方在多个平台展示了测试结果,但这些结果往往是经过精挑细选的最佳案例,而非随机样本的真实评测。一些用户反馈,DeepSeek在长文本理解、逻辑推理以及代码生成等核心能力上仍有明显短板,甚至在某些任务上表现不如早期版本的ChatGPT 3.5。
此外,DeepSeek的论文与技术文档相对较少,缺乏详实的技术细节披露。与OpenAI、Anthropic等国际领先团队相比,DeepSeek在学术透明度方面仍存在很大欠缺。
DeepSeek“高调宣传+低调研究”的模式,也是让人怀疑其是否真正具备自主创新能力,抑或只是借助现有开源技术,进行包装和二次开发的一个重要原因。
DeepSeek的成本真的挑战美国最强AI?
DeepSeek声称其大模型是在“低算力条件”下训练完成的,V3模型训练成本仅为560万美元,这比OpenAI、Meta等用于预训练大型语言模型动辄数亿美元的成本要低得多。这一说法虽然吸引眼球,但从技术角度来看,仍然存在诸多疑点。许多专家,包括马斯克和Scale AI的执行长Alexandr Wang,都不相信。
首先,大模型训练的核心成本来自于算力。现阶段,主流大模型(如GPT-4级别)通常需要数万个高性能GPU(如A100、H100)连续训练数月。而根据市场价格,单张H100的售价高达2万美元,即便是云租赁,长期大规模使用的成本也十分昂贵。在如此高昂的算力消耗下,DeepSeek如何以560万美元的预算完成训练,值得深究。
其次,训练成本不仅包括算力消耗,还涉及数据采购、存储、工程优化、人力成本等多个方面。高质量的训练数据需要清洗、标注,并经过多轮优化,而这本身就是一笔巨大开销。此外,大模型的训练往往需要反复迭代调整,以提升最终性能,而非一次性完成。DeepSeek是否通过某种特殊技术或极端优化手段大幅降低成本?如果是,其方法为何未在业界广泛应用?
此外,DeepSeek作为一家中国公司,其GPU采购渠道是否受限也是一个需要考量的问题。由于全球芯片供应链的限制,中国市场上的高端GPU价格通常高于海外,且获取难度较大。在这种情况下,其低成本训练的实现路径更显得扑朔迷离。
DeepSeek是真开源还是“半开源”?
DeepSeek宣布开源模型,初看似乎是一项重大利好,但仔细审视后,人们发现所谓的“开源”并不彻底。真正的训练细节、优化策略、数据来源等核心信息仍然没有完全公开,导致业界难以对其技术路线进行严肃的学术分析。真正的开源应该像Meta旗下的Llama或Mistral那样,将关键代码和方法论彻底公开,而不是“半遮半掩”。相较于Llama系列、Mistral AI等更开放的做法,DeepSeek的开源行为更像是一种“半开源”,目的可能更多是为了博取关注和市场认可,而非推动整个AI生态的发展。
更值得注意的是,DeepSeek也可能受到中共官方政策与监管压力的影响,导致其开源策略受到掣肘。如果一个模型在技术上宣称要与国际一流对标,却在透明度上选择性“封闭”,那么这种开源行为是否只是营销手段,而非真正的技术贡献?
面对众多质疑的DeepSeek,可以说现在正站在一个关键的十字路口:如果真的要“深度求索”,那么必须拿出扎实的技术和真正的突破,而不是靠一轮又一轮的营销造势来维持热度。否则,它最终可能沦为又一个AI泡沫,被市场无情淘汰。
from 博谈网 https://botanwang.com/articles/202502/%E7%89%9B%E7%9A%AE%E5%90%B9%E7%A0%B4%EF%BC%9Fdeepseek%E8%BA%AB%E9%99%B7%E5%9B%9B%E5%A4%A7%E8%B4%A8%E7%96%91.html