来源:
法广
特朗普政府对电子商务采取严厉措施,显然计划取消长期以来对价值低于800美元的包裹的关税豁免。
特朗普的行政命令要求对加拿大和墨西哥征收25%的关税,对中国征收10%的关税,并规定小包裹的“小额豁免规则”不再适用。根据豁免规定,低于该金额的产品可以免关税进入美国,这对中国电子商务零售商来说是一个利好,因为他们通常会将更便宜的商品直接运送给美国消费者。这个微不足道的“漏洞”也使与中国有联系的电子商务公司比实体零售商和亚马逊公司等在线零售商更具优势。
彭博社报道引述贸易律师表示,特朗普打击免税低值规则的措辞可能广泛适用,甚至适用于对中国、加拿大和墨西哥的现有关税。
报道称,无论如何,这一变化的影响有可能最直接地落在中国,影响到包括阿里巴巴、京东、拼多多海外版Temu和专营时尚的希音(Shein)在内的线上零售商。据美国海关和边境保护局估计,去年前九个月,美国购物者和公司利用这一漏洞从全球进口了价值约480亿美元的货物。
周六,一位美国高级政府官员为终止“小额豁免”辩护,称美国损失了大量关税收入,小额包裹的漏洞也妨碍了美国海关官员抓获流入美国的芬太尼的能力。但这位官员没有具体说明变化的范围。
美国有议员警告说,“小额豁免规则”使芬太尼和用于制造这种致命药物的前体化学品更容易逃避海关,不被发现地进入美国。
野村控股公司经济学家的研究显示,小额货物占中国对美出口的十分之一以上。
据彭博社,美国海关和边境保护局称,2024财年,经“小额豁免规则”进入美国货物总量达到14亿件,约为2022年的两倍。特木(Temu)和希音(Shein)等折扣在线零售商对数量激增做出了重大贡献。
阿里巴巴、京东、Shein和Temu没有立即回应彭博置评请求。
from 博谈网 https://botanwang.com/articles/202502/%E7%89%B9%E6%9C%97%E6%99%AE%E5%85%B3%E7%A8%8E%E7%9E%84%E5%87%86%E4%B8%AD%E5%9B%BD%E7%BD%91%E7%BB%9C%E9%9B%B6%E5%94%AE%E5%95%86%E5%88%A9%E7%94%A8%E7%9A%84%E2%80%9C%E6%BC%8F%E6%B4%9E%E2%80%9D.html
Sunday, 2 February 2025
牛皮吹破?DeepSeek身陷四大质疑
来源:
大纪元
前几天,DeepSeek的消息引发了美国金融市场的风波。大陆媒体和小粉红更是兴奋地将DeepSeek吹捧为所谓的“中国AI崛起的象征”。
然而,在一片喧嚣之中,DeepSeek也身陷诸多质疑和批评——其技术突破是否真正具有创新性?团队的透明度是否足够?市场营销是否存在夸大成分?
技术突破来自对美国技术的“盗用”?
中方高调宣称DeepSeek的技术突破来自于中国的自主创新,但据海外媒体报导,ChatGPT的所有者微软和OpenAI认为,DeepSeek不当获取了自己的核心数据和模型。
OpenAI1月29日表示,它们已掌握证据,显示DeepSeek盗用其模型进行开发。
白宫人工智慧与加密特使大卫·O·萨克斯(David Sacks)也表示,有大量证据表明DeepSeek利用OpenAI的模型输出数据,建立了自己的训练集,而这种方法在业界被称为“蒸馏”或“模型复现”。
从当前公开信息来看,DeepSeek的核心技术框架,如大规模预训练、Transformer架构和优化算法,确实与OpenAI、Google DeepMind等公司的研究成果有相似之处。
据新唐人报导,一名AI专业人员透露:DeepSeek确实有一些原创技术,包括减少了对GPU的使用,但在数据上主要是用了60万长链条数据集,其中大部分是蒸馏获得的,然后结合了多轮投票增强学习,变成了自己的东西。什么意思呢?就是说,这是一个比较聪明的小偷或抄作业的,但还是做了。
实际上,DeepSeek自己也招了。很多人在问它是谁的时候,它有时回答自己是ChatGPT,有时说是GPT-4,还老老实实地交代自己使用了OpenAI的哪些工具。
据悉,目前微软和OpenAI正在进行深入调查,同时已经封禁了与DeepSeek相关的可疑账户。如果证据确凿,这可能是近年来AI领域最大的数据盗窃案之一。
DeepSeek的真实实力究竟如何?
DeepSeek号称是国内少数能够“对标GPT-4”的模型之一,但实际体验后,许多用户发现其表现仍然存在较大的差距。尽管官方在多个平台展示了测试结果,但这些结果往往是经过精挑细选的最佳案例,而非随机样本的真实评测。一些用户反馈,DeepSeek在长文本理解、逻辑推理以及代码生成等核心能力上仍有明显短板,甚至在某些任务上表现不如早期版本的ChatGPT 3.5。
此外,DeepSeek的论文与技术文档相对较少,缺乏详实的技术细节披露。与OpenAI、Anthropic等国际领先团队相比,DeepSeek在学术透明度方面仍存在很大欠缺。
DeepSeek“高调宣传+低调研究”的模式,也是让人怀疑其是否真正具备自主创新能力,抑或只是借助现有开源技术,进行包装和二次开发的一个重要原因。
DeepSeek的成本真的挑战美国最强AI?
DeepSeek声称其大模型是在“低算力条件”下训练完成的,V3模型训练成本仅为560万美元,这比OpenAI、Meta等用于预训练大型语言模型动辄数亿美元的成本要低得多。这一说法虽然吸引眼球,但从技术角度来看,仍然存在诸多疑点。许多专家,包括马斯克和Scale AI的执行长Alexandr Wang,都不相信。
首先,大模型训练的核心成本来自于算力。现阶段,主流大模型(如GPT-4级别)通常需要数万个高性能GPU(如A100、H100)连续训练数月。而根据市场价格,单张H100的售价高达2万美元,即便是云租赁,长期大规模使用的成本也十分昂贵。在如此高昂的算力消耗下,DeepSeek如何以560万美元的预算完成训练,值得深究。
其次,训练成本不仅包括算力消耗,还涉及数据采购、存储、工程优化、人力成本等多个方面。高质量的训练数据需要清洗、标注,并经过多轮优化,而这本身就是一笔巨大开销。此外,大模型的训练往往需要反复迭代调整,以提升最终性能,而非一次性完成。DeepSeek是否通过某种特殊技术或极端优化手段大幅降低成本?如果是,其方法为何未在业界广泛应用?
此外,DeepSeek作为一家中国公司,其GPU采购渠道是否受限也是一个需要考量的问题。由于全球芯片供应链的限制,中国市场上的高端GPU价格通常高于海外,且获取难度较大。在这种情况下,其低成本训练的实现路径更显得扑朔迷离。
DeepSeek是真开源还是“半开源”?
DeepSeek宣布开源模型,初看似乎是一项重大利好,但仔细审视后,人们发现所谓的“开源”并不彻底。真正的训练细节、优化策略、数据来源等核心信息仍然没有完全公开,导致业界难以对其技术路线进行严肃的学术分析。真正的开源应该像Meta旗下的Llama或Mistral那样,将关键代码和方法论彻底公开,而不是“半遮半掩”。相较于Llama系列、Mistral AI等更开放的做法,DeepSeek的开源行为更像是一种“半开源”,目的可能更多是为了博取关注和市场认可,而非推动整个AI生态的发展。
更值得注意的是,DeepSeek也可能受到中共官方政策与监管压力的影响,导致其开源策略受到掣肘。如果一个模型在技术上宣称要与国际一流对标,却在透明度上选择性“封闭”,那么这种开源行为是否只是营销手段,而非真正的技术贡献?
面对众多质疑的DeepSeek,可以说现在正站在一个关键的十字路口:如果真的要“深度求索”,那么必须拿出扎实的技术和真正的突破,而不是靠一轮又一轮的营销造势来维持热度。否则,它最终可能沦为又一个AI泡沫,被市场无情淘汰。
from 博谈网 https://botanwang.com/articles/202502/%E7%89%9B%E7%9A%AE%E5%90%B9%E7%A0%B4%EF%BC%9Fdeepseek%E8%BA%AB%E9%99%B7%E5%9B%9B%E5%A4%A7%E8%B4%A8%E7%96%91.html
大纪元
前几天,DeepSeek的消息引发了美国金融市场的风波。大陆媒体和小粉红更是兴奋地将DeepSeek吹捧为所谓的“中国AI崛起的象征”。
然而,在一片喧嚣之中,DeepSeek也身陷诸多质疑和批评——其技术突破是否真正具有创新性?团队的透明度是否足够?市场营销是否存在夸大成分?
技术突破来自对美国技术的“盗用”?
中方高调宣称DeepSeek的技术突破来自于中国的自主创新,但据海外媒体报导,ChatGPT的所有者微软和OpenAI认为,DeepSeek不当获取了自己的核心数据和模型。
OpenAI1月29日表示,它们已掌握证据,显示DeepSeek盗用其模型进行开发。
白宫人工智慧与加密特使大卫·O·萨克斯(David Sacks)也表示,有大量证据表明DeepSeek利用OpenAI的模型输出数据,建立了自己的训练集,而这种方法在业界被称为“蒸馏”或“模型复现”。
从当前公开信息来看,DeepSeek的核心技术框架,如大规模预训练、Transformer架构和优化算法,确实与OpenAI、Google DeepMind等公司的研究成果有相似之处。
据新唐人报导,一名AI专业人员透露:DeepSeek确实有一些原创技术,包括减少了对GPU的使用,但在数据上主要是用了60万长链条数据集,其中大部分是蒸馏获得的,然后结合了多轮投票增强学习,变成了自己的东西。什么意思呢?就是说,这是一个比较聪明的小偷或抄作业的,但还是做了。
实际上,DeepSeek自己也招了。很多人在问它是谁的时候,它有时回答自己是ChatGPT,有时说是GPT-4,还老老实实地交代自己使用了OpenAI的哪些工具。
据悉,目前微软和OpenAI正在进行深入调查,同时已经封禁了与DeepSeek相关的可疑账户。如果证据确凿,这可能是近年来AI领域最大的数据盗窃案之一。
DeepSeek的真实实力究竟如何?
DeepSeek号称是国内少数能够“对标GPT-4”的模型之一,但实际体验后,许多用户发现其表现仍然存在较大的差距。尽管官方在多个平台展示了测试结果,但这些结果往往是经过精挑细选的最佳案例,而非随机样本的真实评测。一些用户反馈,DeepSeek在长文本理解、逻辑推理以及代码生成等核心能力上仍有明显短板,甚至在某些任务上表现不如早期版本的ChatGPT 3.5。
此外,DeepSeek的论文与技术文档相对较少,缺乏详实的技术细节披露。与OpenAI、Anthropic等国际领先团队相比,DeepSeek在学术透明度方面仍存在很大欠缺。
DeepSeek“高调宣传+低调研究”的模式,也是让人怀疑其是否真正具备自主创新能力,抑或只是借助现有开源技术,进行包装和二次开发的一个重要原因。
DeepSeek的成本真的挑战美国最强AI?
DeepSeek声称其大模型是在“低算力条件”下训练完成的,V3模型训练成本仅为560万美元,这比OpenAI、Meta等用于预训练大型语言模型动辄数亿美元的成本要低得多。这一说法虽然吸引眼球,但从技术角度来看,仍然存在诸多疑点。许多专家,包括马斯克和Scale AI的执行长Alexandr Wang,都不相信。
首先,大模型训练的核心成本来自于算力。现阶段,主流大模型(如GPT-4级别)通常需要数万个高性能GPU(如A100、H100)连续训练数月。而根据市场价格,单张H100的售价高达2万美元,即便是云租赁,长期大规模使用的成本也十分昂贵。在如此高昂的算力消耗下,DeepSeek如何以560万美元的预算完成训练,值得深究。
其次,训练成本不仅包括算力消耗,还涉及数据采购、存储、工程优化、人力成本等多个方面。高质量的训练数据需要清洗、标注,并经过多轮优化,而这本身就是一笔巨大开销。此外,大模型的训练往往需要反复迭代调整,以提升最终性能,而非一次性完成。DeepSeek是否通过某种特殊技术或极端优化手段大幅降低成本?如果是,其方法为何未在业界广泛应用?
此外,DeepSeek作为一家中国公司,其GPU采购渠道是否受限也是一个需要考量的问题。由于全球芯片供应链的限制,中国市场上的高端GPU价格通常高于海外,且获取难度较大。在这种情况下,其低成本训练的实现路径更显得扑朔迷离。
DeepSeek是真开源还是“半开源”?
DeepSeek宣布开源模型,初看似乎是一项重大利好,但仔细审视后,人们发现所谓的“开源”并不彻底。真正的训练细节、优化策略、数据来源等核心信息仍然没有完全公开,导致业界难以对其技术路线进行严肃的学术分析。真正的开源应该像Meta旗下的Llama或Mistral那样,将关键代码和方法论彻底公开,而不是“半遮半掩”。相较于Llama系列、Mistral AI等更开放的做法,DeepSeek的开源行为更像是一种“半开源”,目的可能更多是为了博取关注和市场认可,而非推动整个AI生态的发展。
更值得注意的是,DeepSeek也可能受到中共官方政策与监管压力的影响,导致其开源策略受到掣肘。如果一个模型在技术上宣称要与国际一流对标,却在透明度上选择性“封闭”,那么这种开源行为是否只是营销手段,而非真正的技术贡献?
面对众多质疑的DeepSeek,可以说现在正站在一个关键的十字路口:如果真的要“深度求索”,那么必须拿出扎实的技术和真正的突破,而不是靠一轮又一轮的营销造势来维持热度。否则,它最终可能沦为又一个AI泡沫,被市场无情淘汰。
from 博谈网 https://botanwang.com/articles/202502/%E7%89%9B%E7%9A%AE%E5%90%B9%E7%A0%B4%EF%BC%9Fdeepseek%E8%BA%AB%E9%99%B7%E5%9B%9B%E5%A4%A7%E8%B4%A8%E7%96%91.html
Subscribe to:
Posts (Atom)