Pages

Tuesday, 21 February 2023

许成钢:从 ChatGPT 看中美人工智能竞争

不明白播报  EP-036  20230212




时间轴:
2:45 ChatGPT 是什么产品,算得上颠覆性创新吗
7:43 ChatGPT 的出现是否可以认为美国在中美科技竞争中先赢了一回合
13:06 言论审查对人工智能应用的影响
16:37 许成钢对"中国人工智能指数"的介绍
23:01 决定人工智能的三个决定性因素
29:12 中国国内的营商环境对AI发展有何影响
38:12 用举国体制来发展科技是否有过成功的可能
50:58 许成钢如何看待美国也对新能源行业补贴
55:49 科技创新对中国宏观经济的影响

文字版全文:

袁莉
仅仅两个多月前,OpenAI公布了ChatGPT,这个人工智能驱动的聊天机器人很快成为舆论的焦点,在两个月之内用户达到一亿。网络上充斥着各种关于ChatGPT会如何引发下一场科技革命,颠覆商业、教育和就业。我看到一篇微信公众号文章,题目竟然是《坐着工作的职业全都会被人工智能消灭》。

与此同时,中美之间的科技冷战继续加剧。用《人民日报》2月2日署名"钟声"的评论文章说,就是:"美方不仅政治打压中国高科技企业,还滥用出口管制,胁迫、诱拉一些国家组建遏制中国的小圈子。"

中国引发美国和世界的警惕是从官方媒体大肆宣扬"中国制造2025"开始的。这个2015年公布的行动纲领,旨在自动化、芯片和自动驾驶汽车等工业领域确立中国的竞争力。

中国政府这个雄心勃勃的计划和互联网企业开发的大量AI应用引发了所谓中美科技之争。但中美在科技创新上真是旗鼓相当的对手吗?为什么中国以举国之力还是在芯片这些行业被美国卡脖子?ChatGPT这样的应用为什么没有首先出现在中国?中国在新能源、电动汽车和电池技术这些方面的领先是否证明中国的制度也有其优越性?

今天我们再次请到斯坦福大学中国经济与制度研究中心高级研究员许成钢教授。许教授是经济学家,但他对科技和AI也非常有研究。他1982年从清华大学机械工程系研究生毕业时,是该系第一个研究计算机辅助设计的毕业生。他对科学技术和创新的兴趣也许和他父亲,科学史专家、中国翻译研究爱因斯坦第一人许良英先生的影响有一定关系。在八十年代出版的《科学技术简史》中,许教授撰写了《计算机与社会》章节,分析苏联和中国在计算机技术方面落后美国和日本的制度原因。从2018年起,他和团队建立并持续更新中国人工智能指数,把中国人工智能专利被引用次数和人工智能初创企业的融资规模和专利数量进行了国际对比。

这是关于中国经济的专题节目之一。这期节目的录制时间是2月9日。

袁莉:
许教授您好,您有没有试用一下ChatGPT,您觉得这是一个什么样的产品,算得上颠覆性的创新吗?

许成钢
[00:02:47]
作为一个产品,能说它是颠覆性的。我已经试着用它做过不同的事情。一开始呢只是好奇去了解,那么好奇了解了之后呢,发现是可以用的,所以我已经在实际工作中在用它了。那么我在实际工作中使用它,主要是两个方面,一个方面是翻译,一个方面是检查语法。这是它实际上的两个长处。它在翻译方面是有非常大的长处,比起其他的翻译软件,第一是翻译整体上来说相当准确,最大的优点是文字非常好,还可以帮助你检查语法上有没有错误;另一方面,它会自动提供建议,一个句子,它会告诉你,虽然语法没有错,但这个句子不容易懂,它有一个更容易懂的句子,可能这样写更好,那么它就给你一个句子。在大多数情况下,它建议的句子相当确切,能够把你原来要表达的东西,用相当确切的方式,换一个方式表达出来,你一看就更容易懂。

但是呢,现在很多人,拿它当搜索引擎用,就会出很多错误、很多笑话。它不是搜索引擎。所以当错误地把它用作搜索引擎的时候,它出错的概率是相当高的。

袁莉
[00:04:28]
那在您看来,它是一个什么样的工具呢?

许成钢
[00:04:31]
它还是一个非常初步的产品,至今也还是试验性的,刚刚开始收费。实际上,它是要通过大规模的和用户的交互来不断改进的。基本上,它是一个辅助性的工具,一个语言的辅助工具。而且由于它背后是一个极为强大的人工智能的模型,就是所谓的那个GPT3.5,这也是至今世界上最强大的AI模型,用他们行内的语言来说,它是GPT 3.5引擎造出来的工具。但是我的看法是,它可以是那个引擎的一个接口。它的背后是一个力量非常大的一个引擎,然后这个引擎不光是能做这一件事,这是通用的人工智能模型。所以有了这个东西做接口之后呢,还有各种各样的复杂的事可以做。这个搜索引擎在GPT 3.5的基础上也是可以做的,只不过它现在没有,所以它目前不是。但是它除了搜索以外,它也可以做计算,可以做其他的一系列的事。

那么它现在是以一个人的方式做成一个接口。以往计算机和人之间的接口是很困难的:最早第一个重大的突破是苹果,就是苹果用的这个鼠标——更早以前的接口是人要打字的方式,(把命令)打进去,这就很困难——有了鼠标以后呢,人和计算机之间的接口就变成了图像,但是你必须要面对一个屏幕,要在图像上去做的东西,计算机跟人不能有自然的交互。ChatGPT 3.5现在是个重大突破,就是人和计算机之间、人和人工智能的其他功能之间突破了,以后就可以变成人可以用交互的方式要它做这儿做那儿,但实际上背后可以是各种各样复杂的事儿。现在人们来聊天,人们以为它就是聊天(机器)。其实聊天,只不过是个试验,就是来试一试这个东西能不能工作。以前也有聊天的机器啊,比如微软的小冰等等,那些都是专门的聊天机器,应用范围很窄很窄的一些试验。而这个和它们最大的不同,是它是通用的。

袁莉
[00:07:24]
百度也说它很快就会推出自己的人工智能聊天机器人产品。但是ChatGPT是首先在美国发布,并且在两个月之内用户达到了一亿。能否说明中美在人工智能的应用竞争中,美国赢了这一回合呢?

许成钢
[00:07:47]
这个我觉得是很显然的,就是美国领先中国是非常显然的,而且不光是这个范围,是基本上在所有范围是保持了领先,只有极其个别的一两个地方,两边可能差距不清楚,比如图像识别。图像识别方面,两边没有清楚的差距,一个很重大的原因,是因为中国的图像识别是和警察系统在一起的。警察系统投资量特别大、应用量特别大。任何技术要发展是离不开大量的应用和大量的投资。由于它是全国的警察系统、保安系统通通都用这个东西,人工智能在全世界第一个最大规模的应用就是中国的警察系统的监视。这就使得中国在图像识别方面是比较强的。除了这个以外,在任何的方面,中国都是比美国落后的。

袁莉
[00:08:57]
您怎么看百度也要推出的这个聊天工具?审查制度下的AI聊天工具能和ChatGPT竞争吗?还是说,智能审查将会是它的一个特色?

许成钢
[00:09:11]
中国在这个方面和美国竞争,有至少两个方面的问题。第一个方面,是技术本身,因为百度还没有出来,我们无法预先预测,但是哈哈,我可以猜测,百度几乎没有太大可能在技术上达到这个水平。什么原因呢?因为前面我们提到,ChatGPT的这个引擎啊,是GPT3.5,这个引擎百度没有,那就造不出这个东西。

袁莉
[00:09:56]
但是可以是类似的东西呢?

许成钢
[00:09:58]
不是说必须是GPT3.5本身,而是说达到这个水平的引擎,如果它有,人们就知道,因为能不能造出什么样的引擎,这个是很大的事儿,它要是造出来了,人们就知道;它没有造出来,人们也知道。它没有这个引擎,它有别的水平低一些的引擎,它应该是有,比如说GPT2.0是公开的,全世界都能拿到。那么GPT3.0呢,就没有完全公开,只发布了一部分。我们现在知道的ChatGPT就是用的GPT3.5引擎。

这也不单纯是有这个引擎,还有怎么用这个引擎,还有很多技巧。虽然在计算机科学、计算机工程上,也许不值得发表论文,但是这些know-how、技巧、技能,是只有干的人才知道,不干的人是不知道的。所以你怎么弄的,你怎么调的参数,(百度是不知道的)。所以基本上我的猜测是,百度不太可能能达到这个水平。

另一方面,如果有很多审查,它会怎么样。实际上,你哪怕不对它的模型做筛选,它的数据本身已经筛选过了。你面对筛选过的数据,和面对没有筛选过的数据,这个结果就已经不一样了。我出于好奇,自己做过一些试验,提一些问题,如果用简体字,获得的这个回答,就很有趣,基本上就是小粉红。你这是美国的模型啊,美国的模型是中性的,它自己没有任何倾向,但是它在简体字网络看到的文献,几乎通通都是经过筛选的呀,所以它大部分的文献都是小粉红,于是它学来的整套的语言、整套的表达方式,以至于你看着它像是有立场,其实它是个机器人,它没有立场,但它表现得像有立场一样,它就是一个小粉红的做法。为什么用简体的时候就变成了共产党立场,为什么用繁体就变成了反共产党立场,是因为所谓机器学习获得的资料是什么,它就按照它获得的资料来回答。因此百度做的这个东西,它会自动按着共产党的宣传来回答。

袁莉
[00:13:04]
是的,但另一方面,我也想问您一下就是中国的很多互联网产品也都是面临着言论审查的,比如说微信、抖音、小红书、豆瓣。但是如果仅从产品的角度来看,这些社交软件的本身仍然是非常优秀的,不逊于西方那些对标产品。这种dynamics是不是也会转移到AI聊天机器人上面?比如百度的AI聊天机器人(是否)可以摆脱言论审查的束缚,而把这个产品本身做好?(或者)中国的AI聊天机器人,会不会也像很多的互联网产品一样,只会是中国的?因为有墙,所以只会在中国使用、在中国流行?

许成钢
[00:13:52]
第一重要的是中国对于言论自由的限制,本身会造成结果。比如谷歌搜索在国内就不能用,所以在国内只能使用百度搜索。如果任何人有机会对这两者做过对比,你会看到它们之间的差距是天壤之别。这就是为什么做科学的、做工程的、做研究的人,基本上不使用百度搜索,不到不得已的时候,不使用百度搜索,基本上都是用谷歌。因为百度搜索,严格地说是不能用的。这个是天壤之别。

刚才讲抖音,抖音是非常了不起的一个创造,不像百度是模仿谷歌的。中国其实人才多得很,无论是工程的、技术的、商业的,人才多得很。如果是个自由的环境呢?凭着这么多的人才,到处都可以发展出来最先进的东西。尤其在过去是持续开放的环境,大量的基本技术来自美国和其他发达国家,然后(中国有自己的)应用。现在我们讲ChatGPT,中国自己在基础科学上,基本的计算机工程上没有突破。其实在计算机那一行里,人们认为这没什么、这很一般,但是它作为一个产品、作为一个应用,那么就是个大突破。这个突破,实际上是在人们已经积累了这么大量的、雄厚的技术基础上,你怎么能表达出来,让普通人能接近。抖音也是这样的情况,只是抖音对应的技术基础没有ChatGPT这这么大,所以往下能走多远,和ChatGPT是不能比的。ChatGPT下面要走无限远,现在才是刚刚开始,只是在试验。

总而言之,任何重要的技术方面的产品的发展,它其实都离不开制度、离不开整个环境。当制度和整个的环境有限制的时候,我们基本上可以猜测,像抖音这样在世界上领先制造出来并且全世界都在用的产品,以后很难再出现。它在过去出现,是因为过去的开放的环境带来的。开放的环境一旦没有了,这个东西就很难出现了。

袁莉
[00:16:38]
在我们进一步讨论中美人工智能竞争之前,您能不能介绍一下您和团队建立的这个叫中国人工智能指数,这个指数主要是衡量什么的?你们的数据是来自哪里呢?

许成钢
[00:16:50]
这个指数,我们是从2018年开始做的工作,一两个月前刚刚发布的是第三个版本。这个指数的做法,是试图提出一系列的指标,用一系列的指标来帮助我们知道中国的人工智能是个什么状态,在国际对比的条件下,它跟世界上其他的领先的国家之间的差距是什么。这是我们主要的目的。

我们这一系列的指标,早期和斯坦福的人工智能指数指标体系是比较相似的。斯坦福是作为科学和研究的领域,我们和他们比,更偏商业上的潜力:在商业上判断谁会领先。这怎么判断呢?当这个东西是全新的,当最大的突破还没有产生的时候,大的公司还没有的时候,怎么去判断呢?

我的理论是说呀,任何一个前沿的领域(东西还没有造出来,大家都在摸索),谁最有希望?基本上是两个方面的因素,一方面是,重要的专利在谁手里。重要专利,就意味着不仅仅是讲专利数字(的多少),更重要的是那个专利本身真的重要。因为一个重要的专利可以超过一万个不重要的专利,简单的看专利数字是错误,一定是要寻找最重要的专利在谁手里。最重要的专利是一个相当难判断的一个指标,相对简单一点的指标之一,就是专利的引用数。专利就跟发表论文一样,被引用得多的,就证明你这个东西重要。
另外一个方面,就是经济制度本身了。在摸索的时候……摸索其实可以想象成下赌注,你是下10个赌注,还是下200个赌注。如果你的赌注很少,无论你事先觉得自己猜得有多准,你最后一定不如下赌注多的那个来得好,因为200个里出现一个成功的概率总是更高。那么这个东西怎么衡量呢?我衡量的方式就是用风险投资里边的天使投资的和种子投资的这两类的总数,就是一个很好的指标。所以我们用这个指标,再把专利的情况合在一起,就能看得很清楚。从这个角度看,中国实际上不仅仅是落后于美国,如果度量的方式不同,还会落后于英国、以色列。从商业和应用上讲,中国并不在世界第二。很多人认为,中国理所当然是世界第二。这个不是理所当然。这个领域现在正在突飞猛进大发展,中国是不是第二根本不清楚。

ChatGTP的这个重大突破来了以后,我们可以预料,它很快可以成为了一个接口,这个接口会影响到整个人工智能的爆炸性的大突破,这个东西中国很难跟上。此外,ChatGTP现在是面对大众,在媒体上引起的影响特别大。另外一个非常非常重要,已经走了很远的人工智能,就是DeepMind,做过大量的科学研究。只有在下棋,中国能跟它对比,所有DeepMind做的科学研究上的重大突破,中国一个也没有。这实际上是非常重要的一个指标。这就是为什么当人们单纯看人工智能的发表的时候,中国的发表数字世界第一,然后当你看引用量的时候,中国不在世界第一。总体引用量,中国可以是世界第一;但你要看高引用量的高质量论文,中国是落到世界第二;如果我们来看像DeepMind做的纯科学研究上面的人工智能的应用,为什么中国的突破一个也没有?

这里问题就来了,你的科学研究机构是怎么组织的,科学研究人员是怎么做工作的,他们之间是怎么能合在一起和怎么不能合在一起,以及你有多少原始的自己的想法?这些东西是需要大量的原始的想法,而不是简单的在别人已经有的框架下,你在逻辑上又走了一步,你在人力上又走了一步,你又大量投入了人力和资源,显得你是第二。但实际上,真正的最重要的工作,是需要很聪明的人、很聪明的想法,很难用这些指标度量的,意味着研究机构要用什么东西去挂钩、来激励,是不好用的。这些人,他是自由的想象的人,自由的能结合不同的人群的人,最后才能出来结果。还有你是很多很多的人和机构互相竞争,形成了竞争关系;而不是某个机构组织起来,合成了一个研究机构。任何的合成起来的机构,都很难工作。这个工作一定是自由的人自由结合的结果。

袁莉
[00:23:01]
这和我们很多人自移动互联网以来,对中国的科技业的发展认知还是有一些不一样的。我自己从2015年到2018年,在《华尔街日报》写中国科技行业的专栏,那时候差不多可以说是中国科技行业的鼎盛时代。有一段时间,腾讯、阿里巴巴的市值还一度比肩Facebook和谷歌,中国的初创企业只要沾上AI、自动驾驶、半导体这些字眼,就很容易能够融到资。中国的独角兽,也就是估值超过10亿美元的初创企业的数量一度也和美国不相上下,甚至好像有一段时间还超过去了。中国的企业和政府,当时都非常雄心勃勃,认为AI主要是靠数据,而数据的丰富性,没有一个地方能和中国相比。那几年特别时髦的一个口号是"数据是二十一世纪的石油",我也写了不少这方面的文章。所以挺有意思的,您刚才说的这些,可能是能说明虽然中国有那么多大量的做AI的startup(创业公司),有那么丰富的数据,但是ChatGPT这样的产品还是没有首先出现在中国。

许成钢
[00:24:22]
人工智能这个领域,有三个决定性的因素。第一个因素是算法,第二个因素是计算能力,第三个因素是数据。人们往往会认为,算法是公开的,所以任何最新的算法在美国产生之后,中国的科学家们也就自动获得了。实际上比这个更重要的一点,在美国的计算机行业和人工智能行业里,大量的非常优秀的科学家是中国人,这些中国人是两边跑的,可以同时是在美国的顶尖的大学和研究机构工作,同时还会回来,有的人任何时间在美国辞职就回国了。所以呢,中国当然就掌握了最先进的算法。
然后计算力呢,由于中国过去跟国际间是互通的,在互通的情况下,虽然中国解决不了自己的半导体的问题,但是计算力无非到最后就是芯片,过去可以用大量进口的方式解决它的计算的问题,就是花钱就是了。所以人们会认为算法上没有显然差距,计算能力上也可以没有显然差距,而且的确中国有好几年,超级计算机在世界上排行都排到最前面,那么计算力没有问题。然后下面就是数据,人们有一种这个观点认为,中国的数据是全世界最多。这个观念本身实际上是可以争论的,就是当人们有这个观念的时候,认为中国的数据世界最多。那好吧,如果前两个都跟世界最强的是一样的,那么后一个是世界最多,那么中国在人工智能上就应该是世界最强。

这三个方面呢,咱们可以分别看一下。第一,算法。算法这个东西,虽然抽象地说都是公开的,但是实际上,当它一旦进入到了实际应用的时候,它并不真的都是公开的。你有多少能力能解决问题,其实直接跟算法在一起,它只不过是在那个算法的基础上,针对你要做的那一件事儿,有相当的研究工作。这就为什么我在讨论DeepMind做的那些工作,中国一个都没有。这个本身说明,中国没有算法,因为你要拿了这个算法去解决分析DNA的工作,并不是机械地拿人工智能算法就行了,你一定是做这个DNA分析工作的人和搞AI的人,合作来改那个算法,那个算法它是不公开的。那个基础算法,作为计算机科学的算法是公开的,那么现在的ChatGPT,它是不公开的,它绝对是保密的。ChatGPT3.0,只公开了一个简化的版本,它的完整版本,微软已经(通过)排他性的方式取得了。现在ChatGPT4.0马上会出来,这都是不公开的。所以实际上算法那个所谓的公开,是在相当基础研究的阶段,一旦过了基础研究,进入到应用的时候,大量的东西都并不是公开的。
其实中美之间在人工智能上会迅速拉开距离,其实拉开的首先是算法,并不是人们以为的算法都是公开的,算法真正到了最关键的时候就不公开。
第二,计算力。现在半导体卡脖子以后,计算力很快就会出大问题。当你的计算力出大问题的时候,这个事儿就更不用谈了。
第三,数据。中国是不是数据最多最好的国家?不是。因为它有非常非常大的限制,制度上有言论自由上的严格限制的时候,它的数据就是扭曲的,你这个扭曲的数据,给社会带来了巨大的问题。严重扭曲的数据造出来的人工智能,做的是扭曲的工作。我相信中国会生产,但是它生产出来的中国版本的ChatGPT,是非常严重扭曲的ChatGPT,是小粉红式的ChatGPT。

袁莉
[00:29:12]
那我们下面来说一下,现在AI技术发展到最近,大家又对AI非常非常地热衷,(这个话题)非常的火,是因为现在又出现了一个竞争,是吧?不光是公司与公司之间的竞争,还有国与国之间的竞争。刚才您提到了一些,但是您能不能再跟我们稍微地捋一下,就是现在中国发展AI技术所面临的大环境,和10年前中国发展移动互联网的时候,面对的国际和国内大环境,有什么差别?这些差别会对中国未来的发展有什么影响?

许成钢
[00:29:54]
这里边实际上是两个大的方面,就是中国这个自己的制度限制了自己。第一个大的方面是国际环境,就是这个过去中国的非常快速的发展,在互联网技术上,在电商方面,是完全不能离开国际环境的。就是没有这个国际环境,中国没有可能在电商方面、在互联网方面会变得这么强。就像你刚才引用的那个数字,就是一度在许多方面都是国际领先的。因为我自己也曾经在罗汉堂——阿里和这个蚂蚁金服的罗汉堂,和他们工作过,所以有亲身体验。当时的阿里和蚂蚁金服在许多方面都是国际顶尖的。而因为我有亲身的体验,直接熟悉里面的人,知道他们是怎么工作,知道他们是哪里来的。就是它跟国际大环境是完全不可分的,没有这个国际大环境,他们没有那个人。他的人是靠国际大环境。这个技术是靠这些人带过来,所以这个国际大环境,你必须要和发达国家是朋友,而不能和发达国家是敌人。就你和发达国家是敌人,大环境没有,就是根本就不存在这个可能性。
那么,第二点,所有最发达的中国这些企业,没有例外的全部都是私营企业,只有私营企业才能做得出来。那么,自从2018年以来,不断打击民营企业。尤其是在19年之后,就直接去打击这个中国最领先的、国际上最领先的企业。所以你刚才引用的这些数字都是这个打击的前夕。那么打击之后就是一落千丈。曾经中国的电商每一个都是世界上最强的。就是最强的几个,每一个都是世界最强的。现在把它们全部都加起来合在一块儿,不如美国一个公司这个市值高。那么这个一落千丈的原因不是他们不行,而是你这个制度去打击他们。你这个制度打击他们的时候呢,实际上你不仅仅是打击了他的商业,你直接就把你的国家可能发展这些技术的公司全部就釜底抽薪了。
那么有人说了,用举国之力来发展不比他们强吗?那好,那我们实际上举国之力是在做的。这个举国之力一直在做,有没有做成功呢?半导体方面显然就是没有做成功。
然后人工智能方面呢,有一个非常巨大的公司,叫做北京智源人工智能研究院,BAAI。这个BAAI是早在2021年,向全世界宣布制造出了一个重大突破:世界上最强的AI Model,它的直接的竞争对象,它是和GPT的3.0去竞争,但是它说它是世界最棒的,它的这个直接对比的对象是Google的那个AI模型。通常说这个AI模型参数越多,这个模型越复杂,能力就越强。那么,Google那个是16,000亿的参数。智源的模型的名字叫做悟道。悟道模型呢,(官方)说它有17,000亿个参数,是用中国最大的那个超级计算机帮它算的。所以(官方)说它就是世界第一。而且他上来就说我这个是可以聊天的,我这个什么问题都能解决,是超级的、通用的。但是2021年宣布至今,你没有见到任何人用它啊,你没有见到它有任何影响,就已经过去两年了,你没见到啊。那么这就是个问题了。
然后这里边,因为我们刚才在讲这个举国之力嘛,这个机构就是举国之力啊。这个我专门为了悟道模型和为了智源公司,我作了一个测试,我去测试了ChatGPT。
我问ChatGPT,你认识不认识悟道模型。它说我熟悉悟道模型。我说你把悟道模型跟你自个儿做个对比吧。它说,我作为这个open AI制造的,我们俩是一类的。它说,我们俩都是世界上最大的模型。然后呢,我说你们俩谁好呀?它说这个没法比。它就列了四个方面(的异同),都是很确切的。然后它拒绝直接对比,说那不可比,各做各的。哈哈。
然后我说,你知道不知道智源这个公司呢?它说我熟悉BAAI。我说那你这个BAAI 和Open AI两个怎么对比。Open Ai就是制造它的公司。它说,它们两个都是专门做人工智能的公司,但这俩公司非常不一样。它说,这个Open Ai是一个私营公司,智源是举国之力的公司。哈哈哈。

袁莉:
[00:35:12]
它这么回答呀?哈哈。

许成钢
[00:35:14]
是我翻译的。它说他们是国营的,国家的力量弄的。然后它说我们是私营的,所以我们集中力量搞应用,我们要出产品,我就是它的产品。然后它说,他们是什么都弄,非常宽,非常大的志气。下面它不说了。
因为你最后是看结果嘛,不是看你声称你的模型有多大。那么再有一点,刚才我提到就是悟道模型,号称有17,000亿的参数,但是你至今你见不到任何应用,见不到谁来试一试它。而这个ChatGPT呢,它是1700亿个参数,就是悟道的1/10,就是它参数的1/10。
但是呢,人们需要很小心,就是这个参数,这个数字是什么意思。因为Open AI在宣布它的ChatGPT的时候,它就把这个解释出来了。它说我这个是真参数,但是有些模型,它那个参数不都是真参数。什么意思呢?我这都是翻译,我是把技术语言翻译成白话了:它不是真参数,就是它名义上是有——比如说谷歌那个——名义上是有16,000亿个参数,但实际上它大部分的参数是固定的常数,根本就不是靠AI调出来的。那么我们可以猜测悟道的模型大概属于这一类的。所以这就是为什么它不能和这边的模型真的来对抗。因为你最后那个模型并不真的都是用这个AI方式去算出来,把它定下来的。它是不同的组织结构、不同的人来做不同的事儿,就是你只是愿意花钱,只是愿意规模做得大,是一回事儿。你很聪明地做,是另外一回事儿。

袁莉
[00:37:12]
那我刚才去搜了一下。北京智源人工智能研究院,它的核心团队和学术顾问委员会都是好像在业界还是挺有名的一些人。可是……我也不知道,总之就是确实是举国之力。

许成钢
[00:37:30]
所以这本身其实就说明问题。你比如说Open AI,就是这次这个ChatGPT里边的突出的人物,就是说在这之前,人们是不太知道的,就不是最有名,而且年岁都比较轻的。That is the point。就像Steve Jobs,在苹果出名之前,他是一个根本不出名的人,一件一件事都是这么做出来的。谷歌的这些创始人,在谷歌没有做起来以前,都是非常年轻的,都是不出名的。Facebook,在Facebook没有出名以前,他们创始人都是没名的。所以是没名的人才能做得出来的。已经有了名的人,年长了。这种完全创新的工作,年长的人能做出来的概率很小了。

袁莉
[00:38:15]
那我们就正好就接下来可以讨论一下这个举国体制啊。就是习近平他是说:"要加快科技自立、自强步伐,解决外国卡脖子问题。首先是健全新型举国体制,强化国家战略、科技力量,优化配置创新资源。"这个我还写过一篇专栏,去年。我挺好奇,就是用举国体制来发展科技,是否有过这个成功的案例呢?

许成钢
[00:38:46]
这个能去看什么领域。如果这个领域呢,是你有一个固定的目标,你是抄人家的,就是模仿的,去抄的和模仿的。那么你由于那个目标很清楚,所以举国体制的意思就是大量的调集资源去抄人的,而且如果那个目标不是快速移动的,那么你用这个办法可以相当快地追上了。但是如果你是在一个前沿上,如果你是要探索的,那这个办法是不可能的。
不可能的原因其实非常简单。第一,是因为任何要探索的东西,在你没有出来结果之前,没有任何人知道,谁能探索出来;也没有任何人能知道,你探索出来的是什么东西。你比如说用人工智能做个例子吧。非常长的很多年里,很多很多的人都认为,人工智能下一个重大的实际应用的突破是自动驾驶。但现在基本上这个破灭了。就是基本上人工智能领域的人已经认识到了,这个是当时人们错误地认识了自动驾驶这个工作的性质是什么。你自动驾驶飞机是一回事,那个简单。自动驾驶车,在路上,在挤满了人的路上,这个是绝对不是一个在近期里能突破的事儿。所以,过去所有这些公司的人砸进去的钱,就算积累了一点知识而已。这个领域现在已经过去了,就现在的这个硅谷大规模裁员,很多就裁的就是这。原来大家拼了命地在这个东西上竞争。现在就是(失败了),你这个事先是不知道的。所以如果你用举国之力去搞自动驾驶,你进了一个死胡同,你就全砸在里头。你这个举国之力的钱就全都都浪费。
这也是为什么你即便是在资本主义世界,了不起的创新绝大部分都不产生在大公司。就是了不起的重大的创新,基本上都是新公司。就是大公司是不出来的。你比如说现在这个ChatGPT的里边的重要的一些人物是从Google里出来的,但是为什么不是Google呢?还有当年这个苹果是个重大的突破——我说苹果计算机啊——因为我们整个计算机使用图像(注:指图形用户界面),它的技术哪儿来的?那个技术是从Xerox(施乐)公司里弄来的。是当年Xerox公司发明这个东西的时候,那两个发明的人就认为这是了不起的发明,就希望能把这个东西做了。但是这个公司的老板就认为这个东西没价值,所以这个东西就一直压仓库里就没有用了。直到Steve Jobs把它给弄(成功)了。
那么这个呢,就是非常说明问题。就说那两个发明这个东西的人,都变成了你只有去博物馆才能知道,普通人都不知道(的人)。实际上真正苹果计算机的突破,你要是讲工程上的贡献,是他们(完成的),不是Steve Jobs。但是由于他们在大公司里,大公司的人看不上他们的工作,所以他(这个东西)就死了。
那么再一个例子就是半导体本身。半导体,这个大家都知道Intel公司。Intel公司的这群人真正的技术上的重大突破,获得诺贝尔奖的,是在AT&T的贝尔实验室,不是Intel公司。但是为什么在AT&T的贝尔实验室可以获得诺贝尔奖,不能造出半导体来呢?因为AT&T作为一个大公司,它有它的这个主张,它有它的做法。他没有看得起这件工作,所以这些人就辞职跑到硅谷来造了一个Intel,才有了半导体的大发展。
所以这是一个基本规律。这个基本规律就是,在一个完全不知道的领域,没有人知道,就是发明的人也不知道,发明的人所在的机构的人也不知道,所以没有人知道。那么你最后能不能发展起来,是靠探索。那么这个探索,你只有自由的社会,让人自由地探索,给人自由探索的机会,包括钱是自由的,包括这些巨大的资本是自由的流动、不受党的控制的,它才能发展。这也是为什么历史上每一次的产业革命都只产生在一个制度上,不产生在另外的制度上。这一个制度都不是一般的资本主义,是英美式的资本主义。只有英美的资本主义才有产业革命,其他的资本主义,产业革命都没有。这是有原因的。所以每一次每一次都在重复同一件事。每一次的技术不一样,但是每一次的机制都在重复。

袁莉
[00:43:31]
那你能稍微说一下为什么?就简单说一下。

许成钢
[00:43:35]
就是因为你在这个制度下,它给了人自由去探索。而且资源的配置,是最大的程度自由的。英美式的资本主义和其他资本主义差别在哪儿呢?在于它的资源配置是靠的证券市场。然后呢,在证券市场的支持下产生出来的风险投资。这个风险投资是离不开证券市场的。
然后,中国曾经有过的那些了不起的成绩,靠的就是风险投资。这些风险投资的背后,经常根本就不在中国的证券市场上。他们靠的是香港的证券市场和美国的证券市场。但是当你把大环境都搞坏了的时候,这个风险投资,真正能起作用的风险投资就退出了你的市场。然后你把大环境搞坏的时候,你还要举国之力,那么你就在进一步挤压风险投资能够运作的可能性。在没有风险投资的情况下,实际上无论是政府举国之力,还是大公司的举大公司之力,实际上在重大发明创造上都是有基本障碍的。
像日本和德国他们的这个以银行为中心的资本主义制度,那么首先它这个社会是自由社会,它只是资源配置上,它是比不过英美的这个制度。所以,它很难在第一线上跟英美对比。但是由于它是个自由的社会,这个信息也是自由流动的,它可以利用它们的制度里边的优势来紧跟着英美制度下发明创造的东西,它能紧跟上。这就是为什么大量的辅助性的工作,而这个辅助性的工作后来都变成不可缺的,那么这个性质的工作往往产生在日本跟德国。所以它们合在一起是一个世界。那么这一个世界信息都是互通的,然后他们这个能力之间是互补的。
所以不要很狂妄的以为自己靠举国之力会变成老大。实际上你根本连老二也都谈不上。就是日本跟德国的这种老二,你都跟他差距还很大的。就是不要很狂妄以为你要跟老大去对比了。就根本都是连这个事情都没搞清楚,根本没搞清楚这世界上怎么回事,科学、技术、商业是怎么发展的,是没搞清楚。

袁莉
[00:45:57]
那您怎么看就说中国追求核心技术自主,这个有没有可行性呢?就是有没有一个国家实现了核心技术自主,美国算不算呢?

许成钢
[00:46:09]
实际上这个核心技术一直都是在变的,并不存在一个固定的核心技术。比如说第一次产业革命的时候的核心技术就是蒸汽机。这个核心技术,英国人并没有非常严格地保密,所以很快英国人的核心技术就转给德国人了。然后你这个到了第二次产业革命的时候,这个核心技术就是电和内燃机、化工。这个电呢,就是非常显然的,美国是遥遥领先。大家都知道的,爱迪生的这些(事迹)。而实际上,你如果真的是从科学和工程本身看,爱迪生在科学上是没有贡献的,工程上有一些贡献。实际上工程上当时有非常重大贡献的就是特斯拉。现在这个汽车叫特斯拉,就是用了他的名字。那特斯拉根本不是美国人,特斯拉是欧洲人。欧洲人为什么有贡献是在美国?就是为什么这个巨大的贡献在美国?因为美国的制度使得他这样的人到了那边,他才能发挥作用。所以他就离开了(欧洲)那边,他就跑到美国来。所以很多很多了不起的重大的发明(是在美国),(尽管)当时美国的科学研究是落后于欧洲的,但是为什么从第二次产业革命就已经跑到前头了,就因为它的制度使得这些人到了那边就容易工作。

第三次产业革命就是计算机这些,更是美国更强。那么英国也是发明计算机的国家,世界上的第一台计算机,实际上是英国,是图灵造的,当时是为了破译密码,只不过是因为保密,所以它这个东西没传开。然后这个公认的第一台电子计算机是美国造的,那么就是二战的末期。那么所有的这些东西,第一台电子计算机制造的时候,很快就获得了这个冯·诺依曼的重大的帮助。所以,这个最早的计算机结构也叫冯·诺依曼机器。而冯·诺依曼是匈牙利人,也不是美国人啊。为什么匈牙利的犹太人跑到美国去呢?那不就是因为你欧洲迫害犹太人,就人家都要逃走了。这就是原本可以在其他的地方工作的人,那么他就是要逃到那个地方去才能工作。

所以,所有这些都告诉你,这个制度起的作用。还有就是第三次产业革命产生在美国,其实里面最大最大的那个因素,是半导体。半导体,因为时间原因,我们今天就不展开半导体了。但是实际上这个半导体的产生本身就是两个制度之间的竞赛出来的结果。因为苏联也在攻半导体,美国也在攻半导体,欧洲国家也在攻,但是第一个是美国把它攻下来了。
攻下来的原因就是我前面讲到的,就是虽然在物理上人们认为这个东西将来很可能成为一个新一代的电子器件,具体是哪一种半导体,用什么技术,怎么实现,没有人知道。所以一切都是没有人知道的东西。于是呢,你就变成了举国之力的苏联,和分散的每一个(力量)自己自行其是的美国,两个的对比。自行其是的美国就好几十个,里面大部分都失败了,个别的就成功了。所以这个刚才我们提到AT&T的贝尔实验室获得诺贝尔奖,获得诺贝尔奖的原因就是它最后弄成了。弄成了它是碰巧的。别人都在弄,很多很多学校都在搞,麻省理工学院也在弄, CalTech也在弄,很多地方都在弄,别人没有弄成,他弄成了。他就得诺贝尔奖了。
那么这个苏联也在弄,而苏联是举国体制,政治局是要指导的,那么你政治局调动资源、优化资源、举国之力,你最后就搞不出来。那最后苏联连追都追不上。他不但是最早前沿弄不出来,最后别人弄出来以后,他去追他都追不上。为什么追不上呢?因为这是移动目标。就不像原子弹,它是一个相对比较静止的目标。因为它能炸就行了,没有人不断地去改进。这个半导体这个东西是移动的目标。人家移动的速度比你追得都快。所以苏联到后面的垮台,直接是跟它这个东西相关。它举国之力,它不是一个国,它是举社会主义阵营之力,它是苏联加东德,加上捷克斯洛伐克,加匈牙利,加所有的他的力量,全部放在里头,想办法获得美国的机密,然后想办法解剖他们的各种产品。那么,他们的物理学家是远超过中国的物理学家,他的物理学家里,若干个是得诺贝尔奖的。然后集中他们的所有力量去搞。实际的情况就是它追上的速度慢于对方的发展速度。那么,这就是它的实际情况。历史上的例子告诉我们,举国之力追不上自行其是的自由发展。

袁莉
[00:50:57]
现在有人说美国也搞这个举国体制,就比如说美国也给新能源汽车产业提供补贴。您怎么看这种说法呢?

许成钢
[00:51:06]
我认为从这个创新的角度讲,这都是错误做法。如果它的目的只限制于环境保护,为了环境保护有意识的朝一个方面集结,那是另外一回事。这就是经济学上是有讨论的,就是说你存在很大的外部性的时候,有正的外部性的时候,那么你采取某些措施来补偿那个外部性,使这个行业变大,那么是有好处的。但如果是从这个创新的角度讲,创新使用政府干预的方式,都适得其反,创新,政府管不了。就是政府唯一可以做的事儿就是提供资源。然后这个资源,政府一定不能管。就是资源从政府出,但是一定不能由它分配。政府来分配就完了,这个创新就弄不了。

袁莉
[00:51:57]
那我们说一下这个新能源这方面,因为中国经济现在最大的亮点吧,可能要算这个新能源啊、电池技术和电动汽车了。我和国外的这些人一聊,他们也觉得中国在这些方面都非常厉害,就是技术方面还有制造方面都很厉害。这能否说明中国的举国体制也有它的那个优越性呢?就是中国企业的这个创新性并不差?

许成钢
[00:52:23]
这个实际上仍然是和过去存在的国际大环境在一起。因为这个所有的新能源和这个电池的这个技术,基本技术全都不来自中国自己,基本技术都是国际间的,都是发达国家发明的。那么在这个国际大环境非常好的情况下,那么是由有能力的国家里边的最好的公司,有这个能力发明,然后中国有能力把这个技术拿来用更低的成本大量制造,变成一种国际间的合作。那么在这个背景下显得中国非常强。但是你一旦把这个国际大环境破坏之后,技术来源我们就不知道了。当然,由于这个东西是和军事无关,如果人们认为和国家安全无关,那么这个技术没有卡断。那么如果这个国际间的最先进技术仍然源源不断到了中国,那么中国呢,仍然还有它的能力。
就是所谓的,它这个举国之力、大规模的资源配置,其实不是靠它摸索,其实它的优势就在于那不是它摸索来的。如果靠它去摸索,这个办法就是不行的。那么由于不是靠他摸索,是别人摸索了,然后它来造,那它这个就优势就显出来了。但是问题就是当这个国际大环境变化了之后,如果人们认为这是关系到了国家安全,那么这个技术不再这样流动了,这问题马上就来。
比如说吧,电池,实际上现在大规模制造的这个电池技术很快就要落后了。就是说,现在它有能力大规模制造现在的技术的电池,一旦这个电池技术已经落后被淘汰,那么它这个大规模的制造,在国际间就已经没有了市场了。那么可能就最后就变成了中国的市场跟世界分开,然后世界上使用高效率的,中国使用低效率的。这个可能性是非常大的,哪怕就是在这个锂电池的范围内,现在特斯拉就已经宣布了它的电池获得重大突破。那么,当它的电池获得重大突破的时候,它会把这个电池制造的秘密跟中国分享吗?它只要不分享,呵呵。

那么实际上,有好多个其他的因素,我们刚才在讲这种自行其是的、自由的发明创造的这个制度。好多的其他的电池都在发展中,新的东西层出不穷,很快这个技术就会变。那么关于这个问题,实际上我早在三四年前和陈清泰先生讨论过。陈清泰先生是中国的汽车制造业非常重要的元老人物了,曾经负责过中国的体改委。我就谈到这个问题,他说他一直很担心,他跟我的这个想法是一样的。他一直很担心这个,一旦技术变化,现在的举国体制怎么办?那么实际上呢,就是关系到你的目标是一个固定目标,还是一个移动目标?然后是移动的目标的话,移动有多快?当这个移动目标移动速度非常快,当它出现这种颠覆性的基本变化的时候,那你国际关系搞坏了,你就没有办法。

袁莉
[00:55:47]
我再问您最后一个问题吧,就是因为我们这个是中国经济的系列。中国现在的面临的这种国际环境,就是中美科技上的脱钩,还有美国对中国在科技上的,可以说是有很多禁运这样的东西。再一个就是中国国内的这种对于民营企业最近几年的这种变化,当然最近就是中央政府开始就是说要复兴经济,然后对这个民营企业百般示好。我想问一下就是这样子下去,一个是说对中国的科技创新会有什么样的影响?再一个就说,这样下去,对中国经济未来的这个发展,宏观上会有什么样的影响?

许成钢
[00:56:34]
实际上呢,就是早在几年前,就是国内不断地从中央政府的角度在讲,中国的经济增长要靠提高效率,当时喜欢用的这个词叫TFP,全要素生产率。

袁莉
[00:56:52]
对对,我从来没搞清楚是什么意思。

许成钢
[00:56:55]
其实它不应该用这个词,这个词用错了。因为这个全要素生产率里边带着制度、带着管理方法,不光是科学技术,不光是工程技术。它这个根本概念搞错了。但是他们想说的是这个技术。
首先从这个中国经济是否可持续发展的角度说。其实中国整个的经济距离发达还差很远,就是中国的劳动生产率还非常低,而跟欧美相比,(是对方)1/8,1/6这个之间的关系。就是当它的劳动生产率如此之低的时候,实际上它为了经济的持续发展,它最应该关心的不是前沿的技术,因为它离前沿远的很嘛。你还是应该想办法模仿欧洲的、日本的、韩国的、台湾的,你去模仿他们,而不是想办法创新,因为创新很难、很难。而且中国没有那个制度。
这个是一个基本判断上的基本错误。就是它误认为,它是世界老二了,它误认为它要变老大了。然后它误认为它要在所有方面跟这个老大来对比。它不知道它的差距有多大。它不知道中国的穷人有多穷。就是你必须要先看到中国的穷人有多穷。如果我们把绝对贫困线使用通常国际上的标准,中国有五亿人在绝对贫困线之下,用国际通用标准,而不是使用专门给贫困国家使用的标准。通用标准意思就是让人稍微有一点尊严,你五亿人生活得没有尊严。你穷到这个程度,你需要的是非常非常基本的,像欧洲的技术,像台湾的技术,像韩国、像日本的技术,你能像他们那样,你就能把你的人均GDP的水平从现在的样子抬高到美国的一半。现在是美国的1/4、1/3的水平。
那现在,我们可以看得很清楚,在这个18年、19年、20年这一段时间,猛攻中国的民营企业,尤其是中国民营企业的最先进的企业。这一番的猛攻之后,实际上你已经把中国民营企业搞技术创造,在技术创造、在这个创新上面大规模投资,已经釜底抽薪了。因为任何的创新都意味着很高的成本和很高的不确定性,是冒险的。就是本来就要冒险,然后你在政治上给人家来了这么大的风险。而且这个风险是相当确定的,就是说这个打击是很确定的。那你如此打击之后,那么谁还愿意投这种长期的(领域)?

其实还有另外一个领域,今天没有谈的,就是制药业。中国的制药业是非常非常奇特的一个行业,因为全世界的制药业,只要它叫做制药业,制药业的研究与开发的投资占它的那个销售额的那个比例啊,都是什么1/3啊,什么1/4啊,就是非常大的比例。而中国的所有的制药厂,它的研发占它的销售比例都很小很小。所以什么意思呢?中国没有能力制药的。这就是为什么这次新冠实际上是暴露了一个重大问题,就是中国制造不出来好的疫苗。中国的制药业是很差很差的。就是好的疫苗造不出来,因为长期的、没有足够的研发的投入。那么我们刚才讲了,你本来就很弱呢,你现在又这一通的打击,使得人们不敢在研发上面投入。那你最后只剩下举国之力,所以这个举国之力弄不了的。

袁莉
[01:00:47]
但是这样长远的来说,对中国经济是一个什么样的影响呢?

许成钢
[01:00:51]
长远的说,实际上苏联就是一个好的例子。就是中国现在的水平比当年的苏联还差得远了。当年的苏联是已经超过了美国的人均GDP1/3的水平,略略超过。中国现在比那个时期,还有显然差距,还没追到就已经增长速度下来。苏联是追到了1/3了,就追不了了。就说为什么苏联会垮台呢?就是因为它再追也追不上去,就想办法改革。改来改去,最后他们的改革派们得出了一个结论,说改的只能是这个制度,在这个制度下,没有改革可以做了。人们都有这个结论,就不是光苏联,整个的苏联的、东欧的国家全部改革的人都出来了这个结论。所以,中国要看的例子就是苏联,所以中国现在的增长速度大幅度的降下来,实际上就是不会再上来了。它会有短的时间的小的波动,但是整体上它只能是越来越低了。原因就是因为它这个制度阻碍它的发展。

袁莉
[01:01:57]
真的是,不是太乐观。接下来就是我们请每一位嘉宾推荐三本书或者是影视作品,您有没有什么推荐?

许成钢
[01:02:09]
那我回头发给你吧。我忘了。

袁莉
[01:02:14]
我昨天好容易记起来,提醒了你一下。行,没事儿,那您回头发给我。那谢谢许教授,也谢谢大家收听。我们下次再见。


from 新世纪 NewCenturyNet https://2newcenturynet.blogspot.com/2023/02/chatgpt_20.html