Pages

Tuesday, 12 March 2024

美国最顶尖的人工智能专家1/3是中国人,如果他们回国,立即抹平中美之间的技术差距

https://youtu.be/9E8ZSFHBjhc

上面视频讲话的这位朋友叫彭嘉昊,他是上海人工智能研究院数字化治理中心的主任,他在接受看看新闻网的采访。(有趣的是,画面里头还有一个是我的老朋友,一个老同事。我就不提是谁了。)彭嘉昊在视频提出了一个让我觉得很有意思的暴论。

他说,美国最顶尖的人工智能专家1/3是中国人,如果他们回国,立即抹平中美之间的技术差距。

这个暴论非常有趣,我们先讲讲,如果这些中国籍中国裔的AI专家全部回国,可以立刻抹平差异吗?
第一个问题,人家为什么要回来?

当然今天中国并不是一个穷国,甚至可以算全球综合国力的强国。如果你是在AI方面的顶级专家,中国公司可以提供相当不错的薪水。但是为什么这些顶尖的专家们,他们现在美国而不是在中国呢?原因是什么呢?这个就要说到几个问题。

第一个当然是待遇。虽然中国已经可以提供很好的待遇,美国可能有一些公司能提供更好的待遇。

再下来就是环境。

前些日子OpenAI的那次非常奇葩的宫斗剧,最后为什么是看起来背信弃义地,把一个 OpenAI 做成 CloseAI 的 Sam Altman,他获胜了呢?为什么不管是员工,那些技术专家,还是资方微软,大家都支持他们呢?为什么呢?

很重要的一个原因就是环境。这些顶尖的技术专家,他们想要成就一番事业,他们需要在一个恰当的公司。今天 OpenAI 就是整个 AI 领域最风口浪尖的一家公司。而且恰恰是 Altman 他们搞的这个公司架构,他们的管理下激发了这些 AI 专家的工作能力,而且他们选择的技术路线帮助他们成为了顶级的 AI 技术专家。

顶尖技术专家有的人来自于斯坦福,有的人来自哈佛,有的人来自于麻省理工,各种好大学,长青藤也好,其他名校也罢。但是行业里面,并不缺名校生,即使来自同样的好大学,每个人最后的发展是不一样的。

有人进了 Google,有人进了亚马逊,有人进了 OpenAI 对吧。几年前,大家可能会觉得 Google、亚马逊、微软或者苹果,才是研究 AI 的技术专家的最好的目标公司。结果 OpenAI 的 ChatGDP 一推出,所有的人都觉得 OpenAI 才是是一个最好的研究 AI 的地方。

成为顶尖的技术专家,不仅因为他们学历好,技术好,也因为他们适时的找到了最适合自己成长的环境。他们头脑灵活,在精力最旺盛的时候,在创造力最强的时候,他们要寻找最能够发挥自己潜力的地方。
第二个问题,假设这所有的人都因为爱国热情,因为中国这边的公司工资给的更高,或者政府投入了大量的钱,比方说投入了几十万亿美金,然后用来吸引人才。那么这些人都回来了,就可以抹平吗?

这也是值得思考的一个问题。

49年以后,我们最熟知的学成归国的例子是钱学森。但其实你真正的弄清楚49年以后的中国技术史,中国科技发展史,你会知道其实有无数的科学家也回国了。

但是这些人里面,可能你听的最多的就是钱学森。

为什么呢?第一,就是钱学森的研究有巨大的军事意义。他在美国参与研究的是当时最重要的一种军事科技,空气动力学,火箭的弹道。他所在的研究室就是NASA的前身。

第二个原因就是当时钱学森回国政治意义很大。他回国跟美国当时的麦卡锡主义也有点关系。政治上这件事情也是是可以利用的。

第三个原因就是他回国以后一直身居高位,甚至在文革期间都没有收到冲击。这一点可能有些人觉得寻常,文革期间军队一切为先,搞军事科技的,特别是核心科技的科学家能有啥危险。其实并不是如此。且不说,“很有贡献的炸弹专家钱晋,他们拷打要他承认是特务,他坚决不承认,结果被活活打死。”(邓稼先妻子许鹿希口述)即使是现在被推崇备至的邓稼先、于敏等技术专家也是因为杨振宁归国探亲,想见邓稼先,被周总理关照,才意外被救的。

其他很多的49年后回国的这些科学家,后来聊的很少呢?

因为这里面很多人死在反右和文革里了。有些虽然活了下来,但是最有活力和创造力的年代都被浪费了。这些人都是看到49年建国,希望一起来建设祖国的。
第三个问题,人都招回来,新的科技产生了怎么办?

比方说我国现在很多人留学,和去海外工作,我们现在觉得他们已经学会了世界上最先进的技术,把他们都招回来。当然假设都可以招回来,但是招回来了以后,如果美国西方又产生了新的科技怎么办?

我们是不是要再派一帮人出去?

那一开始为什么要全招回来呢?

要不然,我们至少应该留一大半在那持续的学习先进经验,每次招一半人回来吧。这听起来才像更合理的东西。
第四,软件和硬件的问题,动态和静态的问题

中国人的思维里头经常弄不清软件、硬件的问题,还有动态和静态的问题。

不光是他,很多人聊起科技创新,聊起科技进步,或者聊起创新创业,或者是聊起世界发展,总是用一种静态的眼光去看问题,总是用种硬件的眼光去看问题。

我们可以认为北洋水师就是一个硬件。

在清政府购买北洋水师的舰艇时候,它是亚洲第一、全球第八的舰队,这是以硬件来算。

但是北洋水师在军事训练上,在整个战争能力上,军队管理思维上,能排到全球第几?清廷没有能力去评估,甚至无法意识到这些的重要性。

头两天我看我朋友历史卫视做的油管节目,他提到慈禧太后为了庆生,盖颐和园,确实挪用了北洋水师的拨款。但是,他不认为北洋水师的失败是慈禧一个人的责任。因为北洋水师的拨款,年年都被挪用,并不是从慈禧要过生日开始才开始挪用的。

所以,我们由此可以看到清廷跟我们现代很多思维相似的地方。没有舰队是不行的,所以清廷可以斥巨资去购买当时全世界最好的军舰。但是一个有战斗力的舰队,需要大量的管理费用,需要年年练兵,需要补充弹药,需要不断的购买新的舰船。这个时候,这些长期的维护和投入,都没有人关心了。海军专款就可以被年年挪用了。

也就是就是大清必须得有海军,但是海军到底能不能打仗谁也不在乎。

这当然跟清廷的腐败关系紧密,这也跟一种静态的、硬件思维紧密相关。

比如我们大而不当的高铁站,中国的高铁技术自从大规模从外国引进以后,确实在很多线路上大大提升了中国人民的工作生活上的便利性,这毋庸置疑。但是有些线路是否需要更换技术则仁者见仁智者见智。

但是很多人可能都发现了,我们修的高铁站都是非常高大的,体量巨大,但是从旅客休息空间,餐饮便利性上,并没有展现出来那么大的体量应该有的质量。

很多顶棚都是透明的,从照明的角度,听起来可以省很多电。也设置了遮阳帘,但是就我乘坐的体验来看,北京南站就表现为遮阳帘不能适时的开启,造成很多等待区域非常热,难以承受。即使空调已经开了,但是空间感受仍旧不好。所以可能结果上是更加费电的。

结果去年很晒的时候,北京南站又发明了在室内撑遮阳伞的玩法,来帮助乘客避免酷暑,还当作新闻去宣传,有点让人哭笑不得。

上海的虹桥在这方面略好。但是因为虹桥火车站和机场在一起,而且地铁只隔一站,也可以走地下通道到达。我都曾经经常去。每次夏天从机场走到火车站就会马上觉得空气差一点,空气里面的酸臭和汗味儿就会明显很多。要不然也是因为透明顶棚带来的光照,需要更大的空调压力,或者火车站这边不舍得用更大的电力去驱动空调。但是总的来说,虹桥火车站,观感好于北京南站,管理更好一些。

但是虹桥也有特别无语的部分。虹桥好的地方在于,餐饮层和乘客休息区分开,有很多餐饮在出发层的上方一层,电梯可以达到。但是南边一个餐饮区,北边一个餐饮区,如果你想在北边的餐饮区喝个星巴克,然后去南区再吃个面,你就需要先走到一头,上高高电梯,喝完以后下高高的电梯,然后横穿整个巨大的站厅,然后到另外一头再去上电梯。

这些体验都表达了一个在建筑中,追求建筑体量,仪式感,但是忽视具体的使用者便利性和感受的设计理念。这也是一种重视硬件,轻视软件的思维方式。

回到最近中美的人工智能竞争里来看,追求算力,购买更多的显卡,甚至走私显卡,都是热点话题。挖各种外国专家,中国籍中国裔的技术专家也都有人在行动。但是从教育上,从行业竞争格局上,从立法上,从管理上,怎么帮助促进创新,怎么避免压制可能有创新思维的中小企业,去谈和去做的人就少多了。

为什么我们总是在喊追赶,喊追平,但是越来越远呢?因为你的对手不是静止的。

2005年,李开复就是Google要到中国开公司,开中国分公司,李开复就成了负责人。后来干了没多久,李开复就辞职了以后在中国创业,搞投资,搞孵化器,等等。

后来,百度去雇佣了吴恩达,吴恩达当时是在离开Google去百度之前,他是 Google AI 的负责人。后来百度还雇了陆琦。当时腾讯也雇过吴军,吴军也是Google的一个资深工程师,做搜索的。腾讯曾经希望雇吴军,提高自己的搜索能力。

当时我在盛大。盛大云雇佣了何刚,何刚是亚马逊云的一个技术负责人。

某一个阶段,中国公司特别喜欢雇佣这些海归的中国科技人才,但实际上效果一般。正如文章前面说的,这些高级技术人才,做出成绩是在他们原有的特定环境里做出来的。你只把人挖来,不能重建环境,是没有用的。

后来开复老师,还是一直都搞投资创业。开复老师在2016年,他提出过一句话,说叫人工智能是中国机会。

到了2018年,开复老师又说中国市场在人工智能领域有五大优势:第一中国产品创新领先全球开始领先全球,中国市场残酷竞争锻炼出世界级企业家,第三中国AI资本领先全球,第四AI发展到应用期中国有工程师创业者市场优势,第五数据优势,这是中国发展AI的最大优势。

数据优势的意思就是,在中国隐私没有那么重要,我们有那么多的摄像头拍下来的视频,拍下来的图像都可以用来做训练,然后很多公开的数据或者说叫被泄露的数据没有人管,中国在隐私方面保护的法律没有美国那么完善,特别是没有欧洲那么完善。

在那段时间里,中国的公司们,人工智能研究者们是最兴奋的,俨然已经看到了,中国在领导全球的人工智能行业和应用。

然而就在开复老师说中国市场有五大优势的时候:

2018年的6月份,OpenAI的GPT-1发布了。

11月,GPT-2发布了。

然后再过两年,2020年GPT-3发布了。

这三代发布的时候其实已经是非常厉害了,就是用Transformer做出来的最强大的大语言模型。但是当时中国市场、美国市场,几乎没有人能认识到它们的巨大历史意义。

虽然,我也很有兴趣,很多人也都有兴趣,我也去研究过GPT-2和GPT-2.但是当时谁都看不出来它有今天这么大的能力。

彭嘉昊老师不是说,说中国现在跟美国有差距,但是如果把人弄过来就抹平。16年的时候,开复老师和很多中国人就认为,我们跟美国已经没有差距了。18年的时候,开复老师认为人工智能的应用中国已经领先了。

然而,2020年的11月份,ChatGPT一发布,马上所有的人都觉得原来AI的未来是在大语言模型。什么“人工智能是中国机会”和“中国市场在人工智能领域有五大优势”这些话就再也没有人提了。我们又要开始重新赶超了。

每一次,开源的顶级大语言模型一发布,比如当年的 GPT-2 和后来的 Lama 和 Lama2 一发布,中国的大语言模型们就突飞猛进一次。然后就开始沉寂,只会拿生成几句诗来跟 ChatGPT 去对比一下,生成我们比 ChatGPT 更懂中文。

但是当彦宏哥哥,在大喊我们百度的中文比ChatGPT更好的时候,世界停止了么?并没有。

2月15号,Sora 发布了,Sora 其实就是日语的「天空」的意思。 在Sora发布之前,全世界人民都认为人工智能最核心的就是大语言模型,即使谈到多模态,更重要的也只是图片而已。确实有一些比较流行的文字生成视频的模型,但是效果还差强人意,而且都不能生成过于复杂的场景和比较长的视频。

但是 Sora 推出后,大家都沸腾了,一个新的文字生成视频的时代来临了。

但是从2020年的11月份,ChatGPT发布到现在,有多少中国公司在研究文字生成视频呢?而且可以在 Sora 推出之前,做出类似的产品呢?

OpenAI 并没有停止在 ChatGPT 上,OpenAI 在 ChatGPT 之外,还做了 Whisper,做了 Dall-E,Sora。而未来人工智能的方向在哪里,只在 OpenAI 这里么?并不是如此。在 ChatGPT 发布之前,其实也没有多少人认为 OpenAI 是。

这个世界一直在变化,在发展,我们不能静止的去思考人工智能和科技的未来。

美国最顶尖的人工智能专家1/3是中国人,如果他们回国,立即抹平中美之间的技术差距最先出现在Tinyfool的个人网站。


from Tinyfool的个人网站 https://codechina.org/2024/03/ai-china/