Tuesday, 20 February 2024

ChatGPT后 OpenAI推出Sora文本转视频跨时代模型

世界最领先的人工智能公司、位于美国加州的OpenAI公司2月15日发布Sora文本转视频模型,能够根据用户的提示词生成长达一分钟的视频,效果足以乱真,和一年前该公司推出ChatGPT引发的全球震撼一样,Sora的横空出世再次引发一片惊呼兴奋,业界赞扬称AI技术划时代的里程碑。 

Sora名称源于日文的“空”,即天空,以表示其无限的创造潜力,其背后使用的是生成式 AI技术,可根据用户文本提示可生成长达 60 秒的视频。该模型还可以从现有的静止图像生成视频。而生成式 AI 是 AI 的一个分支,使用AI 来创作新内容,例如文本、图片、音乐、音频和视频。已有的例子有如聊天机器人 OpenAI 的 ChatGPT,以及图像生成器DALL-E等。让 AI 系统生成视频更新、更具挑战性,但依赖的是一些相同的技术。

OpenAI周四向公众展示了由Sora生成的多个高清视频,具有电影质感的视频对人物、动物及物品的特写纤毫毕现,背景丰富、画面生动流畅,令人难以置信。尽管如此, OpenAI 指出仍Sora仍然存在一些弱点,包括一些空间和因果元素问题,如OpenAI在其网站上补充所说的,可能出现“一个人咬一口饼干,但之后,饼干可能没有咬痕”。

实际上,OpenAI的Sora并不是第一个展示文本生成视频技术的模型,在它之前, Runway、Pika等已经掀起过一波AI视频应用热潮。但之所以引发如此巨大的震撼,在于其在视频质量和时长方面实现难以置信的突破,首先是时长,Sora可生成长达一分钟的视频,而其它文生视频模型仅能生成3至4秒的视频。其次Sora可实现多角度“运镜”,即在一段视频中围绕同一主体实现远、中、近景、特写等不同镜头的切换。而其它模型只能生成较为单一的镜头语言。还有对真实世界反应,Sora对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。

业界评论认为,Sora的推出标志着AI研究的一个重要里程碑。凭借其模拟和理解现实世界的能力,Sora为未来实现通用人工智能(AGI)奠定了基础。

由于担心Sora可能被滥用,OpenAI表示目前没有计划向公众发布该模型,而是给予小部分研究人员有限的访问权限,以理解模型的潜在危害。

自上周四发布以来,Sora的能力已经让观察家们感到震惊,尽管如此,与当今迅猛发展的AI领域所有事物一样,Sora出现也引发了人们对潜在道德和社会影响的担忧以及未来对影视、广告、游戏等行业带来的冲击。

评论指,当Sora将AI生成视频能力提升到近乎逼真的程度时,也就意味着“眼见为实”的时代已不复存在。世界经济论坛发布的《2024年全球风险报告》显示,人工智能生成的错误信息和虚假信息高居2024年全球风险之首。尤其是今年是全球大选之年,占全球GDP 60%的国家或地区将举行选举,包括英国、美国和印度等,人们对通过AI深度伪造干扰选举的担忧增加。

美国麦格理(Macquarie)公司人工智能和软件研究负责人哈夫迈耶(Fred Havemeyer)说,“生成式AI的负面外部效应性将成为 2024 年辩论的关键话题,”“这是每个企业和个人今年都需要面对的重大问题”。

去年12月,欧盟就世界上第一个全面的人工智能法案文本达成一致,标志着欧盟向立法监管人工智能迈出重要一步,但该法案要到最终批准两年后才会生效。

OpenAI周四表示,在广泛使用Sora之前,它正在采取重要的安全措施,包括与有关误导信息、煽动仇恨和偏见等领域专家合作,对模型进行对抗性测试。同时也在开发协助检测工具等,该公司全球事务副总裁 Anna Makanju 上周五在慕尼黑安全会议上讲话重申了这一点,OpenAI 和其他 19 家全球科技公司在会上共和签署了联合声明,承诺共同打击干预选举的AI深度伪造技术和错误信息。

Open AI表示,正在“以一种相当谨慎的方式”发布Sora,模型的训练数据既包含公开可用的视频,也包括了专为训练目的而获授权的版权视频,但OpenAI技术报告没有透露Sora训练数据的具体数量和确切来源,公司在上周五没有立即回应进一步置评的请求。值得指出的是,Sora 的发布是在一些作者和《纽约时报》对 OpenAI 及其商业合作伙伴 Microsoft 提起诉讼的背景下发布的,OpenAI被指使用受版权保护的写作作品来训练 ChatGPT。



from RFI https://www.rfi.fr/cn/%E4%B8%93%E6%A0%8F%E6%A3%80%E7%B4%A2/%E7%A7%91%E6%8A%80%E6%97%B6%E7%A9%BA/20240220-chatgpt%E5%90%8E-openai%E6%8E%A8%E5%87%BAsora%E6%96%87%E6%9C%AC%E8%BD%AC%E8%A7%86%E9%A2%91%E8%B7%A8%E6%97%B6%E4%BB%A3%E6%A8%A1%E5%9E%8B