梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI
果然,所谓“Sora概念股”在龙年首个交易日一片红了。
甚至其中不少公司,去年同一时间也被算在ChatGPT概念股里面……
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/bf139e114364c83e43d135addadcd775.png)
而主角Sora在持续刷屏72小时后,势头依然不减,还有新能力被不断发掘出来。
比如这段“寄居蟹用灯泡当外壳的夜间场面”。
海浪与沙滩的互动非常细腻,寄居蟹腿上的纤毛也活灵活现。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/123c11eda3dc567e05a770503849416f.jpeg)
对比真实拍摄的类似场景照片,也就灯泡没有电源不应该亮这一个明显破绽了。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/d1dc39437d43acb88faafecf6ee2aaa5.png)
所以说,Sora到底算不算理解了世界、掌握了物理规律还有争议。
但说它理解了《我的世界》恐怕没人有意见。
这段“《我的世界》最华丽8K高清材质包”,连游戏的UI都准确且保持稳定,也揭示了训练数据中很可能包含大量游戏画面。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/7ada266fea9c3d0d1f0ef6d8deac8a69.jpeg)
当生成纯现实场景时,“小猫在大雨中的后街寻找遮蔽物”让Sora开发领队Tim Brooks直呼“快来个人收养它”。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/589092ae8819f67cc5eeb0dbbb2f6fc9.jpeg)
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/9eca642c5bcce8d98d18ce8014bc8417.png)
另一位领队Bill Peebles则发掘出Sora生成设计一系列事件的完整故事的能力,在试验中他安排了四个连续事件:
- 金毛和萨摩耶穿过纽约
- 出租车停下来让狗狗通过人行横道
- 它们经过卷饼和热狗摊
- 最后它们看到百老汇招牌
Peebles表示Sora的表现还远称不上完美,但也算是胜任了。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/8cfcbefd18bcef22046949bc0f550d1a.png)
内测已经三天,Sora还在不断带给人们新的惊喜。
现在网友们只想拥有一件事,那就是Sora访问权限。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/56ed33886385e6417cd6126f1237837d.png)
与此同时,经过第一波震撼之后的科技圈各方势力也逐渐缓过劲来,纷纷围绕Sora展开了自己的行动。
终成圈内外顶流
马斯克是最坐不住的。
一边抱怨自己出钱创办的OpenAI从开源,转向盈利。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/83db79ca7f555c2944d2c43081f47570.png)
一边晒特斯拉一年前就可以精准模拟自动驾驶环境的视频了:
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/f553bb8353371aa24f742ddca125b8a8.png)
展示中,特斯拉可以模拟各种驾驶环境,比如给出直行的指令,模型就能自动生成模拟汽车直行的视频:
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/9547c73f988f21a13bf44e7c3e153c90.jpeg)
同为AI生成视频的Pika也迅速跟进,紧急推出“文本一致性”参数设置功能,可以让Pika更贴近prompt或者是更有创意:
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/00505a7cc6432be3552f5c908de33021.jpeg)
不出所料,有网友就评论了“什么时候会针对Sora推出新版本”:
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/c9ab89a84cf5b5a736ac0372aa591afe.png)
对于这个问题,Pika创始人郭文景最近也在接受钛媒体采访时表示“已经在筹备直接冲,将直接对标Sora”,不过具体计划暂时还未透露。
此外,音频这边也赶紧跟进了一波,给Sora生成的视频配音!
之前爆火的AI语音合成初创公司Elevenlabs就做了一段酱婶儿的视频:
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/7f1e20052df1df336302e2aca4903b32.jpeg)
英伟达科学家Jim Fan也转发点评了一番:
这段音频基于文本提示,但其实应该是同时作用于文本和视频,若要学习精确的视频到音频的映射,还需在潜在空间中模拟一些隐式的物理定律。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/3b92436c19b5bd287de8ac31b3734917.png)
更具体一点,要在视频的基础上直接配音,Jim Fan认为end2end transformer必须要关注以下几点问题:
识别每个物体的类型、材质和空间位置;理解物体之间复杂的相互作用;识别环境;从模型的内部存储器中检索物体和周围环境的典型声音模式;运用物理定律来组合和调整声音模式的参数,甚至可以即时合成全新的参数;在复杂场景中,模型需要根据空间位置叠加多个音轨。
国内大伙对Sora的讨论也非常热烈。
框架大神贾扬清用5个字总结了Sora——“真的非常牛”,他还从不同角度给出了4点短评:
- 对标OpenAI的公司有一大波被其他大厂fomo收购的机会;
- 长线闭源寡头,开源还需要一段时间才catch up;
- 从算法小厂的角度,要不就算法上媲美OpenAI,要不就垂直领域深耕应用,要不就开源;
- infra的需求继续会猛增。
360集团创始人周鸿祎这次对AGI的看法来了个180度大转变:
人类对AGI的突破,可能就剩下最后一步了。
他在小红书发布了一段视频,认为“Sora生成视频堪比CG”。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/58327c9843f01744e4c973aeee8600ec.png)
除对Sora的效果感到惊讶外,周鸿祎还猜测Sora背后技术关键有三:
- 并不是使用传统的3D建模然后再进行渲染,应该还是通过大量训练模拟了人类观察世界、描绘世界、表现世界的能力;
- Sora的训练输入,不仅包含大量视频电影的数据,Sora不仅能解读出画面中有什么元素,还能理解物理定律;
- OpenAI应该自己产生了很多3D内容,利用3D模型将物理知识输入给Sora。
还有其他网友爆出MSRA前资深研究员梅涛对Sora的看法,其中就讲到Sora是一个里程碑式的技术进步。
不过他认为Sora要实现商业化还需要解决可控性、Prompt的挑战,“如果说实现商业化需要做到100分(60分技术+40分场景),以往人工能做到90分,Sora的出现只解决了那60分,甚至到75分”。
值得一提的是,学术界这边,有消息透露有人已经开始组队复现Sora了:
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/70d824a0b05cdc7a12e176fe94d7eec8.png)
One More Thing
关于Sora这个名字的含义,它不像GPT代表“生成式预训练Transformer”一样是技术名词的缩写。
大家纷纷猜测来自日语“空”的发音,ChatGPT账号也用一首歌名给出相关暗示。
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/f0dd2714fc2047471136d9154a290f83.png)
那么Sora到底什么时候能玩上呢?
有网友预测,如果按照DALL·E3的发布节奏,2月25日和3月16日附近,值得期待~
![“Sora概念股”一片红!最新视频再上强度,有人都开始复现了](/wp-content/uploads/replace/b7e3b478f2c78247246ca16e9bcb2d39.png)
参考链接:
[1]https://twitter.com/_tim_brooks/status/1759128729908085199
[2]https://twitter.com/DrJimFan/status/1759287778268025177
[3]https://twitter.com/model_mechanic/status/1759343673484165262
—完—
@量子位 · 追踪AI技术和产品新动态
深有感触的朋友,欢迎赞同、关注、分享三连վ’ᴗ’ ի ❤
AI副业赚钱交流群
欢迎大家加入AI副业赚钱交流群,一起学习交流,有单子在群中发布,可接单赚钱。
![扫码入微信群AI侦探社](https://www.huggingface.org.cn/wp-content/uploads/2024/02/Wechat-1.jpg)
AI副业赚钱群
以上内容由站点小编汇总整理,多数均为第三方内容,旨在帮助大家打破AI信息壁垒,开拓AI赚钱思路。涉及付费内容请您务必自行甄别判断,谨防受骗上当。