小火箭ios账号租用3元怎么退
【新智元导读】Veo 3实测来袭:从会说话的松饼到电影质感的短片,一句提示词就能打造电影质感短片,还能音画同步,好莱坞真的要慌了?DeepMind首席技术官更在访谈中透露,Deep Think模式像多线程大脑般并行推理,而AGI的竞赛早已超越单纯「堆算力」。
外星人驾驶飞碟给你送披萨,月球撞上地球——这不是科幻电影作品,而是来自于谷歌刚刚推出的视频生成模型Veo 3。
视频的场景设定在一个复古的餐厅,当氤氲的烟雾在餐桌上翻腾时,女郎的唇形却配着清晰立体的对白。
画面中,一个穿着黑色晚礼服的女人和一个穿西装的男人坐在一张小圆餐桌上。桌面点着一盏小灯,旁边还有一杯威士忌和一个托盘,像是老电影里的场景。
牛顿穿着18世纪风格的衣服,戴着白色假发,穿着白色衬衫和黑马甲,手里拿着一本金色的苹果和一本书,在灯光昏暗的书房里。
旁边的小松饼听到后,吓得大叫:「啊啊啊!一个会说话的松饼!」这场景太搞笑了,简直像动画里的情节。
视频虽然只有8秒,但是画面质量很不错,松饼的表情和动作都做的特别生动,尤其是那个大叫的小松饼,听起来还挺渗人的。
@Aaron Pitters表示,「高质量的动画电影将以光速制作。这将节省大量时间,简直难以置信。」
@Janek Mann惊叹,「那个较长的视频绝对令人难以置信,它现在真的能讲述完整的故事。」
画面中是一个半人半机器的家伙,表情狰狞,背景有很多屏幕和电脑,灯光昏暗,空气里的紧张感都传达出来了。
他穿着破旧的长袍,身上还有一些机械零件,胳膊上有电光在闪,看上去像是刚从科幻电影里走出来的反派角色。
Veo 3,特别是通过影视制作工具Flow,旨在赋能电影制作人和内容创作者。Flow允许用户创建场景、管理素材、编辑故事情节并控制镜头运动。
数字营销公司Jellyfish已将Veo集成到其AI营销平台Pencil中,并与航空公司合作提供AI生成的机上娱乐内容。
Koray承认规模确实是一个重要因素,这一点毋庸置疑:在任何研究问题中小火箭ios账号租用3元怎么退,拥有一个能带来改进的维度总是好事。
他强调,整个领域,包括谷歌内部的许多不同模型,都在以显著的步伐改进。他用「相当出色」和「非常令人兴奋」来形容目前的进展。
谈到AGI时,主持人引用了著名AI科学家、图灵奖得主Yann LeCun的观点——仅仅依靠扩展大型语言模型(Scaling Up LLM)无法达到人类水平智能。
这背后蕴含的哲理是:实现AGI,不仅仅是工程上的规模堆砌,更需要在基础研究上实现突破和「发明」。
AGI是一个极其雄心勃勃、可能是我们一生中遇到的最难的研究问题,因此,拥有一个同样雄心勃勃的研究议程和投资组合,在许多不同的方向上进行尝试,是至关重要的。
最初主持人以为这是一个新产品,但Koray澄清说,Deep Think不是一个独立的产品,而是集成在Gemini 2.5 Pro模型中的一种增强「模式」(mode)。
Deep Think模式的核心在于改变了模型的「思考」方式。它让模型在推理时能够花费更多时间来「思考」。
更重要的是,与传统推理模型通常构建单一思维链(CoT)不同,Deep Think增强推理模式构建并推理多条并行的思维链。
想象一下,传统模型像一条直线思考,而Deep Think则像拥有多个并行的大脑,同时探索不同的可能性、分析不同的假设。
如果能在数学或复杂推理等领域将模型的理解能力提高10%,Koray认为这将是巨大的进步。因为这会极大地扩展模型的通用知识和适用范围。
例如,帮助人们学习新知识或解决实际难题。所以,模型的价值,最终体现在它能为人类带来多大的帮助。
他提到了一个曾引起广泛关注的例子——切番茄视频,Veo 2生成的切片过程和物体互动(刀、番茄、切片掉落)非常精确和逼真。
在此基础上,Veo 3增加了声音生成匹配。Koray认为这体现了模型对视觉和声音之间交互性和互补性的理解。
访谈的最后,主持人问了一个轻松但充满洞察的问题:作为CTO,你是否是「vibe coding」(氛围编程)的粉丝?
他认为「vibe coding」令人兴奋之处在于,它使得没有编码背景的人也能够构建应用程序——这打开了一个全新的世界。
尽管还处于早期,AI有些地方做得好、有些还不足。但Koray认为,这是技术带来的巨大变革,惠及了更广泛人群。
不仅仅是程序员的福音,更是所有想要将想法转化为实际应用的人的福音,一个全民创造的时代正在到来。