Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 4|回复: 0

数据显示:谷歌大幅更新生成式AI,推出视频模型VEO 2和比较新版Imagen3

[复制链接]

19万

主题

0

回帖

59万

积分

超级版主

Rank: 8Rank: 8

积分
596334
发表于 昨天 19:13 | 显示全部楼层 |阅读模式
谷歌的旗舰AI研究验室GoogleDeepMind周一大幅升级其人工智能驱动的内容生成工具,推出了Veo2视频生成模型和增强版Imagen3图像模型,挑战OpenAI在AI图像和视频生成的领先地位。谷歌表示,这些更新有望彻底改变创意工作流程,为视频和图像创作者提供更高的真感和定制化体验。
谷歌介绍,Veo2是谷歌的视频生成工具,能够生成多样化主题和风格的高质量视频。谷歌在博客中表示,这款模型在真感方面表现卓越,能够捕捉到人类表情和电影效果等细节。其增强的物理和电影学理解能力使用户能够生成令人惊叹的内容,包括跟踪镜头和广角构图等。
例如,Veo2熟悉电影拍摄语言,用户可以要求某种类型的风格,指定镜头,建议电影效果,Veo2都会以高达4K分辨率并延长到数分钟的视频长度来呈现。比如,要求“低角度跟踪镜头穿越场景”或“特写科学家通过显微镜观察”的镜头,Veo2都能现。提示“18mm镜头”,Veo2知道生成广角镜头;要求“浅景深”,它会模糊背景,突出主体。
值得注意的是,这一分辨率是OpenAIsora模型的4倍,视频时长更是其6倍以上。
不过,目前这些势仍是理论上的。在谷歌的验性视频创作工具VideoFX中,Veo2生成的视频被限制为720p分辨率、8秒的长度。(相比之下,Sora的比较大输出为1080p、20秒的短片。)
谷歌表示,虽然视频生成模型往往会“幻象化”出不需要的细节,例如多余的手指或意外的物体,但Veo2在这一方面的表现更为真,生成错误的频率较低。
此外,Veo2生成的视频包括不可见的SynthID水印,用于标记它们为AI生成的内容,从而减少误用或错误归属的风险。
DeepMind产品副总裁EliCollins对媒体表示,随着模型逐渐具备规模化使用的准备,谷歌将通过其VertexAI开发者平台提供Veo2。
“未来几个月,我们将根据用户反馈持续迭代,并寻求将Veo2的更新能力整合到谷歌生态系统中的相关应用中……我们预计明年会分享更多的更新内容。”
开发者和创作者目前可以通过谷歌验室(GoogleLabs)访问该工具,预计到2025年,它将广泛集成至诸如YouTubeShorts等平台。
同时,Imagen3模型在图像构图和细节准确性方面得到了增强,支持从写到抽象的各种风格,能够生成更丰富的纹理,并更加忠地回应用户提示。
目前,Imagen3已经通过谷歌验室的ImageFX工具在100多个上线,全球用户可以试验其尖端功能。
此外,谷歌还推出了Whisk,这是一款结合了Imagen3和Gemini视觉分析能力的创意工具。用户可以输入图像,生成详细的文字描述、重新混合风格,或设计个性化作品,如数字玩偶或搪瓷徽章。
谷歌介绍,Whisk结合了Imagen3模型和Gemini的视觉理解与描述能力。Gemini模型会自动为用户的图像生成详细的文字描述,并将这些描述传递给Imagen3。这一过程让用户能够以有趣的新方式重新混合主题、场景和风格。

所以,我们应该了解新野带来的很多好处,吸收归纳总结,并加以利用。https://create.xingyeai.com/

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|蒙自县垩摄冷光源有限公司-首页

GMT+8, 2024-12-22 00:51 , Processed in 0.085700 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表