谷歌母公司Alphabet(GOOGL.US)告示,将面向付用度户绽开"相片转视频"功能,这项岁首仅限小范围测试的东谈主工智能器用现淡雅登陆Gemini东谈主工智能助手。
该公司声明称,自周四起,特定地区订阅Google AI Ultra和Pro假想的用户可通过Gemini网页版使用该功能,迁徙端行使将在本周内不竭推送更新。
这项新功能允许用户基于单张相片及文本描述,生成带声息的8秒短视频。生成的MP4要领视频鉴识率为720p,收受16:9横向画幅。
这次更新使该功能径直集成至Gemini聊天界面,标记着谷歌在AI视频领域与好意思国竞争敌手OpenAI、Runway AI Inc.保抓同步。大家市集竞争相同强烈:中国阿里巴巴集团、AI初创企业Manus和快手科技昔日数月均发布了升级版视频器用。
该功能由谷歌五月在建造者大会发布的最新一代视频生成模子Veo 3启动,此前仅限通过独处付费影视器用Flow使用。
谷歌强调已遴选"进攻后台措施确保视频生成得当步调",举例不容使用公世东谈主物(包括名东谈主、政要及著名企业家)图像生成视频,其战略同期不容挑动危境举止、暴力或群体弊端的骨子。
但测试披露技能仍存颓势。媒体在Gemini网页版实测中发现:上传个东谈主相片条目生成东谈主物讲话视频时,输出戒指屡次窜改面部特征致使东谈主种;天然能成效终了"植物随风舞动"或"静态猫片话语"等简便领导,但对"相片东谈主物跳轰隆舞"等复杂条目,仅生成东谈主物挥手画面。
谷歌发言东谈主就测试戒指报恩称,AI模子并无修改东谈主物外貌的设定领导,相片转视频及面部动画仍属新技能,可能基于单张图像生成与原始骨子不符的戒指。
该模子更擅长活化其他场景,如无边物品动画化、画作动态化及天然相片增畅通明果,公司将在后续更新中抓续校阅包括面部动画在内的各项功能。
海量资讯、精确解读,尽在新浪财经APP包袱裁剪:于健 SF069
泓川证券提示:文章来自网络,不代表本站观点。