快手可灵大模子怒放视频续写功能 可生成最长约3分钟视频
中新经纬6月24日电 快手的视频生成大模子“可灵”自面世以来,激发了国表里的平时柔软。6月21日,可灵再度进化,崇拜推出图生视频功能,援助用纵情静态图像生成5s视频,何况可搭配不同的文本骨子,完满丰富的视觉叙事。同期,可灵还发布了业内最初的视频续写功能,可为已生成的视频(含文生视频及图生视频)提供方便的一键续写和相连屡次续写,将视频最长可延迟至约3分钟,充分暴露了可灵庞杂的思象力与精细的可控性,极地面拓展了视频大模子的创作领域。
化静为动 按需定制视觉叙事
此前,“可灵”在文生视频方面仍是展现出了创造传神体育场景、精准模拟物感性情的庞杂才气,以及将复杂观点奥密交融的精湛身手,其输出堪比电影级画质,并允许用户解放更动视频的纵横比。而这些特等性情,如今王人被圆善融入到了图生视频模子。用户只需上传一张图片,“可灵”即能基于对图像的深度领会,变静为动,赋予其5秒的鲜嫩生命力。
上传经典的蒙娜丽莎,可灵无意让蒙娜丽莎戴上墨镜,并赋予她灵动的目力雷同。让名画中的东谈主物活无邪现。
成绩于其基础模子架构中的3D时空招引重目力机制,可灵在构建复杂时空通顺方面也展现了特等才气。这使得模子在蜕变静态图像为动态视频时,无意讲究而准确地完满大幅度体育场景。例如,只需上传一张牧羊犬追球的静止像片,模子就能生成一段生动的视频:牧羊犬活无邪现地驱驰追赶网球,其耳朵轻轻浪荡,毛发摇旗呐喊,而网球则在空中弹跳,视频举座当然则畅达。
再以一张汽车疾驰的图片为素材,可灵能创造确立临其境的驾驶场景。在这段视频中,汽车不仅在公路上展现出疾速前行的姿态,而且奥密地融入了对向车谈上相连收敛的车流。同期,谈路两旁的树木快速向后掠去,模拟出浓烈的行驶速率感,而虚化解决的阻遏带进一步增强了视觉上的动态成果与速率印象,举座画面宛如出自裁心筹划的告白大片。
可灵图生视频模子还融入了庞杂的指示词交融本领,深化了对图像语义与用户指示的清醒整合。这意味着,模子无意凭据用户提供的不同文本指示,精妙地变换视频中的动态进展。例如来说,当使用一张女孩的像片生成视频,模子默许生成的成果可能是轻风中她发丝轻轻浅动,周遭花朵摇曳,水面能干着讲究的波纹。而若是用户具体输入“女孩回身背对镜头”,视频便会智能添加女孩优雅回身的四肢,并讲究捕捉到回身蓦地的含笑和眨眼,展现了当然则生动的细节解决才气。
再比如用巨龙图片生成视频,输入“正在捕食的巨龙,振作的沙子,魔幻作风的电影”,视频便呈现巨龙抬头展翅掀翻漫天黄沙,嘴部开合仿佛在怒吼的生动成果与魔幻场景。通过这种文本与图像兴味的紧密联动,可灵将按需定制的视觉叙事普及到了一个新高度。
此外,可灵图生视频模子援助不同作风的图像输入,无论是当然写实如故作风化图像王人能苟且解决,同期兼容各式长宽比的图像输入,展示出庞杂的无邪性和符合性。例如这张骑士拿剑的竖河山片,生成视频中骑士黑袍遨游,亮剑仙气环绕,拉满氛围感。
业内最初 视频续写可生成最长约3分钟视频
可灵大模子还新推出了业内最初的视频续写功能,用户只需一键操作,即可在已生成视频的基础上持续生成约5秒骨子,该功能同期适用于文生视频和图生视频。更令东谈主瞩想法是,通过相连屡次续写,无意最长坐褥约3分钟的连贯视频。基于对物理通顺的深刻清醒,视频续写不仅确保荣达成部分与原视频间的通顺连贯性及物理合感性,还能奥密融入大幅度的四肢变化,普及视频的生动性。
这次升级的一大亮点是集成文本规定机制于视频续写中,这意味着用户无意通过自界说指示词,为每段视频续写注入个性化创意。成绩于此,模子运用高效的指示词交融本领,平滑地在场景间过渡,反馈用户的每一个灵感火花。例如来说,一个对于古堡的视频片断,用户既不错遴荐让它先“太阳落下去,太空变暗”,继而“太阳升空来,太空变亮”,亦可探索另系数径:“太阳落下去,太空变暗,灯光渐亮”,随后“灯光亮起,雾气氤氲”,以此创造出各具性情的相连视觉叙事,圆善贴合用户的各样化需求。
注:视频前5秒为输入视频,后9秒为续写两次后的散伙
6月6日,可灵文生视频大模子崇拜亮相(可灵官网:https://kling.kuaishou.com),不仅在成果上并列Sora,还即时在快影App上驱动了邀测体验,收尾当今,已有累计向上14万东谈主列队央求。这次进化,可灵文生视频基础大模子的庞杂才气被无缝整合到图生视频和视频续写功能中,将为用户带来更为丰富、无邪的视频创作体验。
恰逢近日CVPR2024在好意思国举行,在这一国外顶级策动机视觉和样式识别限度学术嘉会上,快手也同步发布了可灵大模子的图生视频和视频续写等最新功能,引起现场的浓烈反响。公开贵寓暴露,本年快手共有8篇论文入选CVPR2024,彰显了其在该限度的深厚盘考功底。
据悉,快手还将鄙人月召开的2024寰宇东谈主工智能大会(WAIC)上,举办以“新AI·新应用·荣达态”为主题的大模子本领生态论坛。届时,快手将发布最新的大模子本领与应用政策,包括快手大模子本领矩阵全景、基座模子本领立异、应用和落地情况等。(中新经纬APP)
","del":0,"gnid":"96945a0b43c9bbb8e","img_data":[{"flag":"2","img":[{"desc":"","height":"468","title":"","url":"http://p9.img.360kuai.com/t11508c75c812eabbeda3169d82.jpg","width":"320"},{"desc":"","height":"443","title":"","url":"http://p9.img.360kuai.com/t11508c75c8ffe04e4d48d77ed9.jpg","width":"320"},{"desc":"","height":"168","title":"","url":"http://p9.img.360kuai.com/t11508c75c87eda607f849980ee.jpg","width":"320"},{"desc":"","height":"517","title":"","url":"http://p9.img.360kuai.com/t11508c75c8c31f61071627ca01.jpg","width":"807"},{"desc":"","height":"168","title":"","url":"http://p9.img.360kuai.com/t11508c75c8485f6f7a0a915cb0.jpg","width":"320"},{"desc":"","height":"611","title":"","url":"http://p9.img.360kuai.com/t11508c75c88bc6589ba591687d.jpg","width":"320"},{"desc":"","height":"320","title":"","url":"http://p9.img.360kuai.com/t11508c75c8b26e4b8b0afc4f3d.jpg","width":"320"}]}],"original":0,"pat":"zzc,art_src_1,fts0,sts0","powerby":"cache","pub_time":1719220621000,"pure":"","rawurl":"http://zm.news.so.com/938b18cc67e925079a329113eee90653","redirect":0,"rptid":"81afaf20e865af7e","rss_ext":[],"s":"t","src":"中新经纬","tag":[{"clk":"ktechnology_1:蒙娜丽莎","k":"蒙娜丽莎","u":""},{"clk":"ktechnology_1:牧羊犬","k":"牧羊犬","u":""}],"title":"快手可灵大模子怒放视频续写功能 可生成最长约3分钟视频","type":"zmt","wapurl":"http://zm.news.so.com/938b18cc67e925079a329113eee90653","ytag":"科技:互联网:应答","zmt":{"brand":{},"cert":"中国新闻社旗下财经新媒官方账号","desc":"中国新闻社旗下财经新媒","fans_num":0,"id":"3377470056","is_brand":"0","name":"中新经纬","new_verify":"4","pic":"https://p0.img.360kuai.com/t0155517769ee80b417.jpg","real":1,"textimg":"https://p9.img.360kuai.com/bl/0_3/t017c4d51e87f46986f.png","verify":"0"},"zmt_status":0}","errmsg":"","errno":0}