可灵AI推出“多图参考”功能 进一步攻克AI视频一致性难题

2025-01-22 17:28:28     来源:

近日,快手可灵AI正式面向全球推出“多图参考”模式,该功能能够理解和整合多个图片中的不同主体,根据用户的文字描述,创造性地生成融合视频,进一步攻克了AI视频生成中的一致性难题。

目前,全球用户均可在可灵1.6模型下,使用“多图参考”功能。用户只需选择图生视频,上传1-4张参考图,框选图片中需要使用的人物、动物、物品或场景,并通过“提示词”描述它们之间的变化或互动,可灵AI即可结合所有参考内容并遵从指令生成视频。

用户可以上传一张或多张同一主体(人物、动物、影视角色或物品等)的图片,模型会以这些图片为参考,生成统一风格的视频,帮助用户在制作AI视频时保证多镜头中的主体一致。例如,用户上传猫、夹克、太阳镜三张图片,并输入提示词“一只身穿夹克、戴着太阳镜的拟人化猫在舞台上转身并对着镜头摆姿势,”随后进行生成,就可以得到符合指令的视频。

此外,用户还可以通过参考图来指定场景、服装和动作等,让人物在特定环境中完成特定“演出”,大幅提升创作的可控性。例如,我们分别上传一个老爷爷、一杯咖啡、咖啡馆场景三张参考图片,并输入相应提示词“一个卡通风格的老爷爷在咖啡馆里,端起咖啡杯”来进行生成,便可得到老爷爷坐在咖啡馆里喝咖啡的视频 。

同时,“多图参考”还可以支持不同角色之间的互动。用户可以上传多个人物、动物或者影视角色等图片,并用文字描述他们之间的互动。例如,我们分别上传小男孩、柯基犬两张参考图,并输入提示词“一个可爱的小男孩在抚摸一只柯基犬”,即可生成下图所示的视频。

此前,可灵AI已在全球上线“人脸模型”功能,支持用户通过上传多段视频来训练、定制人脸模型,并参照该人脸模型继续生成视频内容。作为业内首个视频模型定制功能,“人脸模型”创新性地满足了用户创作多个包含同一人物镜头的需求。

随着“多图参考”功能的推出,可灵AI进一步解决了视频生成中的一致性难题,帮助用户充分发挥创造力,自由组合各种图片元素,打造独特的创意场景,探索更多可能。

 

标签:

猜你喜欢

护童官宣品牌代言人张常宁,共筑孩子成长新未来
孔国梁:坚守创新初心,推动可持续建筑材料的未来
好丽友|深耕教育公益,赋能可持续发展
一嗨租车全国最大旗舰店落户美兰机场 积极响应首发经济助力文旅消费增长
以“家”之名,温暖同行!“暖途”货车司机关爱活动在深圳龙岗区温暖启幕~
新春走基层|顺丰同城“骑士”李超的“飞驰人生”
记录佳节美好 定格团圆时刻 尼康与你共同见证新春欢乐瞬间
臻牧羊奶年会颁百万奖激励员工,看见中国雇主品牌价值创造新态度
中石油经研院发布2024年油气行业发展报告暨“十五五”展望
海飞丝用一个简单的「头靠肩」温暖2025
商用车迎换新“窗口期”,企业如何抓住机遇
EVIDENT推出新型DSX2000数码显微镜,助力轻松完成精准检测
“送东鹏 财运爆棚”,看东鹏饮料春节如何俘获年轻受众
鱼你在一起携手明星丫蛋儿,创意营销引爆中式快餐新风潮
新春将至 警惕这类“红包陷阱”守护自己的“钱袋子”
春节旅行更舒服!京东旅行推出优先登机、酒店延迟退房、景区专业讲解等多项权益
快手与杜比实验室达成深度合作 短视频领域首家全链路支持“杜比视界”
快手电商推出“春节不打烊”物流保障机制,覆盖中小商家和西北集运
君创资本:我们为什么投资AI独角兽Glean?
鱼你在一起上新“炒鸡系列”新品,助力拓展新消费场景
CNY创意哪家强?“人间油物”李川与AXE斧頭牌洗洁精绝配
华泰人寿暖心推出“守护”系列意外保障计划 为您的美好生活每一程保驾护航
瓴羊发布2024精益运营年度大赏!看波司登、舒化如何用数据和AI做增长?
新春惠民福利,银联云闪付举办玩赚「手」艺人百福大集
音乐营销2025再添魔性传播案例 祝你更助你新年万事快克
有道子曰推理模型“子曰-o1”发布即开源,14B小参数复现OpenAI o1强推理效果
聚力·向智慧出发|亮点传媒第四次为宝洁校友会鼎力支持保驾护航
融入创新基因,“中国人保”APP成功入选2024年移动金融APP创新实践典型案例
皇氏集团:业绩预告减值轻装上阵,种业迎重大突破
泰国安美德集团成立50周年,向全世界展示“产业之城”的美好