文章来源于互联网:UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
-
论文标题:UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics
-
项目主页:https://xavierchen34.github.io/UniReal-Page/
-
论文链接:https://arxiv.org/abs/2412.07774
-
Context Prompt:用于补充描述不同任务和数据集的特性,包括任务目标、数据分特点等背景信息,从而为模型提供更丰富的上下文理解。
-
Image Prompt:对输入图像进行层次化划分,将其分为三类:
-
Asset(前景):需要重点操作或变更的目标区域;
-
Canvas(画布):作为生成或编辑的背景场景;
-
Control(控制):提供约束或引导的输入信号,如参考图像或控制参数。