Differential Diffusion,赋予每个像素它应有的力量,以及在comfyui中的测试效果

🥽原论文要点

首先是原论文地址:https://differential-diffusion.github.io/paper.pdf

其次是git介绍地址:GitHub - exx8/differential-diffusion

感兴趣的朋友们可以自行阅读。

首先,论文开篇就给了一个例子:

我们的方法根据给定的图片和文本提示,以不同的程度改变图像的不同区域。这种可控性允许我们再现渐进的过程(例如,左下角的火),并且能够在不同编辑强度之间无缝融合。

引导用的提示词从左到右分别是:“海底的生命之树”,“云端之上的宫殿”,“3D深度外太空星云背景”,“火”,“彩虹的异想天开的插图”,“幻想艺术”。

从这个开篇例子就可以看出,这个算法可以实现图像重绘过程中,更好的调整重绘画面与原图的融合程度。

这种对变化量的精细控制开启了多种新的编辑能力,例如控制单个对象被修改的程度,或者引入逐渐的空间变化的能力。此外,这篇文章展示了框架在软修复方面的有效性——在确保无缝集成的同时微妙调整周围区域以完成图像的部分。

同时,这个框架仅在推理期间运行,不需要模型训练或微调。

原作者提出的一个重要洞察是,在扩散的推理过程中选择性地在不同的时间步骤修改各个区域,我们可以在空间基础上控制对原始图像的忠实度。

以在照片的树林区域引入野火为例。由于火是连续的现象,我们不希望进行突然和完全的转变,例如用烧焦的树桩替换所有树木。相反,我们希望以可控的方式在照片中的不同区域引入不同程度的火势(图1右下角)。 

论文中很重要的一个思路可以用这张图来概括:

随时间的分解。观察变化图如何决定推理过程——区域越暗,越早从残留中复制。或者换句话说,区域越暗,画面中添加的噪声越多,而画面越浅,推理的时候参与的时间越靠后,同时还会从原图中取得信息进行参与计算和推理。

 看一组图片:

嵌套掩码的消融研究。我们的结果显示了更复杂的内容,与场景融合得更好,且模糊度更低。注意过渡(第一行:墙上的锐利过渡)和位置(第二行:建筑物位于湖中)的差异。每一行的种子是固定的。提示词分别为:“一幅精美的艺术画作”,“一个城市天际线...”。

推理过程的示意图。

顶部:当前时间步骤的原始图像添加噪声。

底部:扩散模型去噪的中间图像。箭头附近的掩码表示从每张图片复制的区域。跟随箭头来识别原始来源对输出图像的影响,并观察其与分解掩码和变化图的相关性。提示是“哥特式绘画”。

 文中提到一种比较重要的技术是“软修复”

没有柔化的修复有时会因为与周围背景在风格和光照上的明显差异而显得不自然地叠加。"软修复"是在完成画面部分的同时轻轻修改周围区域以保证平滑融合的过程。我们扩展了我们的框架以支持软修复,允许用户输入一个二进制掩码和一个标量值来确定过渡的柔和度。我们根据柔和度参数对掩码进行高斯模糊,将其转换成变化图,然后由我们的标准框架处理。与以前的方法相比,我们的方法实现了更优秀的软修复编辑(如上图)。

文中提到第二个必要重要的技术是“强度扇” 

在使用扩散模型编辑图像时,找到保留某些元素和改变其他元素之间的完美平衡可能是一个挑战。通常,选择正确的编辑强度可能并不直观,尤其是因为最佳设置会因输入提示和图像的不同而变化。为了简化这个过程,我们提出了一个名为“强度扇”的新可视化工具。这个扇形是一个修改后的图像,通过将其划分为多个列来创建,每个列都以不同的强度级别进行编辑。这使用户能够同时观察多个强度设置,从而简化了比较和调整编辑强度的任务(见上图)。

论文中提到的,重点就是以上这些了。

那么实际测试效果会如何呢?

🥟实测效果

先搭建一组测试节点。

比较简单,相信学过基础课程的朋友都能自己手动搭出来。

(如果还没学过的可以看下文章最后的链接,感谢大家支持先~~~~~😄) 

提示:一朵玫瑰

提示:粉色的云彩; 

 粉色猫头的瓶盖

金色瓶盖

 在雨林中 (选择了背景)

总体来说,效果还可以,比默认的好,比上次推荐的brushnet,貌似没那么惊艳。

如果有局部重绘的场景,不妨试试看。

好了,记得点赞点关注哦,感谢大家的支持~~~~~ 

✨写在最后

如果对comfyui还不熟悉的话,最近面向ComfyUI的新手,写了一门系统性入门图文课程,现在已经更新完成了,内容主要包括如何下载软件、如何搭建自己的工作流、关键基础节点讲解、遇到报错怎么解决等等,如果大家在学习过程中遇到什么问题,也可以直接对应的文章下留言,会持续更新相关答疑内容哈。欢迎订阅哦~

https://blog.csdn.net/jumengxiaoketang/category_12683612.html

​​​

感谢大家的支持~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/873031.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Redis 事务:支持回滚吗?深入解析

今天我们要来探讨一个关于 Redis 事务的重要问题:Redis 事务支持回滚吗?这个问题在 Redis 的使用中经常被提及,对于正确理解和使用 Redis 事务至关重要。那么,让我们一起深入解析这个问题吧! 一、Redis 事务简介 在了…

tabBar设置底部菜单选项以及iconfont图标

tabBartabBar属性:设置底部 tab 的表现 ​ ​ ​ ​ 首先在pages.json页面写一个tabBar对象,里面放入list对象数组,里面至少要有2个、最多5个 tab, 如果只有一个tab的话,H5(浏览器)依然可以显示底部有一个导航栏,如果没有,需要重启后才有,小程序则报错,只有2个以上才可以…

IDEA加载工程报错Error Loading Project: Cannot load module demo.iml解决

spring boot工程由于工程名字为demo不太好,直接更改了这个工程的名字,主要操作了包括重命名项目文件夹、修改IDEA中的项目名称、模块名称、包名称、以及相关的配置文件等。 然后再打开工程,报错Error Loading Project: Cannot load module de…

瑜伽馆预约系统小程序搭建,全民健身下的市场机遇

随着现代生活水平的提高,人们对健康的要求逐渐提高,瑜伽作为一种修身养性的健身方式,深受大众欢迎。在互联网小程序的普及下,瑜伽馆预约小程序也成为了市场的必然发展趋势! 为什么要开发瑜伽馆预约系统? 瑜…

今天又学到了——图编号关联章节号,QGIS下载文件存储的瓦片

记录教程来源:​​​​​​【Word图编号关联章节号】图片分章节 编号,图1-1、图2-1_哔哩哔哩_bilibili 上面链接这个实现的是这个效果: word自动目录及章节自动编号教程_哔哩哔哩_bilibili,这个的效果是自己设计多级列表&#xf…

Redis高级-----持久化AOF、RDB原理

目前已更新系列: 当前:Redis高级-----持久化AOF、RDB原理 Redis高级---面试总结5种数据结构的底层实现 Redis高级----主从、哨兵、分片、脑裂原理-CSDN博客 Redis高级---面试总结内存过期策略及其淘汰策略 计算机网络--面试知识总结一 计算机网络-…

《JavaEE进阶》----11.<SpringIOCDI【Spring容器+IOC详解+DI介绍】>

本篇博客会详细讲解什么是Spring。 SpringIOC SpringID 五个类注解:Controller、Service、Repository、Component、Configuration 一个方法注解:Bean 什么是Spring IOC容器 Spring 是包含众多工具的IOC容器。能装东西的容器。 1.容器 如我们之前学的 Tom…

JavaFX基本控件-TextField

JavaFX基本控件-TextField 常用属性textpromptTextpaddingalignmentwidthheighttooltipbordereditabledisablevisible 格式化整形格式化 实现方式Java实现fxml实现 常用属性 text 设置文本内容 textField.setText("测试数据");promptText 设置文本字段的提示文本&am…

Ollama—87.4k star 的开源大模型服务框架!!

这一年来,AI 发展的越来越快,大模型使用的门槛也越来越低,每个人都可以在自己的本地运行大模型。今天再给大家介绍一个最厉害的开源大模型服务框架——ollama。 项目介绍 Ollama 是一个开源的大语言模型(LLM)服务工具…

替换Windows AD时,网络准入场景如何迁移对接国产身份域管?

Windows AD是迄今为止身份管理和访问控制领域的最佳实践,全球约90%的中大型企业采用AD作为底层数字身份基础设施,管理组织、用户、应用、网络、终端等IT资源。但随着信创建设在党政机关、金融、央国企、电力等各行各业铺开,对Windows AD域的替…

swagger简单使用学习

注意 一下基于spring-boot 3.0.2版本&#xff0c;该版本不支持springfox-swagger2 2.9.2会报错&#xff0c;无法访问swagger 安装 在pomx文件中添加对应的依赖 <!-- swagger --><dependency><groupId>org.springdoc</groupId><artifactId>spr…

Superset二次开发之Select 筛选器源码分析

路径&#xff1a;superset-frontend/src/filters/components/Select 源码文件&#xff1a; 功能点&#xff1a; 作用 交互 功能 index.ts作为模块的入口点,导出其他文件中定义的主要组件和函数。它使其他文件中的导出可以被外部模块使用。 SelectFilterPlugin.tsx 定义主要…

PostgreSQL的repmgr工具介绍

PostgreSQL的repmgr工具介绍 repmgr&#xff08;Replication Manager&#xff09;是一个专为 PostgreSQL 设计的开源工具&#xff0c;用于管理和监控 PostgreSQL 的流复制及实现高可用性。它提供了一组工具和实用程序&#xff0c;简化了 PostgreSQL 复制集群的配置、维护和故障…

python的sqlalchemy使用@contextmanager来定义上下文管理器

Python通过函数名调用函数的几种场景 华为或超聚变服务器安装linux 你知道":“和”//"在python里面代表什么吗&#xff1f;这篇《python运算符》介绍&#xff0c;你肯定不想错过 SQLAlchemy通过contextmanager简化回滚操作 如何理解python的sqlalchemy这种orm框架&am…

大数据采集与分析实训室解决方案

随着信息技术的飞速发展&#xff0c;大数据已成为推动产业升级、社会进步的重要力量。为了培养适应未来社会需求的大数据专业人才&#xff0c;构建一套科学、先进的大数据采集与分析实训室解决方案显得尤为重要。为此&#xff0c;唯众特推出全面升级的大数据采集与分析实训室解…

Java项目——苍穹外卖(一)

Entity、DTO、VO Entity&#xff08;实体&#xff09; Entity 是表示数据库表的对象&#xff0c;通常对应数据库中的一行数据。它通常包含与数据库表对应的字段&#xff0c;并可能包含一些业务逻辑。 DTO&#xff08;数据传输对象&#xff09; 作用&#xff1a;DTO 是用于在…

Leetcode Hot 100刷题记录 -Day10(合并区间)

合并区间 问题描述&#xff1a; 以数组 intervals 表示若干个区间的集合&#xff0c;其中单个区间为 intervals[i] [starti,endi] 。请你合并所有重叠的区间&#xff0c;并返回 一个不重叠的区间数组&#xff0c;该数组需恰好覆盖输入中的所有区间 。 示例 1&#xff1a; 输入&…

Netty系列-3 ChannelFuture和ChannelPromise介绍

背景 Netty源码中大量使用了Future和Promise&#xff0c;学习ChannelFuture和ChannelFuture有助于理解Netty的设计思路。 本文的重点内容在于梳理清楚这些类的关系以及结合源码实现介绍这些类的作用&#xff0c;其中核心逻辑在于DefaultPromise和DefaultChannelPromise&#x…

UnLua环境搭建

一、环境搭建 1、下载UnLua工程&#xff1a;https://github.com/Tencent/UnLua 2、复制Plugins/UnLua目录下的插件到自己的项目中 3、重新生成自己的VS工程 4、打开VS工程的项目名.Build.cs文件&#xff0c;引用UnLua插件,重新编译工程 PublicDependencyModuleNames.AddRan…

Post-Training有多重要?一文带你了解全部细节

1. 简介 随着LLM学界和工业界日新月异的发展&#xff0c;不仅预训练所用的算力和数据正在疯狂内卷&#xff0c;后训练&#xff08;post-training&#xff09;的对齐和微调方法也在不断更新。InstructGPT、WebGPT等较早发布的模型使用标准RLHF方法&#xff0c;其中的数据管理风…