
BrushNet是腾讯PCG和香港中文大学联合共同提出一个基于扩散模型的文本引导图像修复模型。它采用了独特的双分支结构来处理被遮挡的图像特征和噪声潜变量,极大地减轻了模型的学习负担。此外,BrushNet能够在任何预训练的扩散模型上即插即用,提供了密集的像素级控制,使其非常适合图像修复任务。 具体来说,BrushNet的设计包括两个关键的洞见: 将蒙面图像特征和噪声潜伏分开处理,减少了模型的学习负担; 通过对整个预训练模型进行密集的每像素控制,增强了其适用于图像修复任务的能力。 项目相关地址: 项目主页:https://tencentarc.github.io/BrushNet/ github:https://github.com/TencentARC/BrushNet 技术论文:https://arxiv.org/pdf/2403.06976 ComfyUI-BrushNet:https://github.com/nullquant/ComfyUI-BrushNet 主要功能特点 即插即用:BrushNet可以直接嵌入到任何预训练的扩散模型中,无需对模型进行重大修改或重新训练。 双分支结构:它采用了一个独特的双分支结构,将蒙面图像特征和噪声潜变量分开处理,这样做可以减轻模型的学习负担,并提高修复质量。 密集的像素级控制:BrushNet提供了密集的每像素控制,这意味着用户可以精细调整图像的每个像素,以获得更好的修复效果。 图像修复:它专门设计用于图像修复任务,能够处理各种复杂的蒙版形状和图像内容,保证修复结果的连贯性和增强效果。 BrushData和BrushBench:为了促进基于分割的修复训练和性能评估,BrushNet引入了BrushData和BrushBench,这两个工具可以帮助用户更好地训练和评估模型。 BrushNet模型架构 BrushNet 模型在给定遮罩和遮罩图像输入的情况下输出修复后的图像。 首先,对遮罩进行下采样以适应潜在空间的大小,并将遮罩图像输入到 VAE 编码器中以对齐潜在空间的分布。 然后,将噪声潜在、遮罩图像潜在和下采样遮罩作为 BrushNet 的输入进行连接。从 BrushNet 提取的特征在零卷积块后逐层添加到预训练的 UNet 中。去噪后,生成的图像和遮罩图像使用模糊遮罩进行混合。 BrushNet模型架构 BrushNet模型ComfyUI体验 当前社区已有ComfyUI插件支持BrushNet模型的体验了,插件地址为:https://github.com/nullquant/ComfyUI-BrushNet。 1、首先通过ComfyUI插件管理器搜索ComfyUI-BrushNet,并安装插件。 2、下载对应模型,并放置在ComfyUI/models/inpaint目录下。如果需要使用PowerPaint,则还需要获取 SD1.5 文本编码器模型 model.fp16.safetensors。它应该放置在您的 models/clip 文件夹中。下载地址为:https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main/text_encoder 4、导入工作流,并重启ComfyUI。
数据统计
相关导航

野葱视频转换器是一款全能的音视频处理工具,具备音视频格式转换、视频压缩、为视频添加水印、应用LUT等功能,能高效满足各类用户的需求。

Felo Search
Felo Search是一款由ChatGPT和AI Agent提供支持的多语言AI搜索引擎,旨在优化发现和理解世界知识。通过打破语言障碍,Felo Search让用户可以轻松访问全球信息。其智能搜索功能和自动跳转特性,简化了研究过程,提升了搜索效率。无论是查找信息还是探索全球知识,Felo Search都是您的理想选择。

Tmttool
Tmttool 是一个AI免费的在线矢量图转换工具,用于将位图图像(如 PNG、JPG)转换为矢量图(如 SVG、EPS、PDF)。这个工具特别适合需要将低分辨率图片放大或进行二次创作的设计师。使用 Tmttool,只需上传图片,选择输出格式,点击转换按钮,即可获得高质量的矢量图。

快手云剪onvideo
快手云剪是快手官方在线视频创作平台。用户可以通过该软件高效完成视频内容制作,并可在线编辑视频、制作视频封面、去抖动、抠像等操作。提供智能语音转字幕、智能字幕转语音、团队协同、媒资管理、资源共享、团队内容审核等功能。

imagesmaller
ImageSmaller是一款免费在线图片压缩工具。它支持压缩PNG、JPG、JPEG、GIF、TIFF等多种格式的图片,甚至也支持WEBP和SVG格式。在不影响画质的前提下,ImageSmaller最高可压缩图像90%的文件大小。用户只需选择想要压缩的图像(最大支持50MB),稍等几秒即可完成压缩。

Sassbook AI
Sassbook AI是一个人工智能应用,旨在通过使用最新的人工智能技术来自动化内容创作和内容自动化工作流程,从而显著加快这些流程并减少所需资源。它们提供了多种工具,包括AI写作软件、AI摘要生成器、AI改写工具和AI标题生成器,这些工具可以帮助用户更快地创建独特的文本内容,并以适合的风格进行创作。Sassbook AI的目标是通过自动化大部分工作流程,大幅提高内容创作和消费的效率。

Wallpaper Abyss
Wallpaper Abyss 是 Alpha Coders 平台的一部分,专注于提供高质量壁纸下载服务。它汇集了视频游戏、动漫、自然景观等多种类别的壁纸资源,为用户提供多样化的选择。同时提供多种设备的壁纸,包括桌面和手机壁纸,拥有超过85万张壁纸,分辨率从2K到8K不等。用户可以轻松浏览不同类别,找到适合自己桌面的壁纸。支持创作者的机制和丰富的社区互动活动,让 Wallpaper Abyss 成为壁纸爱好者的理想平台。

VICE中国
全球青年文化之声
暂无评论...