Stable Diffusion采样器及LCM启用办法
在生成图像的时候需要设置「 采样步数 Steps」,这个参数是模型中的去噪过程,即以迭代的方式从一张纯噪声图中一步步去除噪点,直至它变成一张清晰的图像。采样步数一般需要 20-50 步。
基础说明
名称
示意
Karras
优化算法,它们在采样8步之后,比同名算法噪点更少。
2S
表单步算法。2M代表二阶多步算法。与2S相比增加了相邻层之间的信息传递。
2M
2S的升级版本
3M
v1.6版本新增的算法,迭代步数到30+、CFG值减小后达到质量最佳。
SDE
随机微分方程,调用祖先采样,表现不收敛特性。没有多步算法加持生成图像较慢,可以生成逼真的写实风格画面。
Exponential
指数算法,细节少一些但是画面更柔和、干净。渲染时间与SDE和2M相接近。
早期采样器LMS:ODM求解器,线性多步法。速度与Euler相近,但质量不如Euler。LMS Karras:ODM求解器Heun:ODM求解器,是Euler的改进算法,画质更好,但速度慢一倍。Euler:ODM求解器,简单直接,可收敛——能产生最终稳定图像。Euler a:ODM求解器,不 ...
Stable Diffusion Kohya_ss MAC炼丹基础
整理训练的图片整理图片可将元素和场景分开给Ai进行学习,通过文件夹命名结果如30_ys,50_cj。前面的数字即Ai学习的次数(每个图片学习几次)。Ai需要学习的是图片内容和文本内容,文本内容是对应图片的提示词。提示次可在webui中训练——图像预处理中,选择资源目录和输出目录即可。
前提图片尺寸大小一致或已裁剪为一致。
生成提示词
使用BLIP Captioning反推图片提示词,检查提示词是否准确
LoRA训练主要参数Source model
Configuration file:加载预设Model Quick Pick:快速选择模型Save trained mode as:把训练好的模型存为什么格式Pretrained model name or path:如果是自定义可以在这里选择模型路径v2、v_parameterization(底模像素大于768时勾选)、SDXL Model根据底膜的基础算法勾选对应的类型,如果是1.5则不用勾选
FoldersImage folder:存放图片的路径,此路径为步数_名字的上一层。Regularisation folder:正则路径, ...
无需服务器,免费使用2个GPU T4 在云上训练自己的lora
准备注册Kaggle
引用链接地址
Kaggle
前往Kaggle注册
注册完后记得验证手机号
注册ngrok
引用链接地址
Kaggle
前往Kaggle注册
获取ngrok_token
kaggle脚本拉取kohya_ss并执行创建脚本12345678%cd /kaggle/working!git clone https://github.com/bmaltais/kohya_ss.git %cd /kaggle/working/kohya_ss!./setup.sh -nprint("Kohya_SS is done setting up!")
创建文件夹并拷贝数据12345678910111213import osimport shutil# ...
Stable Diffusion放大算法及适用类型
在 Stable Diffusion 中有 3 个地方可以实现图片放大功能。
文生图中 Sampling method 下面的 Hires. fix (高分辨率修复);
图生图中 Script 选择 SD upscale;
Extras (高清化)标签中,支持批量处理。
在这 3 个地方使用到的算法是一样的,只不过使用场景不一样。补充的放大算法存放路径为:stable-diffusion-webui\models\ESRGAN内
LanczosLanczos重采样是一种数学上精确的方法,用于图像放大或缩小。它使用了一种称为 sinc 函数的数学公式,可以在保留图像细节的同时减少锯齿效应。
Nearest最近邻插值是一种简单的图像放大方法,通过复制最近的像素值来填充新像素。这种方法速度快,但可能会导致图像出现锯齿状边缘。
BSRGANBSRGAN是一种基于深度学习的超分辨率生成对抗网络,用于增强图像的分辨率。它可以捕捉更多的图像细节,并生成更自然的高分辨率图像。但可能会引入噪声和伪影。
ESRGAN_4xESRGAN(增强超分辨率生成对抗网络)是一种先进的深度学习方法,用于将图像放大 ...
seg_ofade20k&seg_ofcoco语义分割颜色对应表
电脑端请善用CTRL+F搜索。
seg_ofade20kseg_ofcoco
颜色/16进制颜色码
RGB颜色值
类别(中文)
类别(英文)
▇ #787878
(120, 120, 120)
墙
wall
▇ #B47878
(180, 120, 120)
建筑;大厦
building; edifice
▇ #06E6E6
(6, 230, 230)
天空
sky
▇ #503232
(80, 50, 50)
地板;地面
floor; flooring
▇ #04C803
(4, 200, 3)
树
tree
▇ #787850
(120, 120, 80)
天花板
ceiling
▇ #8C8C8C
(140, 140, 140)
道路;路线
road; route
▇ #CC05FF
(204, 5, 255)
床
bed
▇ #E6E6E6
(230, 230, 230)
窗玻璃;窗户
windowpane; window
▇ #04FA07
(4, 250, 7)
草
grass
▇ #E005FF ...
Hexo-公众号小程序更新实用功能
趁着最近有空,看着捡漏的小程序界面。感觉这个样子食之无味,弃之可惜,但毕竟曾经花了时间的,想着还是小小的优化一波。
新功能1、优化文章列表效果,搭配图片展示。2、增加短视频解析去水印功能。3、增加万年历黄历等功能。4、没了…5、也不是没了,还有个chatgpt模块,但是因为审核机制问题,放弃了这个板块,想要这部分源码的可以私信免费送。
第一个当然是样式太简陋了,避免界面劝退。其次是增加了两个功能,虽然两个功能都烂大街了但是感觉还是很实用的,用的时候到处找也挺麻烦的,一个是短视频解析,在一个是日历/黄历。毕竟易经都已经变成了国家认可的学问了,老祖宗留下的黄历还是值得办事前看看的。
新版效果
[{"url":"https://pic.nanbowan.top/picturebed/65a61977ebfd8.png","alt":""},{"url":"https://pic.nanbowan.top/picturebed/65a6197c979d9.png","alt":""},{"url":"https://pic.nanbowan.top/picturebed/65 ...
Mac安装kohya_ss进行本地lora训练常见问题解决方案
方案一123456789101112git clone https://github.com/bmaltais/kohya_ss.gitcd kohya_sspython3 -m venv venvsource venv/bin/activate./setup.shpip uninstall tensorboard tensorboard-data-server tensorboard-plugin-wit tensorflow tensorflow-estimator tensorflow-macos torch torchaudio torchmetrics torchvisionpip install torch torchvision torchaudio torchmetricspip install tensorflowpip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpupip install tensorflow to ...
记录未读
滴滴宕机20小时、阿里宕机2小时、语雀宕机8小时,聊聊我为什么做本地知识管理😏大家优惠券领了吗?VIP领了吗?宕机带了的福利香吗?可是问题在于自己的东西都在别人的服务器里,不在自己手上真的好吗?
我并不是说云服务完全没有价值。云服务的便利性和灵活性是无可否认的。然而,我们也不能完全依赖云服务,而忽视了数据安全的重要性。我们应该根据自己的需求和风险承受能力,综合考虑使用云服务和本地存储的平衡。最近发生的几起宕机,让我更加觉得自己做本地笔记是一件非常正确的事。
契机起因大概是自己总是容易忘记很多事,所以希望能有文档能随时记录下来复盘和学习,加上自己会点前端语言,所以想把自己的笔记弄好看点,所以开始搭建了网站。现在回想起来,不知不觉过去了四年…
由我掌控的创意空间无论是微信公众号、小红书还是微博,总会有各种限制在里面。有些内部笔记如果想不想公开写上去又有泄密的风险,在探索过许多平台之后,渐渐有了自建网站的打算。在博客中理论上能够完全按照我的意愿创作一个符合我审美需求、满足功能要求的网站——前提当然得有足够扎实技术基础支持。幸好,我的前端知识已经足以帮助我把网站修改成我想要的样子。如果你没有代码基础,也想简单的构建一个网站可以看我早期分享的文章:
引用链接地 ...
Kohya_ss 开发者训练说明文档train_README-zh
引用链接地址
原文地址
官方训练文档文档
由于文档正在更新中,描述可能有错误。
关于训练,通用描述本库支持模型微调(fine tuning)、DreamBooth、训练LoRA和文本反转(Textual Inversion)(包括XTI:P+)本文档将说明它们通用的训练数据准备方法和选项等。
概要请提前参考本仓库的README,准备好环境。
以下本节说明。
准备训练数据(使用设置文件的新格式)
训练中使用的术语的简要解释
先前的指定格式(不使用设置文件,而是从命令行指定)
生成训练过程中的示例图像
各脚本中常用的共同选项
准备 fine tuning 方法的元数据:如说明文字(打标签)等
如果只执行一次,训练就可以进行(相关内容,请参阅各个脚本的文档)。如果需要,以后可以随时参考。
关于准备训练数据在任意文件夹(也可以是多个文件夹)中准备好训练数据的图像文件。支持 .png, .jpg, .jpeg, .webp, .b ...
Controlnet界面参数作用
作用:控制网的核心作用是基于一些额外输入给它的信息来给扩散模型的生成提供明确的指引,通过加载外置图像用A!重新解构信息并生成对应 A能理解的定式信息,比如姿势Openpose控制点,从图片中提取ControlNet有用的额外信息,根据一些额外信息控制扩散生成定式走向,依托 ControlNet数据指导下生成图像作品。ControlNet Unit可在设置中增加
控制按钮按钮顺序:创建画布、开启/关闭摄像头、水平翻转摄像头画面、将controlnet图片尺寸发送到生图
启用:是否启用Controlnet低显存模式:对低显存机器进行配置的优化完美像素模式:让Controlnet自行决定预处理图片的分辨率,优化处理结果允许预览:在右侧显示预览
预处理器/模型预处理器:将图片转换为数据图模型:将数据图转化为最终结果
Control Type 控制类型Canny(硬边缘):获取图片基本轮廓,一种边缘监测算法,作用是将图片的边缘提取出来,类似线稿,倾向点状结构。Depth(深度):获取图片近景和远景关系,生成有景深的信息图,颜色越浅,离镜头越近;颜色越深,离镜头越远。
Depth leres ...
十二经络奇经八脉腧穴汇总介绍
手太阴肺经
子午流注(在子午经脉上进行针刺或灸疗时的特定方法。子午是指手太阴肺经和足太阴脾经,流注则表示经脉的流动。) 丨 肺 丨 寅时 3~5点
腧穴中府、太渊、鱼际、经渠、列缺、尺泽、天府、侠白、孔最、少商、云门
主治《针灸大成》:辛金之脏,脉居右寸,实则脉实,上热气粗兼鼻壅,泻必辛凉。虚则脉虚,少气不足息低微,补须酸热。橘甘下痰气之神方,姜除去气嗽之圣药。七情郁结因而喘,沉香乌药参槟;胸痞喘急彻而痛,半夏瓜蒌桔梗。鼻塞不通,丸荆穗澄茄薄荷;鼻渊不止,末龙脑苍芷。百花却去红痰,二母偏除热嗽。黄连赤茯阿胶,抑心火而清肺脏,诃子杏仁通草,利久嗽以出喉音,流注疼痛因痰饮,半夏倍于朴硝;瘾疹痒痛为风热,苦参少于皂荚。哮嗽齁齁,兜铃蝉蜕杏(除尖)砒霜(少入),热壅咽喉,鸡苏荆芥桔防风,参牛甘草消酒疸,轻粉硫黄去鼻痔。白矾甘遂白砒霜性情实重,入豆豉偏治呴喘;百草霜气味虽轻,和海盐却消舌肿。甜葶苈良治肺痈,苦雄胆寒涂肠痔。琼玉膏理嗽调元,流金丹清痰降火。人参非大剂不补,少则凝滞,大则流通;黄芩非枯薄不泻,细则凉肠,枯则清金,升麻白芷,东垣曾云报使;葱白麻黄,仲景常用引经。紫菀五味能补敛,桑白防风 ...
记录未读
Github Failed to connect to github.com port 443 解决办法方法一:重启代理关闭代理12git config --global --unset http.proxy git config --global --unset https.proxy
添加全局代理12git config --global http.proxy git config --global https.proxy
方法二:修改host在终端或CMD中找到GIthub.com的ip地址,12345nanbowan@NanbowandeMacBook-Pro Desktop % ping github.comPING github.com (140.82.113.3): 56 data bytes64 bytes from 140.82.113.3: icmp_seq=0 ttl=49 time=226.679 ms64 bytes from 140.82.113.3: icmp_seq=1 ttl=49 time=222.074 ms64 bytes from 140.82.113.3: icmp_seq=2 ttl=49 time=218.888 ms
将获取到的ip地 ...