Lazy loaded image
技术分享
notion://custom_emoji/f738d5c4-7124-4d0d-ac3d-34a860d0009d/212bd4d9-052e-80e7-962d-007a9c740241?t=2e7bd4d9-052e-81f1-91c9-e61d24bea146Stable Diffusion
Words 1676Read Time 5 min
2025-6-4
2026-1-13
type
summary
status
category
tags
slug
date
password
icon
状态
子标签
标签
日期
Jan 13, 2026 08:03 AM
CONTENT
 

第一节_overview

重点在于“扩散”:

  1. 不分图层
  1. 原图→加噪声(抽离出基本锚点形象)→出图(按训练的模型数据加入推测出的像素点)

UI选择

webui还是comfyUI可以衔接过渡,先看以下comfyui的跟webui的联系,再回去看stable diffusio的基础原理和常用操作以及经典应用场景

 
MINDMAP
notion image
 
 
 
 
 
 
 

 

第二节_Prompt

番外:ComfyUI

 
 
 

提示词Prompt

  1. (prompt words: number) ——括号调权重,数字代表大小,上限一般1.5
  1. CFG相关性权重,7-12左右
 
 
 

 

第三节_image2image

图生图

  1. seed:规避随机性,保留基本人物信息特征,即锚点
  1. 自定义轮廓,色块,线条,抽象出基本的原型,模型再创作的模式
 
 
 
 

 

迪斯科_模型和站点

SD模型本身

 

资源站点

  1. hugging facehuggingfacehuggingfaceHugging Face – The AI community building the future.
  1. civitaicivitai.com
 
 
 
 

 

第五节_分辨率提升

SD放大脚本

  1. Hi-Res Fix重绘
  1. 插件脚本-重复像素堆叠:切成四块重绘的交叠处重复,避免四块过渡生硬,平滑过渡拼合。
  1. AI算法放大:不涉及去噪重绘,会更快,但效果也一般
 
 
 
 
 

 

第六节_3个高级模型

高级模型

Embeddings

  1. 本质:嵌入式向量
  1. 作用:书签,指向已经有的数据库的某些定义页面。即指向训练SD模型时所用图库中的该类关键词集合。
  1. 应用场景:
    1. 泛化的角色指向,只有很少的特定角色锚点;
    2. 经典例子:三视图——并非真正意义上的三视图,而是加入了embeddings书签,指向之前训练时所用到的喂给SD的三视图tag。或者指向之前的turner人物转身tag;
    3. 负面词嵌入:避开经典的negative tags;
    4. 需要下载,下载后放入embeddings文件夹,并在prompt中写出来;
 

LoRA

  1. 全称:Low-Rank Adaption Models,低秩适应模型
  1. 本质:特定角色的描述词tag集合,即角色锚点集合。所以多用于角色
  1. 应用:
    1. 锚点集合
    2. 会对原来的底模产生画风上的影响,可以在prompt中适当降低权重
 

Hypernetwork

  1. 超网格
  1. 多用于改变画风
  1. 选项设置在“设置”“附加网络”里选择,不用了记得取消掉
  1. 暂时的应用场景和范围相比上面两位LoRa和Embeddings比较局限
这些东西本身发展巨快,先有个基本认知就可以,并主动设计相关最新信息的信息流推送茧房,所谓的大数据,利于特定方向领域的信息摄取。
  1. 看最新的应用
 
 
 

 

第七节_局部重绘inPaint Sketch

  1. 本质:蒙版——Mask——蒙住了部分关键区域的板子,当然可以正着用反着用,就像喷涂绘画
  1. 需要注意的参数:
    1. 羽化缓冲区域
    2. 重绘区域:蒙版里外
  1. in Paint Sketch
    1. 画笔除了类蒙版限定区域的作用,增加了输入信息的作用
    2. 用于纠正手部
      1. 示例
        notion image
  1. Sketch:就是抽象轮廓,交给模型再生成
  1. 额外技巧:WebUI的自带蒙版功能很粗糙,可以组合使用PS中的工具,生成更精确的蒙版,从而更精确的掌控重绘范围:比如:
    1. 示例
      notion image
 
 
课程除了这种一次概览,更有效的是根据应用场景确定需求,再去选择针对的教程,这样的强化学习过程多来几次,甚至于我而言来上一次,就能通了。这是更高效的。
 

 

第八节_插件Extension

  1. 安装方式
    1. notion image
  1. 或者直接下包放到extension目录里
 
 
 
 

 

第九节_LoRA

后面还有补充的:60分钟速通LORA训练!绝对是你看过最好懂的AI绘画模型训练教程!StableDiffusion超详细训练原理讲解+实操教学,LORA参数详解与训练集处理技巧_哔哩哔哩_bilibili

原理

  1. 一种更简单的对大模型微调的方式
    1. contrast
      notion image
  1. 文件格式还是ckpt-checkpoint和safetensor;但大小小很多,一两百兆左右
 

3种加载方式

  1. prompt提示词里面<>尖括号加
  1. 选项加
  1. additional network扩展
后两个的目的,是为了避免提示词里面出现过多与tag无关的设置选项类数据,会干扰信息阅读
 
 
 

5个案例

overview
notion image
 

人物Chracter

 

画风Style

  1. style类的LoRA比角色类的影响更重,所以权重可以适当调低一些
  1. 记得加“触发词”,即trigger
 
 

概念Concept

类画风,更宽泛
经典concept:立绘风格,gacha-抽卡,模型参考大量手游立绘
 
 
 

服饰Cloth

  1. 多个LoRA叠加使用
 
 

特定元素Object

服饰等的延伸
用法:先画大的,再局部重绘出这个元素
notion image
 
 
 
 
 

 

第十节_ControlNet

 

基本原理

  1. 核心:控制 Control,控制扩散模型去噪时的走向
 
 

安装使用

参考

5个常用作用
notion image
 

使用

  1. 无骨骼图:预处理器Annotator,处理出来姿势pose
  1. 找到对应模型
  1. 最重要的参数:控制权重control weight,如果控制不住,即control体现不出来,就拉大权重;反之拉小,缩短步数
  1. 有骨骼图:不用预处理器,直接
 

5大模型

openpose

  1. 基本骨骼姿势
  1. 手部骨骼
  1. 脸部表情
 

depth

  1. 空间深度,层次
  1. 场景
  1. 人物非常规姿势时的部位前后关系
 
 

canny

  1. 源于边缘检测算法
  1. 生成效果类似于线稿
  1. 用于控制图形外形特征
    1. 车,仪器等
    2. 狗猫毛发等
    3. 文字字形
  1. 线条密集程度调整下方参数(明暗的差异值),太密的话会导致出图出现过多无用细节
  1. 线稿上色:先把白底黑线的线稿invert反转为白底黑线的符合canny的参考图
 

softedge

  1. 全称:整体边缘线条检测 holistically-nested edge detection(HED)→ 柔和边缘 soft edge
  1. HED相比canny更柔和,是涂抹,色块,羽化,过渡的感觉,拥有更大的自由度
 
 
 

scribble

  1. 形象解释:涂鸦
 
 
 

组合使用_MultiControlNet

example
notion image

核心:互功能补

 
 
 
 

 

 
 
 
 
 

 
 
 
上一篇
AI翻译
下一篇
Prompt模板