为什么要训练Stable Diffusion WebUI模型原理解读

2024-01-14 13:56 0 微浪网 0

Stable Diffusion教程攻略

导语：为什么要训练自己的模型？训练自己的模型可以在现有模型的基础上，让AI懂得如何更精确生成或生成特定的风格、概念、角色、姿势、对象。举例来说，如果喂给AI十几张我精挑细选的「Hara老师绘制的、不同角度、FGO的斯卡萨哈」做训练，那么就能让AI更懂得如何生成斯卡萨哈的脸部，风格也会比较固定。以下是一个具体例子，通过使用自行训练的HyperNetwork，便改善单靠Anything模型无法生成出Ha...

为什么要训练自己的模型？训练自己的模型可以在现有模型的基础上，让AI懂得如何更精确生成或生成特定的风格、概念、角色、姿势、对象。

举例来说，如果喂给AI十几张我精挑细选的「Hara老师绘制的、不同角度、FGO的斯卡萨哈」做训练，那么就能让AI更懂得如何生成斯卡萨哈的脸部，风格也会比较固定。

以下是一个具体例子，通过使用自行训练的HyperNetwork，便改善单靠Anything模型无法生成出Hara老师画风的缺点。在不使用HyperNetwork的情况下，风格永远是左边那样；一使用HyperNetwork，右边的风格就能轻松生成出来了。

训练模型是复杂的议题，基于哪个现有模型，以及喂给AI学习的图片品质，还有训练时的参数，都会影响模型训练结果。

本文提及的Embedding、HyperNetwork、LoRA都是「小模型」，这是相对于网络动辄好几GB的checkpoint「大模型」而言。这些小模型训练时间短，文件约几MB而已，训练成本不高。主要是用于生成特定人物/对象/画风，并且训练的模型可以多个混用。

如果硬件条件许可的话，搜集大量图片训练特定领域的checkpoint大模型，再上传到HuggingFace造福他人也是不错的选项，只不过此任务过于庞大。要知道Stable Diffusion 1.5版的模型可是输入了23亿张图片训练出来的！网络上其他人训练的模型至少也准备了几万张图片。因此要生成特定的人物/对象/画风，训练小模型对一般人来说比较划算。

各个模型的原理差异请参考下图。技术原理以及训练参数设置请参阅「参考数据」一章，碍于篇幅无法一一细讲，本章以操作过程为主。

就训练时间与实用度而言，目前应是 LoRA > HyperNetwork > Embedding

本章节以AUTOMATIC1111开发的Stable Diffusion WebUI为中心撰写，因其图形化且易操作。后面简称SD WebUI。

接着选择部署在本机或是云端？

训练模型至少需要10GB的VRAM，也就是RTX3060等级以上的GPU。

如果你有Nvidia RTX3060以上等级的GPU，那就参考安装教学部署在本机，想训练多久就训练多久。训练数据不到50张图片的小模型训练时间约只要1~3个小时。

结论

通过训练自己的模型，我们可以让AI更好地满足我们的需求，生成特定的风格、概念、角色、姿势、对象。使用Stable Diffusion提供的Embedding、HyperNetwork和LoRA等小模型，我们可以在相对较短的时间内训练出满足特定需求的模型。对于一般用户来说，训练小模型是更划算的选择。无论是部署在本机还是云端，只要拥有足够的硬件条件，我们都可以轻松进行模型训练。训练自己的模型，让AI更懂你的需求，为你带来更好的生成结果。

1、本文来自 Stable Diffusion教程攻略 投稿的内容 为什么要训练Stable Diffusion WebUI模型原理解读 ，所有言论和图片纯属作者个人意见，版权归原作者所有；不代表本站立场；
2、本站所有文章、图片、资源等如果未标明原创，均为收集自互联网公开资源；分享的图片、资源、视频等，出镜模特均为成年女性正常写真内容，版权归原作者所有，仅作为个人学习、研究以及欣赏！如有涉及下载请24小时内删除；
3、如果您发现本站上有侵犯您的权益的作品，请与我们取得联系，我们会及时修改、删除并致以最深的歉意。邮箱： i-hu#（#换@）foxmail.com

为什么要训练Stable Diffusion WebUI模型 原理解读

结论

猜你喜欢

为什么要训练Stable Diffusion WebUI模型原理解读