上海品茶上课(上海gm品茶/上海品茶)

上海品茶

【西山居黄鸿波】Stable Diffusion如何在企业中落地.pdf

上传人：张**

编号：157152

2024-03-16

PDF 31页 4.28MB

《【西山居黄鸿波】Stable Diffusion如何在企业中落地.pdf》由会员分享，可在线阅读，更多相关《【西山居黄鸿波】Stable Diffusion如何在企业中落地.pdf（31页珍藏版）》请在三个皮匠报告上搜索。

1、Stable DiffusionStable Diffusion如何在企业中落地如何在企业中落地西山居AI技术专家黄鸿波PART 1Stable Diffusion的工作原理PART 3如何利用Stable Diffusion在企业中落地PART 2如何利用Stable Diffusion训练出稳定的效果01Stable Diffusion的工作原理Stable Diffusion中的各个组件是如何协调工作的Stable Diffusion基于Latent Diffusion Models，专门用于文图生成任务。Latent Diffusion Models通过在一个潜在表示空间中迭代“去噪

2、”数据来生成图像，然后将表示结果解码为完整的图像，让文图生成能够在消费级GPU上，在10秒级别时间生成图片，大大降低了落地门槛，也带来了文图生成领域的大火。Latent Diffusion Models整体框架UNet结构UNET 是从噪音中生成图像的主要组件，在预测过程中，通过反复调用 UNET，将 UNET 预测输出的 noise slice 从原有的噪声中去除，得到逐步去噪后的图像表示。ResnetBlockSpatial Transformer(Cross Attention)DownSample/UpSampleDiffusion的扩散原理正向扩散过程前向扩散过程逐步对输入图像x 逐

3、渐加入高斯噪声，一共有T步。该过程将产生一系列噪声图像样本x ,x_T。逆向扩散过程逆向扩散过程与正向过程不同，不能使用q(x|x)来反转噪声，因为它是难以处理的(无法计算)。所以我们需要训练神经网络p(x|x)来近似q(x|x)。近似p(x|x)服从正态分布02如何利用Stable Diffusion训练出稳定的效果使用webUI训练的一些细节和trickDreamBoothLoRADreamBoothDreamBooth特征词+类别标签类别DreamBoothDreamBootha abc dog问题：只会生成这只狗DreamBoothDreamBootha abc dog类别：a dog

4、LoRALoRAInputOutputLoRALoRAInputOutputLoRALoRALoRALoRA03如何利用Stable Diffusion在企业中落地使用Stable Diffusion训练自己的大模型细节数据集处理底模的选择参数的影响a drawing of a green pokemon with red eyesexport MODEL_NAME=runwayml/stable-diffusion-v1-5export TRAIN_DIR=/datb/train_data/accelerate launch-mixed_precision=fp16 train_text_t

5、o_image.py -pretrained_model_name_or_path=$MODEL_NAME -train_data_dir=$TRAIN_DIR -use_ema -resolution=512-center_crop-random_flip -train_batch_size=1 -gradient_accumulation_steps=4 -gradient_checkpointing -max_train_steps=15000 -learning_rate=1e-05 -max_grad_norm=1 -lr_scheduler=constant-lr_warmup_steps=0 -output_dir=sd-pokemon-model谢谢谢谢观观看看thanks