# üåü XL LoRA Trainer (Lightning.ai) por Mighty Crimson

Este notebook adapta el flujo de trabajo del proyecto original de [hollowstrawberry](https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Lora_Trainer_XL.ipynb) y el fork de [whitez](https://colab.research.google.com/github/gwhitez/Lora-Trainer-XL/blob/main/Fix_Lora_Trainer_XL.ipynb) usando [Kohya](https://github.com/kohya-ss/sd-scripts/tree/5a18a03ffcc2a21c6e884a25d041076911a79a2a) a para ejecutarse dentro de Lightning.ai.<br>
Si se les hace compicado entender todo este notebook, comienzen primero haciendo loras en colab para familiarizarse con este notebook.<br>
Recomendable solo usar la grafica L4, ya que es suficiente para todo.<br>
Todo el trabajo se realiza en el directorio base `/teamspace/studios/this_studio`.

> Basado en el trabajo de [Kohya-ss](https://github.com/kohya-ss/sd-scripts), [Linaqruf](https://github.com/Linaqruf/kohya-trainer) y los colaboradores de este fork.


### ‚≠ï Aviso
Este cuaderno est√° pensado para investigaci√≥n y entrenamiento de modelos LoRA de forma responsable.
Aseg√∫rate de respetar los t√©rminos de servicio de Lightning.ai y de cualquier repositorio o dataset que utilices.


| Recurso | Enlace |
| :--- | :--- |
| C√≥digo base del entrenador | [gwhitez/LoRA_Easy_Training_scripts_Backend](https://github.com/gwhitez/LoRA_Easy_Training_scripts_Backend) |
| Scripts originales | [kohya-ss/sd-scripts](https://github.com/kohya-ss/sd-scripts) |
| Adaptaci√≥n Lightning | Este notebook |


# Dependencias, solo inicia una vez esta celda y reinicia el kernel

In [1]:
## Dependencias, solo inicia una vez esta celda y reinicia el kernel
from IPython.display import display, HTML
from IPython.display import clear_output
import shutil
!git clone https://github.com/MightyCrimsonX/LoRA_Easy_Training_scripts_Backend.git

packages = [
    "accelerate==0.33.0",
    "xformers",
    "transformers==4.44.0",
    "diffusers==0.25.0",
    "torch",
    "torchvision",
    "ftfy==6.1.1",
    "opencv-python==4.8.1.78",
    "einops==0.7.0",
    "pytorch-lightning==1.9.0",
    "bitsandbytes==0.48.2",
    "lion-pytorch==0.0.6",
    "schedulefree==1.4",
    "prodigy-plus-schedule-free==1.9.0",
    "prodigyopt==1.0",
    "tensorboard",
    "safetensors==0.4.4",
    "altair==4.2.2",
    "easygui==0.98.3",
    "toml==0.10.2",
    "voluptuous==0.13.1",
    "huggingface-hub==0.24.5",
    "imagesize==1.4.1",
    "numpy<=2.0",
    "rich==13.7.0",
    "sentencepiece==0.2.0",
    "tarlette",
    "uvicorn[standard]",
    "requests",
    "dadaptation",
    "wandb",
    "pyngrok",
    "pycloudflared",
    "scipy",
    "came-pytorch",
    "pytorch_optimizer==3.1.2",
    "wheel"
]

# Instalar cada paquete individualmente
for package in packages:
    !pip install {package}
!sudo apt install aria2 -q
%cd /teamspace/studios/this_studio/LoRA_Easy_Training_scripts_Backend
!git clone https://github.com/kohya-ss/sd-scripts.git
!mv /teamspace/studios/this_studio/LoRA_Easy_Training_scripts_Backend/notebook_scripts /teamspace/studios/this_studio/
clear_output()
display(HTML(f"<h1 style='color: yellow;'>Dependencias Instaladas, Reinicia el Kernel</h1>"))


# Elige tus parametros y espera unos segundos hasta que la carpeta se genere.

In [None]:
#@title üîß Configuraci√≥n r√°pida del entrenamiento
from notebook_scripts.training_config_ui import render_quick_training_config

render_quick_training_config(globals())


# Entrenamiento. Solo activa la celda y espera a que termine el entrenamiento.

In [None]:
#@title üöÄ Entrenar LoRA
exec(open("notebook_scripts/run_training_cell.py").read(), globals())


## Opcional para no perder creditos

In [2]:
#elimina los modelos base antes de cerrar lightning para que no te cobren mas creditos por almacenamiento.
!rm -rf models

## Extras (WIP)

### üìö Varias carpetas en el mismo conjunto de datos
A continuaci√≥n se muestra una plantilla que le permite definir varias carpetas en su conjunto de datos. Debe incluir la ubicaci√≥n de cada carpeta y puede establecer un n√∫mero diferente de repeticiones para cada una. Para agregar m√°s carpetas, simplemente copie y pegue las secciones que comienzan con `[[datasets.subsets]]`.

Al habilitar esto, se ignorar√° el n√∫mero de repeticiones establecidas en la celda principal y tambi√©n se ignorar√° la carpeta principal establecida por el nombre del proyecto.

Puede convertir uno de ellos en una carpeta de regularizaci√≥n agregando `is_reg = true`  
Tambi√©n puede establecer diferentes `keep_tokens`, `flip_aug`, etc.

In [None]:
custom_dataset = """
[[datasets]]

[[datasets.subsets]]
image_dir = "/teamspace/studios/this_studio/lora_projects/example/dataset/good_images"
num_repeats = 3

[[datasets.subsets]]
image_dir = "/teamspace/studios/this_studio/lora_projects/example/dataset/normal_images"
num_repeats = 1

"""

In [None]:
#@markdown ## Directorio base en Lightning.ai
from pathlib import Path
lightning_root = Path('/teamspace/studios/this_studio')
print(f"Trabajando en: {lightning_root}")


In [None]:
custom_dataset = None

In [None]:
##Calculador de Repeticiones ‚åõüìù
# Calcula el n√∫mero de repeticiones a usar para entrenar tu lora, Recuerda que en `SDXL y Pony` se usa un batch de `4`.
# Si usas colab pro calcula tus repeticiones con `8` de batch size
# Define las Variables
# N√∫mero de im√°genes
num_images = 24 # @param{type:"number"}
# N√∫mero de repeticiones
num_repeats = 2 # @param{type:"number"}
# N√∫mero de epocas
num_epochs = 30 # @param{type:"number"}
# Tama√±o de lote
batch_size = 8 # @param{type:"number"}

# Calcula el resultado
resultado = (num_images * num_repeats * num_epochs) / batch_size

# Muestra el resultado
print("\33[96mEl total de repeticiones es:\033[0m", resultado)

In [None]:
#@markdown ### üìÇ Descomprimir conjunto de datos
#@markdown Sube un archivo `.zip` al almacenamiento de Lightning y descompr√≠melo en la carpeta deseada.
zip = "/teamspace/studios/this_studio/my_dataset.zip" #@param {type:"string"}
extract_to = "/teamspace/studios/this_studio/lora_projects/example/dataset" #@param {type:"string"}

import os, zipfile

os.makedirs(extract_to, exist_ok=True)
with zipfile.ZipFile(zip, 'r') as f:
  f.extractall(extract_to)

print("‚úÖ Archivo extra√≠do")
