accelerate launch --num_cpu_threads_per_process 1 anima_train.py ^ --gradient_checkpointing ^ --optimizer_type="AdaFactor" ^ --fused_backward_pass ^ --blocks_to_swap=26 ^ --mixed_precision="bf16" ^ --cache_latents ^ --cache_latents_to_disk ^ --attn_mode=sdpa ^ --pretrained_model_name_or_path=anima-preview.safetensors ^ --qwen3=qwen_3_06b_base.safetensors ^ --vae=qwen_image_vae.safetensors ^ --output_dir a^ --save_model_as=safetensors ^ --logging_dir a^ --timestep_sampling="sigmoid" ^ --discrete_flow_shift=1.0 ^ --learning_rate=1e-5 ^ --lr_scheduler="constant" ^ --persistent_data_loader_workers ^ --max_train_epochs=30 ^ --save_every_n_epochs=2 ^ --dataset_config=.toml ^ --output_name="a"