WildTrain Scripts Reference

This page documents all batch scripts available in the WildTrain package for model training and evaluation.

Overview

All scripts are located in wildtrain/scripts/ directory.

Quick Reference

Script	Purpose	Config File
train_classifier.bat	Train classification model	`configs/classification/classification_train.yaml`
eval_classifier.bat	Evaluate classifier	`configs/classification/classification_eval.yaml`
eval_detector.bat	Evaluate detector	Various detector configs
train_yolo.bat	Train YOLO detector	`configs/detection/yolo_configs/yolo.yaml`
train_mmdet.bat	Train MMDetection model	`configs/detection/mmdet_configs/mmdet.yaml`
register_model.bat	Register model to MLflow	`configs/registration/*.yaml`
run_classification_pipeline.bat	Full classification pipeline	`configs/classification/classification_pipeline_config.yaml`
run_detection_pipeline.bat	Full detection pipeline	`configs/detection/yolo_configs/yolo_pipeline_config.yaml`
run_server.bat	Run inference server	`configs/inference.yaml`
visualize_predictions.bat	Visualize predictions	Various configs

Classification Scripts

train_classifier.bat

Purpose: Train an image classification model using PyTorch Lightning.

Location: wildtrain/scripts/train_classifier.bat

Command:

uv run wildtrain train classifier -c configs\classification\classification_train.yaml

Configuration: wildtrain/configs/classification/classification_train.yaml

Key Parameters:

model:
  architecture: "resnet50"  # resnet18, resnet50, efficientnet_b0, etc.
  num_classes: 10
  pretrained: true
  learning_rate: 0.001

data:
  root_data_directory: "D:/data/roi_dataset"
  split: "train"
  batch_size: 32
  num_workers: 4
  image_size: 224

training:
  max_epochs: 100
  accelerator: "gpu"  # gpu, cpu
  devices: 1
  precision: 16  # 16, 32
  gradient_clip_val: 1.0

callbacks:
  early_stopping:
    monitor: "val_loss"
    patience: 10
  model_checkpoint:
    monitor: "val_acc"
    mode: "max"
    save_top_k: 3

mlflow:
  experiment_name: "classification"
  tracking_uri: "http://localhost:5000"

Example Usage:

cd wildtrain

# Edit config
notepad configs\classification\classification_train.yaml

# Train
scripts\train_classifier.bat

Output:

Trained model checkpoints
MLflow run with metrics
Training logs
Best model weights

eval_classifier.bat

Purpose: Evaluate a trained classification model.

Location: wildtrain/scripts/eval_classifier.bat

Command:

uv run wildtrain eval classifier -c configs\classification\classification_eval.yaml

Configuration: wildtrain/configs/classification/classification_eval.yaml

Key Parameters:

model:
  checkpoint_path: "checkpoints/best.ckpt"
  # or load from MLflow
  mlflow_model_name: "wildlife_classifier"
  mlflow_model_version: "latest"

data:
  root_data_directory: "D:/data/roi_dataset"
  split: "test"
  batch_size: 64

evaluation:
  save_predictions: true
  generate_confusion_matrix: true
  class_metrics: true

Example Usage:

cd wildtrain
scripts\eval_classifier.bat

Output:

Evaluation metrics (accuracy, precision, recall, F1)
Confusion matrix
Per-class metrics
Predictions file (if enabled)

Detection Scripts

train_yolo.bat

Purpose: Train YOLO object detection model.

Location: wildtrain/scripts/train_yolo.bat (or similar)

Command:

uv run wildtrain train detector -c configs\detection\yolo_configs\yolo.yaml

Configuration: wildtrain/configs/detection/yolo_configs/yolo.yaml

Key Parameters:

model:
  framework: "yolo"
  size: "n"  # n, s, m, l, x
  pretrained: true

data:
  data_yaml: "D:/data/wildlife/data.yaml"
  # data.yaml contains:
  # - train: path to train images
  # - val: path to val images
  # - nc: number of classes
  # - names: class names

training:
  epochs: 100
  imgsz: 640
  batch: 16
  optimizer: "AdamW"
  lr0: 0.001
  device: 0  # GPU device
  
augmentation:
  hsv_h: 0.015
  hsv_s: 0.7
  hsv_v: 0.4
  degrees: 0.0
  translate: 0.1
  scale: 0.5
  shear: 0.0
  perspective: 0.0
  flipud: 0.0
  fliplr: 0.5
  mosaic: 1.0

mlflow:
  experiment_name: "yolo_detection"

Example Usage:

cd wildtrain
scripts\train_yolo.bat

YOLO Data Format:

dataset/
├── images/
│   ├── train/
│   └── val/
├── labels/
│   ├── train/
│   └── val/
└── data.yaml

data.yaml:

train: ./images/train
val: ./images/val
nc: 3
names: ['elephant', 'giraffe', 'zebra']

eval_detector.bat

Purpose: Evaluate object detection model.

Location: wildtrain/scripts/eval_detector.bat

Command:

uv run wildtrain eval detector -c configs\detection\yolo_configs\yolo_eval.yaml

Example Usage:

cd wildtrain
scripts\eval_detector.bat

Output:

mAP (mean Average Precision)
mAP@50, mAP@75
Per-class AP
Precision-Recall curves
Detection visualizations

Pipeline Scripts

run_classification_pipeline.bat

Purpose: Run complete classification training pipeline.

Location: wildtrain/scripts/run_classification_pipeline.bat

Configuration: wildtrain/configs/classification/classification_pipeline_config.yaml

Pipeline Steps:

Data validation
Model initialization
Training
Evaluation
Model registration
Export for deployment

Example Config:

pipeline:
  name: "wildlife_classification_v1"
  
data_preparation:
  validate_data: true
  augmentation: true

training:
  config_file: "configs/classification/classification_train.yaml"
  
evaluation:
  config_file: "configs/classification/classification_eval.yaml"
  
registration:
  register_to_mlflow: true
  model_name: "wildlife_classifier"
  stage: "Staging"

export:
  export_onnx: true
  export_torchscript: true

run_detection_pipeline.bat

Purpose: Run complete detection training pipeline.

Location: wildtrain/scripts/run_detection_pipeline.bat

Configuration: wildtrain/configs/detection/yolo_configs/yolo_pipeline_config.yaml

Pipeline Includes:

Data preparation
Training
Validation
Hyperparameter tuning (optional)
Model registration
Export

Model Management Scripts

register_model.bat

Purpose: Register trained model to MLflow model registry.

Location: wildtrain/scripts/register_model.bat

Command:

uv run wildtrain register <model_type> <config_file>

Example Configs:

Classifier Registration

# configs/registration/classifier_registration_example.yaml
model_path: "checkpoints/best.ckpt"
model_name: "wildlife_classifier"
model_type: "classifier"

description: "ResNet50 classifier for wildlife ROI"

tags:
  architecture: "resnet50"
  dataset: "wildlife_roi_v1"
  num_classes: "10"
  training_date: "2024-01-15"
  accuracy: "0.95"

aliases:
  - "production"
  - "latest"

Detector Registration

# configs/registration/detector_registration_example.yaml
model_path: "runs/detect/train/weights/best.pt"
model_name: "wildlife_detector"
model_type: "detector"

description: "YOLO11n detector for aerial wildlife"

tags:
  framework: "yolo"
  version: "11n"
  dataset: "wildlife_aerial_v2"
  map50: "0.89"
  training_date: "2024-01-15"

Example Usage:

cd wildtrain
scripts\register_model.bat

Inference Scripts

run_server.bat

Purpose: Run inference server for model deployment.

Location: wildtrain/scripts/run_server.bat

Command:

uv run wildtrain serve -c configs\inference.yaml

Configuration: wildtrain/configs/inference.yaml

Key Parameters:

server:
  host: "0.0.0.0"
  port: 8000
  workers: 2

model:
  mlflow_model_name: "wildlife_detector"
  mlflow_model_alias: "production"
  device: "cuda"

inference:
  batch_size: 8
  confidence_threshold: 0.5
  nms_threshold: 0.45

Example Usage:

cd wildtrain
scripts\run_server.bat

API Access:

Endpoint: http://localhost:8000
Docs: http://localhost:8000/docs

Test the API using curl or any HTTP client.

Utility Scripts

visualize_predictions.bat

Purpose: Visualize model predictions on images.

Location: wildtrain/scripts/visualize_predictions.bat

Configuration: Various visualization configs

Features:

Draw bounding boxes
Show confidence scores
Save annotated images
Generate prediction gallery

Example Usage:

cd wildtrain
scripts\visualize_predictions.bat

Common Workflows

Training Workflow (Classification)

cd wildtrain

# 1. Prepare data (if needed)
scripts\create_dataset.bat

# 2. Train model
scripts\train_classifier.bat

# 3. Evaluate
scripts\eval_classifier.bat

# 4. Register to MLflow
scripts\register_model.bat

Training Workflow (Detection)

cd wildtrain

# 1. Train YOLO
scripts\train_yolo.bat

# 2. Evaluate
scripts\eval_detector.bat

# 3. Visualize predictions
scripts\visualize_predictions.bat

# 4. Register model
scripts\register_model.bat

Hyperparameter Tuning

# Use CLI for HPO
cd wildtrain
uv run wildtrain tune classifier -c configs/classification/classification_sweep.yaml

Model Deployment

# 1. Register model
scripts\register_model.bat

# 2. Start inference server
scripts\run_server.bat

# 3. Test API
curl -X POST "http://localhost:8000/predict" -F "file=@test.jpg"

Configuration Examples

Complete Training Config

# configs/classification/classification_train.yaml
model:
  architecture: "resnet50"
  num_classes: 10
  pretrained: true
  learning_rate: 0.001
  weight_decay: 0.0001
  dropout: 0.5

data:
  root_data_directory: "D:/data/roi_dataset"
  split: "train"
  batch_size: 32
  num_workers: 4
  image_size: 224
  normalize: true
  mean: [0.485, 0.456, 0.406]
  std: [0.229, 0.224, 0.225]

augmentation:
  random_flip: 0.5
  random_rotation: 15
  color_jitter:
    brightness: 0.2
    contrast: 0.2
    saturation: 0.2
  random_crop: true

training:
  max_epochs: 100
  accelerator: "gpu"
  devices: 1
  precision: 16
  accumulate_grad_batches: 1
  gradient_clip_val: 1.0
  log_every_n_steps: 10

optimizer:
  type: "Adam"
  lr: 0.001
  betas: [0.9, 0.999]

scheduler:
  type: "CosineAnnealingLR"
  T_max: 100
  eta_min: 0.00001

callbacks:
  early_stopping:
    monitor: "val_loss"
    patience: 10
    mode: "min"
  model_checkpoint:
    monitor: "val_acc"
    mode: "max"
    save_top_k: 3
    filename: "epoch{epoch:02d}-acc{val_acc:.4f}"

mlflow:
  experiment_name: "wildlife_classification"
  tracking_uri: "http://localhost:5000"
  log_models: true

Troubleshooting

Training Crashes

Issue: Training crashes with CUDA out of memory

Solutions:

Reduce batch size
Use mixed precision (precision: 16)
Reduce image size
Enable gradient accumulation

MLflow Connection Error

Issue: Can't connect to MLflow tracking server

Solutions:

Start MLflow server: mlflow server --port 5000
Check MLFLOW_TRACKING_URI environment variable
Verify network connection
Check firewall settings

Data Loading Slow

Issue: Data loading is bottleneck

Solutions:

Increase num_workers (max 4 on Windows)
Enable pin_memory: true
Use SSD for data storage
Reduce data preprocessing complexity

Model Won't Load

Issue: Can't load trained model

Solutions:

Check checkpoint path is correct
Verify model architecture matches
Check for version compatibility
Try loading with strict=False

Overview​

Quick Reference​

Classification Scripts​

train_classifier.bat​

eval_classifier.bat​

Detection Scripts​

train_yolo.bat​

eval_detector.bat​

Pipeline Scripts​

run_classification_pipeline.bat​

run_detection_pipeline.bat​

Model Management Scripts​

register_model.bat​

Classifier Registration​

Detector Registration​

Inference Scripts​

run_server.bat​

Utility Scripts​

visualize_predictions.bat​

Common Workflows​

Training Workflow (Classification)​

Training Workflow (Detection)​

Hyperparameter Tuning​

Model Deployment​

Configuration Examples​

Complete Training Config​

Troubleshooting​

Training Crashes​

MLflow Connection Error​

Data Loading Slow​

Model Won't Load​

Next Steps​

Overview

Quick Reference

Classification Scripts

train_classifier.bat

eval_classifier.bat

Detection Scripts

train_yolo.bat

eval_detector.bat

Pipeline Scripts

run_classification_pipeline.bat

run_detection_pipeline.bat

Model Management Scripts

register_model.bat

Classifier Registration

Detector Registration

Inference Scripts

run_server.bat

Utility Scripts

visualize_predictions.bat

Common Workflows

Training Workflow (Classification)

Training Workflow (Detection)

Hyperparameter Tuning

Model Deployment

Configuration Examples

Complete Training Config

Troubleshooting

Training Crashes

MLflow Connection Error

Data Loading Slow

Model Won't Load

Next Steps