python -m torch.distributed.run --nproc_per_node 8 train_mono2d.py --model yolo26s.pt --epochs 100 --batch 128 --imgsz 768 --pretrained