214 lines
4.9 KiB
Markdown
214 lines
4.9 KiB
Markdown
|
|
# How the `yolo` Command Works
|
|||
|
|
|
|||
|
|
## Overview
|
|||
|
|
|
|||
|
|
本文描述当前仓库里 `yolo ...` CLI 的真实入口流程,重点解释:
|
|||
|
|
|
|||
|
|
- console script 是如何注册的
|
|||
|
|
- `entrypoint()` 如何解析参数
|
|||
|
|
- task / mode / model 如何决定最终执行哪个类和哪个方法
|
|||
|
|
|
|||
|
|
主要代码位置:
|
|||
|
|
|
|||
|
|
- `pyproject.toml`
|
|||
|
|
- `ultralytics/cfg/__init__.py`
|
|||
|
|
- `ultralytics/engine/model.py`
|
|||
|
|
- `ultralytics/models/yolo/model.py`
|
|||
|
|
|
|||
|
|
## 1. Console Script 注册
|
|||
|
|
|
|||
|
|
`pyproject.toml` 里注册了两个命令:
|
|||
|
|
|
|||
|
|
```toml
|
|||
|
|
[project.scripts]
|
|||
|
|
yolo = "ultralytics.cfg:entrypoint"
|
|||
|
|
ultralytics = "ultralytics.cfg:entrypoint"
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
因此终端里的 `yolo ...` 最终会调用:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
ultralytics.cfg.entrypoint()
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 2. `entrypoint()` 收集原始参数
|
|||
|
|
|
|||
|
|
`entrypoint(debug: str = "")` 的第一步是:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
args = (debug.split(" ") if debug else ARGV)[1:]
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
也就是去掉命令名本身,保留后面的参数,例如:
|
|||
|
|
|
|||
|
|
```text
|
|||
|
|
yolo detect train model=yolo26n.pt data=coco8.yaml epochs=100
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
会被看成:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
["detect", "train", "model=yolo26n.pt", "data=coco8.yaml", "epochs=100"]
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
如果用户没有传任何参数,CLI 会直接打印帮助信息并返回。
|
|||
|
|
|
|||
|
|
## 3. 特殊命令优先处理
|
|||
|
|
|
|||
|
|
当前代码里的特殊命令包括:
|
|||
|
|
|
|||
|
|
- `help`
|
|||
|
|
- `checks`
|
|||
|
|
- `version`
|
|||
|
|
- `settings`
|
|||
|
|
- `cfg`
|
|||
|
|
- `hub`
|
|||
|
|
- `login`
|
|||
|
|
- `logout`
|
|||
|
|
- `copy-cfg`
|
|||
|
|
- `solutions`
|
|||
|
|
|
|||
|
|
这些命令在参数循环里一旦命中,就会立刻执行并 `return`,不会再走模型实例化。
|
|||
|
|
|
|||
|
|
## 4. 常规参数解析
|
|||
|
|
|
|||
|
|
`entrypoint()` 逐个处理参数,核心规则是:
|
|||
|
|
|
|||
|
|
1. `merge_equals_args(args)` 先把 `arg = value` 这种带空格写法并回去
|
|||
|
|
2. `--foo` 会被警告后改写成 `foo`
|
|||
|
|
3. 若参数里有 `=`,走 `parse_key_value_pair()`
|
|||
|
|
4. 若参数等于某个 task,写入 `overrides["task"]`
|
|||
|
|
5. 若参数等于某个 mode,写入 `overrides["mode"]`
|
|||
|
|
6. 若参数是布尔型默认配置键,则自动设为 `True`
|
|||
|
|
|
|||
|
|
例如:
|
|||
|
|
|
|||
|
|
```text
|
|||
|
|
yolo detect train model=yolo26n.pt data=coco8.yaml epochs=100
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
会被解析成近似:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
overrides = {
|
|||
|
|
"task": "detect",
|
|||
|
|
"mode": "train",
|
|||
|
|
"model": "yolo26n.pt",
|
|||
|
|
"data": "coco8.yaml",
|
|||
|
|
"epochs": 100,
|
|||
|
|
}
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 5. mode 校验
|
|||
|
|
|
|||
|
|
解析完成后会先确定 `mode`:
|
|||
|
|
|
|||
|
|
- 若没传,则回退到 `DEFAULT_CFG.mode`,否则默认 `predict`
|
|||
|
|
- 若传了非法值,直接报错
|
|||
|
|
|
|||
|
|
当前合法 `mode` 包括:
|
|||
|
|
|
|||
|
|
- `train`
|
|||
|
|
- `val`
|
|||
|
|
- `predict`
|
|||
|
|
- `export`
|
|||
|
|
- `track`
|
|||
|
|
- `benchmark`
|
|||
|
|
|
|||
|
|
## 6. task 校验
|
|||
|
|
|
|||
|
|
然后处理 `task`:
|
|||
|
|
|
|||
|
|
- 若传了 task,就检查是否合法
|
|||
|
|
- 若没传但给了模型,后面会从模型侧再推断
|
|||
|
|
- 若传了 task 但没传 model,会根据 `TASK2MODEL` 自动补默认模型
|
|||
|
|
|
|||
|
|
当前合法 `task` 包括:
|
|||
|
|
|
|||
|
|
- `detect`
|
|||
|
|
- `segment`
|
|||
|
|
- `classify`
|
|||
|
|
- `pose`
|
|||
|
|
- `obb`
|
|||
|
|
|
|||
|
|
## 7. 模型实例化分派
|
|||
|
|
|
|||
|
|
接下来 `entrypoint()` 会取出 `model`,根据文件名 stem 做分派:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
stem = Path(model).stem.lower()
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
当前分支逻辑是:
|
|||
|
|
|
|||
|
|
- stem 含 `rtdetr` → `RTDETR(model)`
|
|||
|
|
- stem 含 `fastsam` → `FastSAM(model)`
|
|||
|
|
- stem 含 `sam_` / `sam2_` / `sam2.1_` → `SAM(model)`
|
|||
|
|
- 否则 → `YOLO(model, task=task)`
|
|||
|
|
|
|||
|
|
所以这里不是简单的“文件名里含 `sam` 就走 SAM”,而是更窄的前缀判断。
|
|||
|
|
|
|||
|
|
## 8. task 与 model 冲突时的处理
|
|||
|
|
|
|||
|
|
模型实例化后,CLI 还会做一次 task 对齐:
|
|||
|
|
|
|||
|
|
- 如果用户显式传的 `task` 和模型自身 `model.task` 冲突
|
|||
|
|
- 则忽略用户传入的 task
|
|||
|
|
- 以模型解析出来的 task 为准
|
|||
|
|
|
|||
|
|
这是为了避免类似“拿分类模型跑 detect task”这种冲突配置继续往后传播。
|
|||
|
|
|
|||
|
|
## 9. mode 相关默认参数补全
|
|||
|
|
|
|||
|
|
在真正执行前,CLI 还会按 mode 补一些默认参数:
|
|||
|
|
|
|||
|
|
- `predict/track` 且没传 `source`:自动补默认图像
|
|||
|
|
- `train/val` 且没传 `data` 且不是 `resume`:自动补默认数据集
|
|||
|
|
- `export` 且没传 `format`:自动补 `torchscript`
|
|||
|
|
|
|||
|
|
## 10. 真正执行
|
|||
|
|
|
|||
|
|
最后一步就是:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
getattr(model, mode)(**overrides)
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
例如 `mode="train"` 时,等价于:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
model.train(**overrides)
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
如果当前是普通 YOLO 检测模型,这会继续进入:
|
|||
|
|
|
|||
|
|
1. `YOLO.train()`
|
|||
|
|
2. 实例化对应 trainer
|
|||
|
|
3. `trainer.train()`
|
|||
|
|
|
|||
|
|
## Example
|
|||
|
|
|
|||
|
|
命令:
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
yolo detect train model=yolo26n.pt data=coco8.yaml epochs=100 lr0=0.01
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
主流程可以概括成:
|
|||
|
|
|
|||
|
|
1. `yolo` 命令调用 `ultralytics.cfg.entrypoint()`
|
|||
|
|
2. 解析得到 `task=detect, mode=train, model=yolo26n.pt, ...`
|
|||
|
|
3. 根据 `model` 实例化 `YOLO("yolo26n.pt", task="detect")`
|
|||
|
|
4. 执行 `model.train(data="coco8.yaml", epochs=100, lr0=0.01, ...)`
|
|||
|
|
5. `YOLO.train()` 再去构建对应 trainer 并开始训练
|
|||
|
|
|
|||
|
|
## 一句话总结
|
|||
|
|
|
|||
|
|
`yolo ...` CLI 的本质是:
|
|||
|
|
|
|||
|
|
- 先在 `entrypoint()` 里把命令行翻译成 `overrides`
|
|||
|
|
- 再根据 `model` 选择合适的 model class
|
|||
|
|
- 最后通过 `getattr(model, mode)(**overrides)` 分发到 `train/val/predict/export/...`
|
|||
|
|
|
|||
|
|
它本身不关心 Ground3D、ROI 或 virtual-camera 这些任务细节;那些差异是在具体 trainer / dataset / loss 里展开的。
|