Files
yolov26_3d/eval_tools/docs/eval_instruction.md
2026-06-24 09:35:46 +08:00

94 lines
3.8 KiB
Markdown
Executable File
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
- 真值说明
- 3D真值类别{0: vehicle, 1: pedestrian, 2: bike, 3: rider}
- 车辆3D目标真值示例
- ```
label: 1,
x: 2, y: 3, w: 4, h: 5,
x3d_ori: 6, y3d_ori: 7, z3d_ori: 8,
13d: 9, h3d: 10, w3d: 11,
rot_y: 12,
xc_ori: 13, yc_ori: 14,
xc_ori_d: 15, yc_ori_d: 16,
alpha_ori: 17,
0: 18,
# the first face
x3d: 19, y3d: 20, z3d: 21, alpha: 22, xc: 23, yc: 24, score: 25, is occ: 26,
# the second face
x3d: 27, y3d: 28, z3d: 29, alpha: 30, xc: 31, yc: 32, score: 33, is_occ: 34,
# the third face
x3d: 35, y3d: 36, z3d: 37, alpha: 38, xc: 39, yc: 40, score: 41, is_occ: 42,
# the forth face
x3d: 43, y3d: 44, z3d: 45, alpha: 46, xc: 47, yc: 48, score: 49, is_occ: 50
```
- 说明如上面所示车辆目标的3D真值中共50个数值其中第一个数值为label标签格式为数字2-5是2D框信息归一化后的中心点和宽高6-8是中心点坐标9-11是车辆3D尺寸信息12为heading信息19-50是四个面的3D信息包含面的中心点坐标等四个面的顺序为前、后、左、右。
- 注意有的车辆目标只有2D框信息此时真值为6个数值最后一位为-1具体格式为
```
label:1, x: 2, y: 3, w: 4, h: 5, -1: 6
```
- 非车辆类别3D目标真值示例
- ```
label: 1,
x: 2, y: 3, w: 4, h: 5,
x3d_ori: 6, y3d_ori: 7, z3d_ori: 8,
13d: 9, h3d: 10, w3d: 11,
rot_y: 12,
xc_ori: 13, yc_ori: 14,
xc_ori_d: 15, yc_ori_d: 16,
alpha_ori: 17,
0: 18,
```
- 说明如上面所示非车辆类别目标的3D真值中共18个数值其中第一个数值为label标签格式为数字2-5是2D框信息归一化后的中心点和宽高6-8是中心点坐标9-11是3D尺寸信息12为heading信息
- 注意有的非车辆目标只有2D框信息此时真值为6个数值最后一位为-1具体格式为
```
label:1, x: 2, y: 3, w: 4, h: 5, -1: 6
```
- 纯2D真值类别{4: roadblock, 5: head, 6: tsr, 7: guideboard, 8: plate, 9: wheel, 10: tl_border, 11: tl_wick, 12: tl_num, 13: tricycle}
真值格式为:
```
label:1, x: 2, y: 3, w: 4, h: 5, -1: 6
```
- 检测结果说明
- 3D目标类别
- 车辆目标的检测结果格式为:
- ```
vehicle 0.95 368.08 574.17 437.89 617.20 cam -30.14 1.43 68.55 5.52 2.50 2.31 2.70 left
```
- 说明如上面所示车辆目标的检测结果中共15个数值其中第一个数值为label格式为字符串第二个为置信度3-6为2D框信息左上和右下角点的像素坐标8-10为预测的最近面的中心点坐标11-13为车辆的3D尺寸信息14为heading信息15为预测的最近面类别。
- 非车辆目标的检测结果格式为:
- ```
pedestrian 0.95 368.08 574.17 437.89 617.20 cam -30.14 1.43 68.55 5.52 2.50 2.31 2.70 whole
```
- 说明如上面所示行人目标的检测结果中共15个数值其中第一个数值为label格式为字符串第二个为置信度3-6为2D框信息左上和右下角点的像素坐标8-10为预测的3d box中心点坐标11-13为3d box的3D尺寸信息14为heading信息15为填充位非车辆类别都为whole
- 纯2D类别
输出格式:
plate 0.94246 532.12 203.26 558.73 214.86
评测内容:
2D: 每个类别的召回率准确率和AP(iou=0.5)以及总的召回率准确率和mAP。
3D: 评测每个3D类别的横向测距指标、纵向测距指标和heading偏差。