Files
yolov26_3d/eval_tools/docs/eval_instruction.md
2026-06-24 09:35:46 +08:00

3.8 KiB
Executable File
Raw Permalink Blame History

  • 真值说明

    • 3D真值类别{0: vehicle, 1: pedestrian, 2: bike, 3: rider}

      • 车辆3D目标真值示例

      •   label: 1,
          x: 2, y: 3, w: 4, h: 5,
          x3d_ori: 6, y3d_ori: 7, z3d_ori: 8,
          13d: 9, h3d: 10, w3d: 11,
          rot_y: 12,
          xc_ori: 13, yc_ori: 14,
          xc_ori_d: 15, yc_ori_d: 16,
          alpha_ori: 17,
          0: 18,
          # the first face
          x3d: 19, y3d: 20, z3d: 21, alpha: 22, xc: 23, yc: 24, score: 25, is occ: 26,
          # the second face
          x3d: 27, y3d: 28, z3d: 29, alpha: 30, xc: 31, yc: 32, score: 33, is_occ: 34,
          # the third face
          x3d: 35, y3d: 36, z3d: 37, alpha: 38, xc: 39, yc: 40, score: 41, is_occ: 42,
          # the forth face
          x3d: 43, y3d: 44, z3d: 45, alpha: 46, xc: 47, yc: 48, score: 49, is_occ: 50
        
      • 说明如上面所示车辆目标的3D真值中共50个数值其中第一个数值为label标签格式为数字2-5是2D框信息归一化后的中心点和宽高6-8是中心点坐标9-11是车辆3D尺寸信息12为heading信息19-50是四个面的3D信息包含面的中心点坐标等四个面的顺序为前、后、左、右。

      • 注意有的车辆目标只有2D框信息此时真值为6个数值最后一位为-1具体格式为

        label:1, x: 2, y: 3, w: 4, h: 5, -1: 6
        
      • 非车辆类别3D目标真值示例

      •   label: 1,
          x: 2, y: 3, w: 4, h: 5,
          x3d_ori: 6, y3d_ori: 7, z3d_ori: 8,
          13d: 9, h3d: 10, w3d: 11,
          rot_y: 12,
          xc_ori: 13, yc_ori: 14,
          xc_ori_d: 15, yc_ori_d: 16,
          alpha_ori: 17,
          0: 18,
        
      • 说明如上面所示非车辆类别目标的3D真值中共18个数值其中第一个数值为label标签格式为数字2-5是2D框信息归一化后的中心点和宽高6-8是中心点坐标9-11是3D尺寸信息12为heading信息

      • 注意有的非车辆目标只有2D框信息此时真值为6个数值最后一位为-1具体格式为

        label:1, x: 2, y: 3, w: 4, h: 5, -1: 6
        
    • 纯2D真值类别{4: roadblock, 5: head, 6: tsr, 7: guideboard, 8: plate, 9: wheel, 10: tl_border, 11: tl_wick, 12: tl_num, 13: tricycle}

      真值格式为:

      label:1, x: 2, y: 3, w: 4, h: 5, -1: 6
      
  • 检测结果说明

    • 3D目标类别

      • 车辆目标的检测结果格式为:

      •   vehicle 0.95 368.08 574.17 437.89 617.20 cam -30.14 1.43 68.55 5.52 2.50 2.31 2.70 left
        
      • 说明如上面所示车辆目标的检测结果中共15个数值其中第一个数值为label格式为字符串第二个为置信度3-6为2D框信息左上和右下角点的像素坐标8-10为预测的最近面的中心点坐标11-13为车辆的3D尺寸信息14为heading信息15为预测的最近面类别。

      • 非车辆目标的检测结果格式为:

      •   pedestrian 0.95 368.08 574.17 437.89 617.20 cam -30.14 1.43 68.55 5.52 2.50 2.31 2.70 whole
        
      • 说明如上面所示行人目标的检测结果中共15个数值其中第一个数值为label格式为字符串第二个为置信度3-6为2D框信息左上和右下角点的像素坐标8-10为预测的3d box中心点坐标11-13为3d box的3D尺寸信息14为heading信息15为填充位非车辆类别都为whole

    • 纯2D类别

      输出格式:

      plate 0.94246 532.12 203.26 558.73 214.86

评测内容:

2D: 每个类别的召回率准确率和AP(iou=0.5)以及总的召回率准确率和mAP。

3D: 评测每个3D类别的横向测距指标、纵向测距指标和heading偏差。