CS 공부/AI
[Object Detection] Overview
imsmile2000
2023. 5. 2. 14:35
Object Detection 평가 방법
성능
- mAP (mean average precision): 각 클래스당 AP의 평균
- Confusion matrix: TP, FN, FP, TN에 대한 matrix
- Precision & Recall
- Precision = TP / (TP+FP) = 모든 Detection 중에 맞은 것의 비율
- Recall = TP / (TP+FN) = 모든 Ground Truth(정답) 중에 맞은 것의 비율
- PR curve: Precision & Recall curve, 누적 TP와 FP를 통해 Precision과 Recall 예측
- x축은 Recall, y축은 Precision
- AP: PR curve의 아래 면적이 AP
- IOU: TP와 FP 판단 방법, Ground truth와 모델의 예측 box의 교집합 / 합집합
- IOU 40이 기준이면 IOU 60 =True, IOU 30 = False
- mAP50: IOU 50이 기준
- mAP70: IOU 70이 기준
속도
- FPS (Frames Per Second): FPS가 클수록 빠름
- FLOPs(Floating Point Operations): 모델이 얼마나 빠르게 동작하는지 측정하는 metric
- 연산량 횟수(곱셈, 덧셈, 뺄셈)
- 채널별 계산: Cin * Cout
- Kernel 계산: K*K
- 높이 너비 별 계산: Hout * Wout
- Convolution layer Flops= 채널별 계산 * 커널 계산 * 높이 너비 별 계산
- FLOPs가 작을수록 빠름
- 연산량 횟수(곱셈, 덧셈, 뺄셈)
Library
- MMDetection: pytorch 기반 object detection 오픈소스
- Detectron2: 페이스북 AI 리서치 라이브러리, object detection과 segmentation 알고리즘 제공
- YOLOv5: coco 데이터셋으로 사전 학습된 모델, colab, kaggle, Docker, AWS 등에서 오픈소스 제공
- EfficientDet: EfficientNet을 응용해 만든 object detection 모델, tensorflow로 제공되는 efficientDet 사용 가능
Object Detection Domain 특성
- 통합 라이브러리 부재
- 복잡한 파이프라인
- 높은 성능을 내기 위해서 무거운 모델 사용
- 해상도가 성능에 영향을 많이 끼쳐 사진의 크기가 큼