Результаты работы алгоритма на eval части датасета лежат в папке /results
Для удобства изображения штампов названы точно так же, как и оригинальные изображения, но с добавлением "..._stamp.jpg"
Изображения eval находятся в datasets/detection_yolo/images/val
- Преобразую координаты в формат YOLO в модуле coco_to_yolo.py
- Обучаю модель YOLO детектировать все штампы на фото в модуле yolo_detection_fit.py
- В ручную отбираю фотографий в разных ориентациях и делю на 4 класса: перевёрнутые, повёрнутые влево, повёрнутые в право и правильно стоящие.
- Разбиваю данные на train и val в соотношении 70/30.
- Обучаю модель YOLO классифицировать в каком положении находится фото.
- Пишу алгоритм, который сначала смотрит ориентацию фото, затем переворачивает его при необходимости, далее детектирует штампы, вычисляет последний стоящий штамп и сохраняет изображение в папку /results в модуле model_results.py
Время обработки папки eval, в которой находилось 660 фото, составило 64.8 секунды на GPU моего ПК.
CPU: ryzen 7 5700X3D 8c/16t
GPU: RX 6800 XT 16GB
RAM: 32GB ddr4 3200 mhz
OS: Manjaro GNOME 45.4 (wayland)