Korekcja algorytmów detekcji obiektów dla wizji komputerowej
[ 1 ] Wydział Techniczny, Akademia im. Jakuba z Paradyża | [ P ] employee
2021
chapter in monograph
polish
- uczenie maszynowe, głębokie uczenie, sztuczna inteligencja, detekcja obiektów, korekcja, uczenie nadzorowane
PL Terminem „wizji komputerowej” określamy system służący odtworzeniu funkcjonalności ludzkiego oka za pomocą zautomatyzowanego przetwarzania obrazu z kamery bądź też systemu współpracujących ze sobą kamer cyfrowych. Tak więc jest to zagadnienie dwojakie, dotyczące zarówno fizyki działania samego sprzętu, jak i procesu dalszego przetwarzania danych. System wizyjny składa się z kamery (hardware), która rejestruje cyfrowy obraz oraz z algorytmu, przetwarzającego obraz zgodnie z dedykowanym przeznaczeniem. Pierwszy element systemu wizyjnego stanowi kamera cyfrowa – urządzenie wyposażone w optykę tworzącą obraz wybranego przedmiotu na matrycy CCD bądź CMOS. Przy czym matryce CCD najszersze zastosowanie znalazł w astronomii, natomiast matryce CMOS stosowane są w powszechnie dostępnych urządzeniach komercyjnych, w tym mobilnych. Drugim elementem, na którym zamierzamy się skupić w poniższym artykule, są algorytmy wizji komputerowej, które przetwarzają mapę bitową w odpowiedni sposób celem pozyskania pożądanych informacji. Algorytmy te możemy podzielić na algorytmy klasyczne, korzystające z dobrze zdefiniowanych metod matematycznych – takich jak na przykład algorytm kompresji oparty o falki Haara, detekcja krawędzi Canny czy też detekcja linii Hougha, jak również o algorytmy uczenia maszynowego i głębokiego uczenia określane zbiorczym mianem „sztucznej inteligencji”, które wyróżnia to, że nie są oparte na uprzednio zdefiniowanej formule, tylko ich działanie zależy od wytrenowania na pochodzącym z zewnątrz oznaczonym zbiorze danych zwanym datasetem. Zaletą tego podejścia jest, że algorytmy uczenia maszynowego i głębokiego uczenia znajdują zastosowanie w bardzo szerokim wachlarzu przypadków, przy czym jednym z lepszych przykładów są algorytmy detekcji obiektów. Skuteczność tych algorytmów nigdy nie jest jednak stuprocentowa i mogą wymagać one różnego rodzaju korekcji. Niniejszy artykuł jest poświęcony teoretycznej stronie tego zagadnienia.
2022
127 - 132
CC BY-NC (attribution - noncommercial)
other
final published version
03.2022
at the time of publication
20