Uczenie nadzorowane – czym jest?
Spis treści
Jak „uczy” się sztuczna inteligencja? Poprzez ekspozycję na dane i poszukiwanie zależności między nimi – na tym właśnie, mówiąc najprościej, polega uczenie maszynowe. Uczenie nadzorowane jest jednym z jego trzech głównych nurtów – wyjaśniamy, jakie ma zastosowanie oraz jak przebiega taki proces.
Co to jest uczenie nadzorowane?
Uczenie nadzorowane (z angielskiego supervised learning) to metoda trenowania modeli sztucznej inteligencji, w której algorytm uczy się na podstawie zestawu danych wejściowych – jak w każdym systemie uczenia maszynowego – oraz odpowiadających im etykiet wyjściowych.
Etykiety są po prostu idealnymi, oczekiwanymi przez nadzorcę (czyli człowieka) odpowiedziami. Założenie jest takie, że model wykryje w tych odpowiedziach pewne idealne wzorce i nauczy się odnosić je także i do kolejnych danych, z którymi jeszcze nie miał do czynienia – co pozwoli mu trafniej przewidywać wyniki, jakich oczekujemy.
Proces uczenia nadzorowanego, krok po kroku
Cały proces uczenia nadzorowanego można podzielić na kilka etapów:
- Zbieranie danych i tworzenie etykiet wejściowych przez człowieka – model wymaga odpowiednio przygotowanego zestawu danych, w którym każdemu przykładowi przypisana jest etykieta wyjściowa (wzorzec odpowiedzi).
- Podział danych – dane dzieli się zazwyczaj na zbiór treningowy (do nauki modelu) oraz zbiór testowy (do oceny jego skuteczności).
- Trenowanie modelu – model uczy się na podstawie danych treningowych, dostosowując na bieżąco swoje parametry, aby w kolejnych próbach ograniczać swoje błędy i udzielać odpowiedzi bliższych etykietom wyjściowym.
- Ewaluacja – po treningu przeprowadza się kolejne testy, tym razem na zbiorze testowym. W ich trakcie ocenia się dokładność oraz precyzję odpowiedzi, a także czułość modelu na różnice w danych.
- Optymalizacja modelu – modele nigdy nie są idealne, dlatego etapu optymalizacji pominąć się po prostu nie da. To czas na zmianę parametrów samego modelu, modyfikację jego architektury lub korektę etykiet wyjściowych.
Czym różni się uczenie nadzorowane od innych metod uczenia maszynowego?
Tak jak wspomnieliśmy, uczenie nadzorowane jest tylko jedną z trzech technik uczenia maszynowego.
Przeciwieństwem treningu nadzorowanego jest uczenie nienadzorowane. W tym procesie model nie ma gotowych wzorców odpowiedzi. Wręcz przeciwnie, zostawia się go samemu sobie, aby „na własną rękę” odkrył ukryte zależności i schematy w danych wejściowych.
Mamy też tzw. uczenie przez wzmacnianie, podczas którego model nie dostaje bezpośrednio danych. Zamiast tego, jest osadzany w odpowiednio przygotowanym środowisku, z którego sam musi te dane zebrać. Gdy to zrobi – musi je wykorzystać, aby osiągnąć konkretny cel (nagrodę). Tak działają np. programy uczące się grać w gry (gdzie środowiskiem jest sama gra i jej reguły) albo algorytmy sterujące… łazikami kosmicznymi (wtedy środowiskiem jest świat fizyczny).
Uczenie nadzorowane i jego zastosowanie
W praktyce większość algorytmów, które znajdują zastosowanie biznesowe, jest przynajmniej w jakimś stopniu trenowana pod nadzorem człowieka. Taki proces jest bardziej wymagający (oprócz danych wejściowych trzeba zebrać i przygotować wzorowe odpowiedzi), ale jeśli opiera się na dobrym zbiorze danych – daje duże szanse, że model faktycznie będzie udzielał odpowiedzi na poziomie zbliżonym do ludzkiego.
Do czego więc wykorzystuje się takie algorytmy?
- Wykrywanie obiektów na obrazach – świetnym przykładem jest chociażby Google Lens, ale i wszelkie systemy rozpoznawania twarzy w aparatach cyfrowych.
- Ocena ryzyka kredytowego i inwestycyjnego, wykrywanie oszustw finansowych – większość instytucji finansowych korzysta z programów trenowanych na własnych danych, ocenionych już wcześniej przez ludzkich specjalistów.
- Diagnostyka chorób – to właśnie dzięki uczeniu nadzorowanemu algorytmy świetnie radzą sobie dziś z analizą zdjęć rentgenowskich, tomografii czy rezonansu i wykrywaniem w nich anomalii.
- Rozwój autonomicznych pojazdów – również dzięki supervised learning pojazdy są w stanie coraz lepiej rozpoznawać znaki drogowe, pieszych i inne pojazdy na drodze.
Oczywiście, uczenie nadzorowane może znaleźć zastosowanie także i w SEO. Trenowane w ten sposób algorytmy mogą np. klasyfikować zapytania użytkowników pod kątem intencji wyszukiwania, pomagać w ocenie treści i wykrywaniu thin content czy samodzielnie optymalizować meta tagi na podstawie przykładów z najlepiej pozycjonujących się w Google stron.