types machine learning
Ten samouczek wyjaśnia typy uczenia maszynowego, tj. Uczenie nadzorowane, nienadzorowane, wzmacniające i częściowo nadzorowane z prostymi przykładami. Dowiesz się również różnic między uczeniem nadzorowanym a uczeniem nienadzorowanym:
w Poprzedni samouczek , dowiedzieliśmy się o uczeniu maszynowym, jego działaniu i aplikacjach. Widzieliśmy również porównanie uczenia maszynowego i sztucznej inteligencji.
Uczenie maszynowe to dziedzina nauki, która zajmuje się uczeniem się programów komputerowych poprzez doświadczenie i przewidywanie wyników.
Główną cechą ML jest uczenie się na podstawie doświadczenia. Uczenie się ma miejsce, gdy system zasilany danymi wejściowymi treningu wprowadza zmiany w swoich parametrach i dostosowuje się, aby uzyskać pożądany wynik. Dane wyjściowe to wartość docelowa zdefiniowana w danych uczących.
=> Przeczytaj całą serię szkoleń z zakresu uczenia maszynowego
jak dodawać elementy do tablicy
Czego się nauczysz:
- Rodzaje uczenia maszynowego
- Przykład uczenia się nadzorowanego i nienadzorowanego z życia wzięty
- Różnica między uczeniem nadzorowanym a uczeniem nienadzorowanym
- Nauka częściowo nadzorowana
- Wniosek
Rodzaje uczenia maszynowego
Programy uczenia maszynowego są podzielone na 3 typy, jak pokazano poniżej.
- Nadzorowane
- Bez nadzoru
- Uczenie się ze wzmocnieniem
Pozwól nam zrozumieć każdy z nich szczegółowo !!
1) Uczenie nadzorowane
Uczenie się nadzorowane odbywa się w obecności opiekuna, tak jak nauka przeprowadzana przez małe dziecko z pomocą nauczyciela. Ponieważ dziecko uczy się rozpoznawania owoców, kolorów, liczb pod okiem nauczyciela, ta metoda jest uczeniem nadzorowanym.
W tej metodzie każdy krok dziecka jest sprawdzany przez nauczyciela, a dziecko uczy się na podstawie wyników, które musi wytworzyć.
Jak działa uczenie nadzorowane?
W nadzorowanym algorytmie ML wyjście jest już znane. Istnieje mapowanie wejścia z wyjściem. Stąd, aby stworzyć model, maszyna jest zasilana dużą ilością danych wejściowych uczących (posiadających znane dane wejściowe i odpowiadające im dane wyjściowe).
Dane szkoleniowe pomagają w osiągnięciu poziomu dokładności dla utworzonego modelu danych. Zbudowany model jest teraz gotowy do wprowadzenia nowych danych wejściowych i przewidywania wyników.
Co to jest oznaczony zbiór danych?
Zestaw danych z danymi wyjściowymi znanymi dla danego wejścia nazywany jest zestawem danych z etykietą. Na przykład, znany jest obraz owocu wraz z nazwą owocu. Zatem kiedy wyświetlany jest nowy obraz owocu, porównuje się go z zestawem treningowym, aby przewidzieć odpowiedź.
Uczenie nadzorowane to mechanizm szybkiego uczenia się o dużej dokładności. Nadzorowane problemy uczenia się obejmują problemy regresji i klasyfikacji.
Oto niektóre z algorytmów uczenia nadzorowanego:
- Drzewa decyzyjne,
- K-najbliższy sąsiad,
- Regresja liniowa,
- Wsparcie Vector Machine i
- Sieci neuronowe.
Przykład nadzorowanego uczenia się
- W pierwszym kroku zestaw danych szkoleniowych jest przekazywany do algorytmu uczenia maszynowego.
- Dzięki zestawowi danych szkoleniowych maszyna dostosowuje się sama, wprowadzając zmiany w parametrach w celu zbudowania modelu logicznego.
- Zbudowany model jest następnie używany dla nowego zestawu danych do przewidywania wyniku.
Rodzaje nadzorowanych algorytmów uczenia się
- Klasyfikacja: W tego typu problemach przewidujemy odpowiedź jako określone klasy, takie jak „tak” lub „nie”. Gdy obecne są tylko 2 klasy, nazywa się to klasyfikacją binarną. W przypadku więcej niż 2 wartości klas nazywa się to klasyfikacją wieloklasową. Przewidywane wartości odpowiedzi są wartościami dyskretnymi. Na przykład, Czy jest to obraz słońca czy księżyca? Algorytm klasyfikacji dzieli dane na klasy.
- Regresja: Problemy z regresją przewidują odpowiedź jako wartości ciągłe, takie jak przewidywanie wartości w zakresie od -infinity do nieskończoności. Może mieć wiele wartości. Na przykład, zastosowany algorytm regresji liniowej przewiduje koszt domu na podstawie wielu parametrów, takich jak lokalizacja, pobliskie lotnisko, wielkość domu itp.
# 2) Uczenie się bez nadzoru
Uczenie się bez nadzoru odbywa się bez pomocy opiekuna, tak jak ryba uczy się pływać samodzielnie. Jest to niezależny proces uczenia się.
W tym modelu, ponieważ nie ma danych wyjściowych odwzorowanych na wejściu, wartości docelowe są nieznane / nieoznaczone. System musi uczyć się sam na podstawie wprowadzonych danych i wykrywać ukryte wzorce.
Co to jest zbiór danych bez etykiety?
Zbiór danych z nieznanymi wartościami wyjściowymi dla wszystkich wartości wejściowych nazywany jest zestawem danych bez etykiety.
Jak działa nauka bez nadzoru?
Ponieważ nie są znane żadne wartości wyjściowe, których można by użyć do zbudowania modelu logicznego między danymi wejściowymi i wyjściowymi, niektóre techniki są używane do wydobywania reguł danych, wzorców i grup danych o podobnych typach. Grupy te pomagają użytkownikom końcowym lepiej zrozumieć dane, a także znaleźć sensowne wyniki.
Wprowadzone dane wejściowe nie mają odpowiedniej struktury, tak jak dane treningowe (w uczeniu nadzorowanym). Może zawierać wartości odstające, zaszumione dane itp. Te dane wejściowe są razem podawane do systemu. Podczas szkolenia modelu dane wejściowe są organizowane w klastry.
Algorytmy uczenia się bez nadzoru obejmują algorytmy klastrowania i asocjacji, takie jak:
- Apriori,
- Klastry K-średnich i inne algorytmy eksploracji reguł asocjacyjnych.
Kiedy nowe dane są wprowadzane do modelu, przewiduje on wynik jako etykietę klasy, do której należy wejście. Jeśli nie ma etykiety klasy, zostanie wygenerowana nowa klasa.
Poddając się procesowi odkrywania wzorców w danych, model sam dostosowuje swoje parametry, stąd też nazywany jest samoorganizacją. Klastry zostaną utworzone poprzez znalezienie podobieństw między danymi wejściowymi.
Na przykład, podczas kupowania produktów online, jeśli masło jest wkładane do koszyka, sugeruje zakup chleba, sera itp. Model bez nadzoru analizuje punkty danych i przewiduje inne atrybuty związane z produktem.
Przykład uczenia się bez nadzoru
Rodzaje algorytmów nienadzorowanych
- Algorytm grupowania : Metodą znajdowania podobieństw między elementami danych, takimi jak ten sam kształt, rozmiar, kolor, cena itp., I grupowania ich w celu utworzenia klastra jest analiza skupień.
- Wykrywanie wartości odstających : W tej metodzie zbiór danych jest wyszukiwaniem wszelkiego rodzaju niezgodności i anomalii w danych. Na przykład, transakcja o dużej wartości na karcie kredytowej jest wykrywana przez system wykrywania oszustw.
- Association Rule Mining : W tego typu eksploracji wyszukuje najczęściej występujące zestawy elementów lub skojarzenia między elementami. Skojarzenia, takie jak „produkty często kupowane razem” itp.
- Autoenkodery: Dane wejściowe są kompresowane do postaci zakodowanej i odtwarzane w celu usunięcia zaszumionych danych. Ta technika służy do poprawy jakości obrazu i wideo.
# 3) Uczenie się ze wzmocnieniem
W tego typu uczeniu algorytm uczy się poprzez mechanizm sprzężenia zwrotnego i doświadczenia z przeszłości. Zawsze pożądane jest, aby każdy krok w algorytmie był podejmowany w celu osiągnięcia celu.
Tak więc za każdym razem, gdy ma zostać podjęty następny krok, otrzymuje informacje zwrotne z poprzedniego kroku, wraz z nauką z doświadczenia, aby przewidzieć, co może być następnym najlepszym krokiem. Ten proces jest również nazywany procesem prób i błędów prowadzącym do celu.
Uczenie się ze wzmocnieniem to długotrwały proces iteracyjny. Im więcej informacji zwrotnych, tym dokładniejszy staje się system. Podstawowe uczenie się przez wzmacnianie jest również nazywane procesem decyzyjnym Markowa.
Przykład uczenia się ze wzmocnieniem
Przykładem uczenia się ze wzmocnieniem są gry wideo, w których gracze przechodzą określone poziomy gry i zdobywają punkty nagrody. Gra dostarcza graczowi informacji zwrotnych poprzez dodatkowe ruchy, aby poprawić jego / jej wydajność.
Uczenie się ze wzmocnieniem jest wykorzystywane w szkoleniu robotów, samobieżnych samochodów, automatycznym zarządzaniu zapasami itp.
Niektóre popularne algorytmy uczenia się ze wzmocnieniem obejmują:
- Q-Learning,
- Głębokie sieci przeciwnika
- Różnica czasowa
Poniższy rysunek przedstawia mechanizm sprzężenia zwrotnego uczenia się ze wzmocnieniem.
- Wejście jest obserwowane przez agenta, który jest elementem AI.
- Ten agent AI działa na środowisko zgodnie z podjętą decyzją.
- Odpowiedź środowiska jest wysyłana do AI w postaci nagrody z powrotem jako informacja zwrotna.
- Zapisywany jest również stan i działania wykonane na środowisku.
(wizerunek źródło )
Przykład uczenia się nadzorowanego i nienadzorowanego z życia wzięty
W przypadku uczenia nadzorowanego:
# 1) Weźmy na przykład koszyk warzyw z cebulą, marchewką, rzodkiewką, pomidorem itp. I możemy je ułożyć w grupy.
#dwa) Tworzymy tabelę danych treningowych, aby zrozumieć uczenie nadzorowane.
Tabela danych treningowych charakteryzuje warzywa na podstawie:
- Kształt
- Kolor
- Rozmiar
Kształt | Kolor | Rozmiar | Warzywo |
---|---|---|---|
Jest dokładniejsze niż uczenie się bez nadzoru, ponieważ dane wejściowe i odpowiadające im dane wyjściowe są dobrze znane, a maszyna musi tylko przekazywać prognozy. | Ma mniejszą dokładność, ponieważ dane wejściowe nie mają etykiety. Dlatego maszyna musi najpierw zrozumieć i oznaczyć dane, a następnie podać przewidywania. | ||
Okrągły | brązowy | Duży | Cebula |
Okrągły | Netto | Średni | Pomidor |
Cylindryczny | Biały | Duży | Rzodkiewka |
Cylindryczny | Netto | Średni | Marchewka |
Gdy ta tabela danych szkoleniowych zostanie przesłana do maszyny, zbuduje ona logiczny model na podstawie kształtu, koloru, rozmiaru warzywa itp., Aby przewidzieć wynik (warzywo).
Gdy nowe dane wejściowe zostaną wprowadzone do tego modelu, algorytm przeanalizuje parametry i wyświetli nazwę owocu.
W przypadku uczenia się bez nadzoru:
W uczeniu się bez nadzoru tworzy grupy lub klastry na podstawie atrybutów. W powyższym przykładowym zbiorze danych parametr warzyw to:
# 1) Kształt
Warzywa są pogrupowane według kształtu.
- Okrągły: Cebula i Pomidor.
- Cylindryczny: Rzodkiewka i Marchewka.
Weź inny parametr, taki jak rozmiar.
# 2) Rozmiar
Warzywa są pogrupowane według wielkości i kształtu:
- Średni rozmiar i okrągły kształt: Pomidor
- Duży rozmiar i okrągły kształt: Cebula
W uczeniu nienadzorowanym nie mamy żadnego zbioru danych szkoleniowych ani zmiennej wyniku, podczas gdy w uczeniu nadzorowanym dane szkoleniowe są znane i służą do trenowania algorytmu.
Różnica między uczeniem nadzorowanym a uczeniem nienadzorowanym
Nadzorowane | Bez nadzoru |
---|---|
W algorytmach uczenia nadzorowanego wyjście dla danego wejścia jest znane. | W nienadzorowanych algorytmach uczenia się dane wyjściowe dla danego wejścia są nieznane. |
Algorytmy uczą się na podstawie oznaczonego zbioru danych. Te dane pomagają w ocenie dokładności danych szkoleniowych. | Algorytm otrzymuje nieoznakowane dane, w których próbuje znaleźć wzorce i powiązania między elementami danych. |
Jest to technika modelowania predykcyjnego, która dokładnie przewiduje przyszłe wyniki. | Jest to technika modelowania opisowego, która wyjaśnia prawdziwy związek między elementami a historią elementów. |
Obejmuje algorytmy klasyfikacji i regresji. | Obejmuje algorytmy uczenia się reguł klastrowania i asocjacji. |
Niektóre algorytmy uczenia nadzorowanego to regresja liniowa, naiwne bayesy i sieci neuronowe. | Niektóre algorytmy uczenia nienadzorowanego to k- oznacza grupowanie środków, Apriori itp. |
Ten rodzaj uczenia się jest stosunkowo złożony, ponieważ wymaga oznaczonych danych. | Jest to mniej złożone, ponieważ nie ma potrzeby rozumienia i oznaczania danych. |
Jest to proces analizy danych online i nie wymaga interakcji międzyludzkiej. | To jest analiza danych w czasie rzeczywistym. |
Nauka częściowo nadzorowana
Podejście do uczenia się częściowo nadzorowanego obejmuje wprowadzanie danych treningowych zarówno oznaczonych, jak i nieoznaczonych. Ten rodzaj uczenia się jest przydatny, gdy trudno jest wyodrębnić przydatne cechy z danych nieoznaczonych (podejście nadzorowane), a eksperci od danych mają trudności z oznaczeniem danych wejściowych (podejście bez nadzoru).
Tylko niewielka ilość oznaczonych danych w tych algorytmach może prowadzić do dokładności modelu.
Przykłady częściowo nadzorowanego uczenia się obejmuje tomografię komputerową i rezonans magnetyczny, w przypadku których ekspert medyczny może oznaczyć kilka punktów skanów pod kątem dowolnej choroby, podczas gdy trudno jest opisać wszystkie skany.
Wniosek
Zadania uczenia maszynowego są ogólnie podzielone na zadania nadzorowane, nienadzorowane, częściowo nadzorowane i uczenie ze wzmocnieniem.
Uczenie nadzorowane to uczenie się z pomocą oznaczonych danych. Algorytmy ML są zasilane zestawem danych szkoleniowych, w którym znane są dane wyjściowe dla wszystkich danych wejściowych, aby przewidzieć przyszłe wyniki.
Ten model jest bardzo dokładny i szybki, ale jego budowa wymaga dużej wiedzy i czasu. Ponadto modele te wymagają przebudowania, jeśli dane ulegną zmianie. Zadania ML, takie jak regresja i klasyfikacja, są wykonywane w nadzorowanym środowisku uczenia się.
jak otworzyć plik bittorrent
Uczenie się bez nadzoru odbywa się bez pomocy opiekuna. Dane wejściowe podawane do algorytmów ML są nieoznaczone, tj. Dla każdego wejścia nie są znane żadne dane wyjściowe. Algorytm sam znajduje trendy i wzorce w danych wejściowych i tworzy powiązania między różnymi atrybutami danych wejściowych.
Ten rodzaj uczenia się jest przydatny do znajdowania wzorców w danych, tworzenia grup danych i analiz w czasie rzeczywistym. Zadania takie jak klastrowanie, algorytmy KNN itp. Podlegają uczeniu się bez nadzoru.
Częściowo nadzorowane zadania edukacyjne mają przewagę zarówno nadzorowanych, jak i nienadzorowanych algorytmów, przewidując wyniki przy użyciu zarówno danych oznaczonych, jak i nieoznaczonych. Uczenie się ze wzmocnieniem to rodzaj mechanizmu sprzężenia zwrotnego, w którym maszyna uczy się na podstawie ciągłych informacji zwrotnych z otoczenia, aby osiągnąć swój cel.
W tego typu uczeniu się agenci AI wykonują pewne czynności na danych, a środowisko daje nagrodę. Uczenie się ze wzmocnieniem jest wykorzystywane w grach wieloosobowych dla dzieci, samochodach samojezdnych itp.
Śledź nasz nadchodzący samouczek, aby dowiedzieć się więcej o uczeniu maszynowym i sztucznej sieci neuronowej!
=> Odwiedź tutaj, aby zapoznać się z ekskluzywną serią uczenia maszynowego
rekomendowane lektury
- Wydobywanie danych kontra uczenie maszynowe, sztuczna inteligencja kontra uczenie głębokie
- 11 najpopularniejszych narzędzi oprogramowania do uczenia maszynowego w 2021 r
- Samouczek uczenia maszynowego: wprowadzenie do ML i jej aplikacji
- Typy danych w Pythonie
- Typy danych C ++
- Rodzaje zagrożeń w projektach oprogramowania
- Typy testów migracji: ze scenariuszami testów dla każdego typu
- 15 najlepszych systemów zarządzania nauczaniem (LMS of the Year 2021)