complete guide artificial neural network machine learning
W tym samouczku wyjaśniono, czym jest sztuczna sieć neuronowa, jak działa sieć SSN, strukturę i typy sieci SSN i architektury sieci neuronowej:
program do kopiowania DVD na komputer
W tym Szkolenie z uczenia maszynowego dla wszystkich , wszystko zbadaliśmy Rodzaje uczenia maszynowego w naszym poprzednim samouczku.
Tutaj, w tym samouczku, omówimy różne algorytmy w sieciach neuronowych, wraz z porównaniem uczenia maszynowego i SSN. Zanim dowiemy się, w jaki sposób ANN przyczynia się do uczenia maszynowego, musimy wiedzieć, czym jest sztuczna sieć neuronowa i krótką wiedzę na temat uczenia maszynowego.
Zbadajmy więcej na temat uczenia maszynowego i sztucznych sieci neuronowych !!
=> Przeczytaj całą serię szkoleń z zakresu uczenia maszynowego
Czego się nauczysz:
- Co to jest uczenie maszynowe?
- Co to jest sztuczna sieć neuronowa?
- Struktura biologicznej sieci neuronowej
- Porównanie neuronu biologicznego i sztucznego neuronu
- Charakterystyka SSN
- Struktura SSN
- Funkcja aktywacji
- Co to jest sztuczny neuron?
- Jak działa sztuczny neuron?
- Podstawowe modele ANN
- Architektura sieci neuronowych
- Przykład sztucznej sieci neuronowej
- Porównanie między uczeniem maszynowym a SSN
- Sieci neuronowe i głębokie uczenie się
- Zastosowania sztucznych sieci neuronowych
- Ograniczenia sieci neuronowych
- Wniosek
- rekomendowane lektury
Co to jest uczenie maszynowe?
Uczenie maszynowe to dziedzina nauki, która umożliwia komputerom uczenie się i działanie bez konieczności jawnego programowania. Jest to poddziedzina sztucznej inteligencji.
Co to jest sztuczna sieć neuronowa?
SSN to model nieliniowy, który jest szeroko stosowany w uczeniu maszynowym i ma obiecującą przyszłość w dziedzinie sztucznej inteligencji.
Sztuczna sieć neuronowa jest analogiczna do biologicznej sieci neuronowej. Biologiczna sieć neuronowa to struktura miliardów połączonych ze sobą neuronów w ludzkim mózgu. Ludzki mózg składa się z neuronów, które wysyłają informacje do różnych części ciała w odpowiedzi na wykonane działanie.
Podobnie do tego, sztuczna sieć neuronowa (SSN) jest w nauce siecią obliczeniową, która przypomina cechy ludzkiego mózgu. SSN może modelować jako oryginalne neurony ludzkiego mózgu, dlatego części przetwarzające ANN nazywane są sztucznymi neuronami.
SNN składa się z dużej liczby połączonych ze sobą neuronów, które są inspirowane pracą mózgu. Te neurony mają zdolność uczenia się, uogólniania danych szkoleniowych i uzyskiwania wyników ze skomplikowanych danych.
Sieci te są wykorzystywane w obszarach klasyfikacji i przewidywania, identyfikacji wzorców i trendów, problemów optymalizacji itp. SSN uczy się na podstawie danych szkoleniowych (znane dane wejściowe i docelowe) bez żadnego programowania.
Wyuczona sieć neuronowa nosi nazwę system ekspercki z możliwością analizy informacji i odpowiedzi na pytania z określonej dziedziny.
Formalna definicja SSN podana przez dr Roberta Hecht-Nielsona, wynalazcę pierwszego neuro-komputera, to:
„… System komputerowy składający się z szeregu prostych, silnie połączonych ze sobą elementów przetwarzających, które przetwarzają informacje poprzez ich dynamiczną odpowiedź stanu na zewnętrzne wejścia”.
Struktura biologicznej sieci neuronowej
Biologiczna sieć neuronowa składa się z:
- Soma: Nazywa się to również ciałem komórki. To tam znajduje się jądro komórkowe.
- Dendryty: Są to sieci przypominające drzewa, które są połączone z ciałem komórki. Wykonany jest z włókna nerwowego.
- Akson: Axon przenosi sygnał z ciała komórki. Dzieli się na pasma, a każdy z nich kończy się strukturą przypominającą cebulkę zwaną synapsą. Sygnały elektryczne są przekazywane między synapsą a dendrytami.
(wizerunek źródło )
Porównanie neuronu biologicznego i sztucznego neuronu
Biological Neuron | Sztuczny neuron |
---|---|
ML jest stosowany w eCommerce, opiece zdrowotnej, rekomendacjach produktów itp. | SSN jest stosowana w dziedzinie finansów, uczenia maszynowego i sztucznej inteligencji. |
Jest zbudowany z komórek. | Komórki odpowiadają neuronom. |
Ma dendryty, które są połączeniami między ciałem komórki. | Wagi połączeń odpowiadają dendrytom. |
Soma otrzymuje wejście. | Soma jest podobna do masy wejściowej netto. |
Akson odbiera sygnał. | Wyjście ANN odpowiada aksonowi. |
Charakterystyka SSN
- Nieliniowość: Mechanizm generowania sygnału wejściowego w ANN jest nieliniowy.
- Nadzorowana nauka: Dane wejściowe i wyjściowe są mapowane, a SSN jest szkolona za pomocą zestawu danych szkoleniowych.
- Uczenie się bez nadzoru: Docelowe dane wyjściowe nie są podawane, więc SSN będzie uczyć się samodzielnie, odkrywając cechy we wzorcach wejściowych.
- Natura adaptacyjna: Masy połączeń w węzłach SSN są w stanie dostosować się, aby uzyskać żądaną wydajność.
- Biologiczna analogia neuronów: SSN ma strukturę i funkcjonalność inspirowaną ludzkim mózgiem.
- Tolerancja błędów: Sieci te są wysoce tolerancyjne, ponieważ informacje są rozprowadzane warstwowo, a obliczenia odbywają się w czasie rzeczywistym.
Struktura SSN
Sztuczne sieci neuronowe to elementy przetwarzające w postaci algorytmów lub urządzeń sprzętowych wzorowanych na strukturze neuronalnej kory mózgowej ludzkiego mózgu.
Sieci te są również nazywane po prostu sieciami neuronowymi. NN składa się z wielu warstw. Wielowarstwowe warstwy, które są ze sobą połączone, są często nazywane „wielowarstwowym perceptronem”. Neurony w jednej warstwie nazywane są „węzłami”. Węzły te mają „funkcję aktywacji”.
SSN ma 3 główne warstwy:
- Warstwa wejściowa: Wzorce wejściowe są podawane do warstw wejściowych. Jest jedna warstwa wejściowa.
- Ukryte warstwy: Może być jedna lub więcej ukrytych warstw. Przetwarzanie, które ma miejsce w warstwach wewnętrznych, nazywa się „warstwami ukrytymi”. Warstwy ukryte obliczają wynik w oparciu o „wagi”, które są „sumą ważonych połączeń synaps”. Ukryte warstwy udoskonalają dane wejściowe, usuwając zbędne informacje i wysyłając informacje do następnej ukrytej warstwy w celu dalszego przetwarzania.
- Warstwa wyjściowa: Ta ukryta warstwa łączy się z „warstwą wyjściową”, w której wyświetlany jest wynik.
Funkcja aktywacji
Funkcja aktywacji to stan wewnętrzny neuronu. Jest to funkcja danych wejściowych, które otrzymuje neuron. Funkcja aktywacji służy do konwersji sygnału wejściowego w węźle sieci ANN na sygnał wyjściowy.
Co to jest sztuczny neuron?
Sztuczna sieć neuronowa składa się z silnie połączonych ze sobą elementów przetwarzających zwanych węzłami lub neuronami.
Te neurony działają równolegle i są zorganizowane w architekturę. Węzły są połączone ze sobą za pomocą łączy połączeniowych. Każdy neuron ma obciążnik zawierający informacje o sygnale wejściowym.
Jak działa sztuczny neuron?
Sztuczny neuron otrzymuje sygnał wejściowy. Te wejścia mają wagę zwaną „synapsą”. Te neurony (zwane również węzłami) pełnią „funkcję aktywacji”. Ta funkcja aktywacji działa na wejściu i przetwarza je na wyjście.
Ważona suma wejść staje się sygnałem wejściowym funkcji aktywacji, dając jedno wyjście. Te wagi wejściowe można regulować, aby sieć neuronowa mogła dostosowywać swoje parametry, aby uzyskać żądany wynik.
Kilka typowych funkcji aktywacji, które są używane w sztucznych sieciach neuronowych, to:
# 1) Funkcja tożsamości
Można go zdefiniować jako f (x) = x dla wszystkich wartości x. Jest to funkcja liniowa, w której wyjście jest takie samo jak wejście.
# 2) Funkcja kroku binarnego
Ta funkcja jest używana w sieciach jednowarstwowych do konwersji wejścia netto na wyjście. Wyjście jest binarne, tj. 0 lub 1. T oznacza wartość progową.
(wizerunek źródło )
# 3) Bipolarna funkcja kroku
Funkcja kroku bipolarnego ma wyjścia bipolarne (+1 lub -1) dla wejścia netto. T reprezentuje wartość progową.
# 4) Funkcja sygmoidalna
Jest używany w sieciach z propagacją wsteczną.
Jest dwojakiego rodzaju:
- Funkcja binarna Sigmoid: Jest również nazywany jednobiegunową funkcją sigmoidalną lub logistyczną funkcją sigmoidalną. Zakres funkcjonału sigmoidalnego wynosi od 0 do 1.
- Dwubiegunowy Sigmoid: Bipolarna funkcja sigmoidalna waha się od -1 do +1. Jest podobny do hiperbolicznej funkcji stycznej.
(wizerunek źródło )
# 5) RampFunction
Plik ważona suma wejść oznacza „iloczyn wagi wkładu i wartości wkładu” zsumowany dla wszystkich nakładów.
Niech I = {I1, I2, I3… In} będzie wzorcem wejściowym do neuronu.
Niech W = {W1, W2, W3… Wn} będzie wagą związaną z każdym wejściem do węzła.
Suma ważona wejść = Y = (? Wi * Ii) dla i = 1 do n
Podstawowe modele ANN
Modele sztucznych sieci neuronowych składają się z 3 jednostek:
- Wagi lub połączenia synaptyczne
- Reguła uczenia się używana do dostosowywania wag
- Funkcje aktywacyjne neuronu
Architektura sieci neuronowych
W ANN neurony są ze sobą połączone, a sygnał wyjściowy każdego neuronu jest połączony z następnym neuronem za pomocą wag. Architektura tych połączeń jest ważna w SSN. Ten układ ma postać warstw, a połączenie między warstwami i wewnątrz warstwy jest architekturą sieci neuronowej.
Najbardziej znane architektury sieciowe to:
- Jednowarstwowa sieć przesyłania dalej
- Wielowarstwowa sieć przesyłania dalej
- Pojedynczy węzeł z własną opinią
- Sieć powtarzalna jednowarstwowa
- Wielowarstwowa sieć okresowa
Przyjrzyjmy się szczegółowo każdemu z nich.
Microsoft dynamics ax 2012 tutorial dla początkujących
# 1) Jednowarstwowa sieć przesyłania dalej
Warstwa to sieć utworzona z neuronów. Te neurony są połączone z innymi neuronami następnej warstwy. W przypadku pojedynczej warstwy istnieją tylko warstwy wejściowe i wyjściowe. Warstwa wejściowa jest połączona z węzłami warstwy wyjściowej za pomocą wag.
Wszystkie węzły wejściowe są podłączone do każdego z węzłów wyjściowych. Termin sprzężenie zwrotne oznacza, że nie ma informacji zwrotnej wysyłanej z warstwy wyjściowej do warstwy wejściowej. Tworzy to jednowarstwową sieć ze sprzężeniem zwrotnym.
(wizerunek źródło )
# 2) Wielowarstwowa sieć przesyłania dalej
Sieć wielowarstwowa składa się z co najmniej jednej warstwy między wejściem a wyjściem. Warstwa wejściowa po prostu odbiera sygnał i buforuje go, podczas gdy warstwa wyjściowa wyświetla dane wyjściowe. Warstwy między wejściem a wyjściem nazywane są warstwami ukrytymi.
Ukryte warstwy nie mają kontaktu ze środowiskiem zewnętrznym. Przy większej liczbie ukrytych warstw reakcja wyjściowa jest bardziej wydajna. Węzły w poprzedniej warstwie są połączone z każdym węzłem w następnej warstwie.
Ponieważ nie ma warstwy wyjściowej podłączonej do warstw wejściowych lub ukrytych, tworzy ona wielowarstwową sieć sprzężenia zwrotnego.
# 3) Pojedynczy węzeł z własną opinią
Sieci, w których dane wyjściowe warstwy wyjściowej są przesyłane z powrotem jako dane wejściowe do warstwy wejściowej lub innych warstw ukrytych, nazywane są sieciami sprzężenia zwrotnego. W systemach sprzężenia zwrotnego z jednym węzłem istnieje jedna warstwa wejściowa, w której dane wyjściowe są przekierowywane z powrotem jako sprzężenie zwrotne.
# 4) Powtarzalna sieć jednowarstwowa
W powtarzającej się sieci jednowarstwowej sieć sprzężenia zwrotnego tworzy zamkniętą pętlę. W tym modelu pojedynczy neuron otrzymuje informację zwrotną do siebie lub innych neuronów w sieci lub do obu.
# 5) Wielowarstwowa sieć cykliczna
W powtarzającej się sieci wielowarstwowej istnieje wiele ukrytych warstw, a dane wyjściowe są przekierowywane z powrotem do neuronów z poprzednich warstw i innych neuronów w tych samych warstwach lub do tego samego neuronu.
Przykład sztucznej sieci neuronowej
Weźmy poniższą sieć z podanym wejściem i obliczmy neuron wejściowy netto i uzyskajmy wynik neuronu Y z funkcją aktywacji jako binarną sigmoidalną.
Na wejściu znajdują się 3 neurony X1, X2 i X3 oraz jedno wyjście Y.
Wagi związane z danymi wejściowymi to: {0,2, 0,1, -0,3}
Wejścia = {0,3, 0,5, 0,6}
Wkład netto = {x1 * w1 + x2 * w2 + x3 * w3}
Wkład netto = (0,3 * 0,2) + (0,5 * 0,1) + (0,6 * -0,3)
Wejście netto = -0,07
Wyjście dla binarnych sigmoidalnych:
X wynosi -0,07
Wynik wyniesie 0,517
niezdefiniowane odwołanie do funkcji c ++
Porównanie między uczeniem maszynowym a SSN
Nauczanie maszynowe | Sztuczna sieć neuronowa |
---|---|
Uczenie maszynowe uczy się na podstawie danych wejściowych i odkrywa wzorce danych wyjściowych. | SSN są używane w algorytmach uczenia maszynowego do uczenia systemu przy użyciu synaps, węzłów i łączy. |
ML to podzbiór dziedziny sztucznej inteligencji. | SSN jest również częścią dziedziny nauki o sztucznej inteligencji i podzbiorem uczenia maszynowego. |
Algorytmy ML uczą się na podstawie danych przekazywanych do algorytmu w celu podejmowania decyzji. Niektóre z tych algorytmów są klasyfikowane. Klastrowanie, eksploracja danych asocjacyjnych. | SSN to nauka o głębokim uczeniu się, która analizuje dane za pomocą struktur logicznych tak, jak robią to ludzie. Niektóre ze schematów uczenia się ANN to Hebbian, Perceptron, Back propagation itp. |
Algorytmy ML mają zdolność samouczenia się, ale wymagałyby interwencji człowieka, jeśli wynik jest niedokładny. | Algorytmy ANN mają możliwość dostosowania się za pomocą wag połączeń, jeśli wynik okaże się nieprawidłowy. |
Algorytmy ML wymagają umiejętności programowania, struktury danych i wiedzy o bazach danych big data. | SSN wymaga również dużych umiejętności matematycznych, prawdopodobieństwa, struktur danych itp. |
Programy ML mogą przewidywać wynik dla wyuczonego zestawu danych i dostosowywać się do nowych danych. | Sieć ANN może samodzielnie uczyć się i podejmować inteligentne decyzje w przypadku nowych danych, ale jest to głębsze niż uczenie maszynowe. |
Uczenie nadzorowane i nienadzorowane podlega uczeniu maszynowemu. | Uczenie się, takie jak Kohenen, promieniowe odchylenie, sieć neuronowa sprzężenia zwrotnego, podlega SSN. |
Niektóre przykłady ML to wyniki wyszukiwania Google itp. | Niektóre przykłady SSN to rozpoznawanie twarzy, rozpoznawanie obrazu itp. |
Sieci neuronowe i głębokie uczenie się
Sieci głębokiego uczenia zawierają kilka ukrytych warstw między danymi wejściowymi a wyjściowymi. Sieci te wyróżniają się głębokością ukrytych warstw. Dane wejściowe przechodzą przez wiele kroków przed wyświetleniem danych wyjściowych.
Sieci te różnią się od wcześniejszego NN, na przykład perceptronem, który miał jedną ukrytą warstwę i był nazywany Shallow Networks. Każda ukryta warstwa w sieci głębokiego uczenia trenuje dane z określonymi funkcjami w oparciu o dane wyjściowe poprzedniej warstwy.
Dane przechodzą przez wiele warstw funkcji nieliniowej w węźle. Im większa liczba warstw, tym bardziej złożone cechy można rozpoznać, ponieważ następna warstwa przeprowadzi agregację cech z poprzednich warstw.
Wiele ukrytych warstw w sieci zwiększa złożoność i abstrakcję. Ta głębokość jest również określana jako hierarchia cech. Dzięki temu sieci uczenia głębokiego są w stanie obsługiwać dane wielowymiarowe.
Niektóre przykłady sieci głębokiego uczenia obejmują grupowanie milionów obrazów na podstawie ich cech i podobieństw, filtrowanie wiadomości e-mail, stosowanie filtrów do wiadomości w CRM, identyfikowanie mowy itp.
Sieci głębokiego uczenia mogą być trenowane zarówno na zestawie danych oznaczonych, jak i nieoznaczonych. W przypadku zbioru danych bez etykiety sieci takie jak maszyny selekcyjne Boltzmanna wykonują automatyczne wyodrębnianie cech.
Sieć uczy się automatycznie, analizując dane wejściowe poprzez próbkowanie i minimalizując różnicę w produkcji i dystrybucji danych wejściowych. Sieć neuronowa znajduje tutaj korelacje między cechami a wynikami.
Sieci głębokiego uczenia trenowane na oznaczonych danych można zastosować do danych nieustrukturyzowanych. Im więcej danych szkoleniowych wprowadzonych do sieci, tym dokładniejsze będą.
Zdolność sieci do uczenia się na podstawie nieoznaczonych danych jest zaletą w stosunku do innych algorytmów uczenia się.
Zastosowania sztucznych sieci neuronowych
Sieci neuronowe są z powodzeniem stosowane w różnych rozwiązaniach, jak pokazano poniżej.
# 1) Rozpoznawanie wzorców: SSN jest używany do rozpoznawania wzorców, rozpoznawania obrazów, wizualizacji obrazów, pisma ręcznego, mowy i innych podobnych zadań.
# 2) Problemy z optymalizacją: Problemy, takie jak znalezienie najkrótszej trasy, planowanie i produkcja, w przypadku których trzeba spełnić ograniczenia problemowe i osiągnąć optymalne rozwiązania, wykorzystują NN.
# 3) Prognozowanie: NN może przewidzieć wyniki sytuacji, analizując wcześniejsze trendy. Aplikacje takie jak bankowość, giełda, prognozy pogody wykorzystują sieci neuronowe.
# 4) Systemy sterowania: Systemy sterowania, takie jak produkty komputerowe, produkty chemiczne i robotyka, wykorzystują sieci neuronowe.
Ograniczenia sieci neuronowych
Poniżej wymieniono niektóre z wad sieci neuronowych.
- Sieci te są dla użytkownika czarnymi skrzynkami, ponieważ użytkownik nie ma żadnych ról poza dostarczaniem danych wejściowych i obserwowaniem danych wyjściowych. Użytkownik nie jest świadomy tego, jak przebiega szkolenie w algorytmie.
- Te algorytmy są raczej powolne i wymagają wielu iteracji (zwanych także epokami), aby uzyskać dokładne wyniki. Dzieje się tak, ponieważ procesor oblicza wagi, funkcję aktywacji każdego węzła oddzielnie, co powoduje, że zużywa on zarówno czas, jak i zasoby. Powoduje również problem z dużą ilością danych.
Wniosek
W tym samouczku dowiedzieliśmy się o sztucznej sieci neuronowej, jej analogii do neuronu biologicznego i typach sieci neuronowych.
ANN podlega uczeniu maszynowemu. Jest to model obliczeniowy złożony z wielu węzłów neuronów. Węzły te odbierają dane wejściowe, przetwarzają je za pomocą funkcji aktywacji i przekazują dane wyjściowe do kolejnych warstw.
Dane wejściowe są powiązane z wagami łącza połączenia zwanymi synapsą. Podstawowa SSN składa się z warstwy wejściowej, wag, funkcji aktywacji, warstwy ukrytej i warstwy wyjściowej.
Funkcje aktywacji służą do zamiany wejścia na wyjście. Niektóre z nich są binarne, dwubiegunowe, sigmoidalne i rampowe. Istnieją różne typy SSN, takie jak jednowarstwowe przekazywanie do przodu, wielowarstwowe przekazywanie do przodu, sieci rekurencyjne itp. W zależności od liczby ukrytych warstw i mechanizmów sprzężenia zwrotnego.
Sieć SSN z wieloma ukrytymi warstwami między wejściem a wyjściem z sieci głębokiego uczenia. Sieci głębokiego uczenia mają wysoki poziom złożoności i abstrakcji, co sprawia, że są one w stanie przetwarzać dane wielowymiarowe z tysiącami parametrów.
SSN jest stosowany w dziedzinie prognozowania, przetwarzania obrazu, systemów sterowania itp. Z powodzeniem zastosowano je jako rozwiązanie szeregu problemów w nauce.
Mamy nadzieję, że ten samouczek wyjaśnił wszystko, co musisz wiedzieć o sztucznych sieciach neuronowych !!
=> Odwiedź tutaj, aby zapoznać się z ekskluzywną serią uczenia maszynowego
rekomendowane lektury
- Wydobywanie danych kontra uczenie maszynowe, sztuczna inteligencja kontra uczenie głębokie
- Testowanie bezpieczeństwa sieci i najlepsze narzędzia bezpieczeństwa sieci
- Rodzaje uczenia maszynowego: uczenie nadzorowane i nienadzorowane
- 11 najpopularniejszych narzędzi oprogramowania do uczenia maszynowego w 2021 r
- Samouczek uczenia maszynowego: wprowadzenie do ML i jej aplikacji
- Przewodnik po masce podsieci (podsieci) i kalkulatorze podsieci IP
- Przewodnik po ocenie i zarządzaniu lukami w sieci
- 15 najlepszych narzędzi do skanowania sieciowego (skaner sieciowy i IP) z 2021 r