weka tutorial how download
Ten samouczek WEKA wyjaśnia, czym jest narzędzie Weka Machine Learning, jego funkcje oraz jak pobierać, instalować i używać oprogramowania Weka Machine Learning:
w Poprzedni samouczek , dowiedzieliśmy się o maszynie wektorów wsparcia w ML i powiązanych koncepcjach, takich jak hiperpłaszczyzna, wektory pomocnicze i aplikacje SVM.
Uczenie maszynowe to dziedzina nauki, w której maszyny działają jako sztucznie inteligentny system. Maszyny mogą się uczyć samodzielnie, bez żadnego wyraźnego kodowania. Jest to proces iteracyjny, który uzyskuje dostęp do danych, sam się uczy i przewiduje wynik. Do wykonywania zadań uczenia maszynowego potrzeba wielu narzędzi i skryptów.
WEKA to platforma uczenia maszynowego składająca się z wielu narzędzi ułatwiających wiele działań z zakresu uczenia maszynowego.
=> Przeczytaj całą serię szkoleń z zakresu uczenia maszynowego
Czego się nauczysz:
- Co to jest WEKA
- Wniosek
Co to jest WEKA
Weka to narzędzie open source zaprojektowane i opracowane przez naukowców / badaczy z University of Waikato w Nowej Zelandii. WEKA to skrót od Waikato Environment for Knowledge Analysis. Jest rozwijany przez międzynarodową społeczność naukową i rozpowszechniany na wolnej licencji GNU GPL.
WEKA jest w pełni rozwinięta w Javie. Zapewnia integrację z bazą danych SQL za pomocą łączności Java Database. Zapewnia wiele algorytmów uczenia maszynowego do realizacji zadań eksploracji danych. Algorytmy te mogą być używane bezpośrednio za pomocą narzędzia WEKA lub mogą być używane z innymi aplikacjami wykorzystującymi język programowania Java.
c ++ konwertuj znak na ciąg
Zapewnia wiele narzędzi do wstępnego przetwarzania danych, klasyfikacji, grupowania, analizy regresji, tworzenia reguł asocjacyjnych, wyodrębniania cech i wizualizacji danych. To potężne narzędzie wspierające rozwój nowych algorytmów w uczeniu maszynowym.
Dlaczego warto korzystać z narzędzia WEKA Machine Learning
Dzięki WEKA algorytmy uczenia maszynowego są łatwo dostępne dla użytkowników. Specjaliści ML mogą wykorzystać te metody do wydobycia przydatnych informacji z dużych ilości danych. Tutaj specjaliści mogą stworzyć środowisko do opracowywania nowych metod uczenia maszynowego i wdrażania ich na rzeczywistych danych.
WEKA jest używana przez naukowców zajmujących się uczeniem maszynowym i naukami stosowanymi do celów edukacyjnych. Jest wydajnym narzędziem do wykonywania wielu zadań eksploracji danych.
WEKA Pobieranie i instalacja
# 1) Pobierz oprogramowanie z tutaj .
Sprawdź konfigurację systemu komputerowego i pobierz z tej strony stabilną wersję WEKI (obecnie 3.8).
#dwa) Po pomyślnym pobraniu otwórz lokalizację pliku i kliknij dwukrotnie pobrany plik. Pojawi się kreator Step Up. Kliknij Dalej.
# 3) Otworzą się warunki umowy licencyjnej. Przeczytaj go dokładnie i kliknij „Zgadzam się”.
# 4) Zgodnie z wymaganiami wybierz komponenty do zainstalowania. Zalecana jest pełna instalacja komponentów. Kliknij Dalej.
# 5) Wybierz folder docelowy i kliknij Dalej.
# 6) Następnie rozpocznie się instalacja.
# 7) Jeśli Java nie jest zainstalowana w systemie, najpierw zainstaluje Java.
# 8) Po zakończeniu instalacji pojawi się następujące okno. Kliknij Dalej.
# 9) Zaznacz pole wyboru Uruchom Weka. Kliknij Zakończ.
pytania do wywiadu do działu pomocy technicznej
# 10) Otworzy się okno WEKA Tool i Explorer.
#jedenaście) Podręcznik WEKA można pobrać ze strony tutaj.
Graficzny interfejs użytkownika WEKA
GUI WEKA daje pięć opcji: Explorer, Experimenter, Knowledge flow, Workbench i Simple CLI. Rozumiemy każdy z nich indywidualnie.
1) Prosty interfejs CLI
Prosty CLI to Weka Shell z wierszem poleceń i wyjściem. Za pomocą „pomocy” można zobaczyć przegląd wszystkich poleceń. Prosty interfejs CLI zapewnia dostęp do wszystkich klas, takich jak klasyfikatory, klastry i filtry itp.
Niektóre z prostych poleceń CLI to:
- Przerwa: Aby zatrzymać bieżący wątek
- Wyjście: Wyjdź z CLI
- Wsparcie[] : Wyświetla pomoc dotyczącą określonego polecenia
- -java weka.classifiers.trees.J48 -t c: /temp/iris.arff: Aby wywołać klasę WEKA, należy poprzedzić ją Java. Polecenie to nakazuje WEKA załadowanie klasy i wykonanie jej z zadanymi parametrami. W tym poleceniu klasyfikator J48 jest wywoływany w zestawie danych IRIS.
# 2) Explorer
Okna WEKA Explorer pokazują różne zakładki, zaczynając od preprocesu. Początkowo karta przetwarzania wstępnego jest aktywna, ponieważ najpierw zestaw danych jest wstępnie przetwarzany przed zastosowaniem do niego algorytmów i eksploracją zbioru danych.
Zakładki są następujące:
- Przetwarzanie wstępne: Wybierz i zmodyfikuj załadowane dane.
- Klasyfikować: Zastosuj algorytmy uczenia i testowania do danych, które będą klasyfikować i regresować dane.
- Grupa: Twórz klastry na podstawie danych.
- Współpracownik: Moja reguła asocjacji dla danych.
- Wybierz atrybuty: Stosowane są miary wyboru atrybutów.
- Wyobrażać sobie: Widoczna jest reprezentacja danych w 2D.
- Pasek stanu: W najniższej części okna znajduje się pasek stanu. Ta sekcja pokazuje, co się obecnie dzieje w formie wiadomości, na przykład ładowanie pliku. Kliknij prawym przyciskiem myszy, Pamięć Informacja można zobaczyć, a także Biegać Śmieci kolektor aby zwolnić miejsce można uruchomić.
- Przycisk dziennika: Przechowuje dziennik wszystkich działań w Weka wraz ze znacznikiem czasu. Dzienniki są wyświetlane w osobnym oknie po kliknięciu przycisku Dziennik.
- Ikona ptaka WEKA: Obecny w prawym dolnym rogu ptaszek WEKA przedstawia liczbę procesów uruchomionych jednocześnie (x.). W trakcie procesu ptak będzie się poruszał.
# 3) Experimenter
Przycisk WEKA Experimenter umożliwia użytkownikom tworzenie, uruchamianie i modyfikowanie różnych schematów w ramach jednego eksperymentu na zbiorze danych. Eksperymentator ma 2 rodzaje konfiguracji: Proste i zaawansowane. Obie konfiguracje umożliwiają użytkownikom przeprowadzanie eksperymentów lokalnie i na komputerach zdalnych.
- Przyciski „Otwórz” i „Nowy” otworzą nowe okno eksperymentu, które użytkownicy mogą wykonać.
- Wyniki: Ustaw wynikowy plik docelowy z pliku ARFF, JDFC i CSV.
- Typ eksperymentu: Użytkownik może wybrać między walidacją krzyżową a podziałem procentowym trenowania / testowania. Użytkownik może wybrać między klasyfikacją a regresją w oparciu o zestaw danych i zastosowany klasyfikator.
- Zestawy danych: Tutaj użytkownik może przeglądać i wybierać zestawy danych. W przypadku pracy na różnych komputerach zaznaczane jest pole wyboru ścieżki względnej. Obsługiwane formaty zestawów danych to ARFF, C4.5, CSV, libsvm, bsi i XRFF.
- Iteracja: Domyślna liczba iteracji jest ustawiona na 10. Najpierw zestawy danych, a algorytmy najpierw pomagają w przełączaniu między zestawem danych a algorytmami, tak aby algorytmy można było uruchomić na wszystkich zestawach danych.
- Algorytmy: Nowe algorytmy dodaje „Nowy przycisk”. Użytkownik może wybrać klasyfikator.
- Zapisz eksperyment za pomocą przycisku Zapisz.
- Uruchom eksperyment za pomocą przycisku Uruchom.
# 4) Przepływ wiedzy
Przepływ wiedzy przedstawia graficzną reprezentację algorytmów WEKA. Użytkownik może wybrać komponenty i stworzyć przepływ pracy do analizy zbiorów danych. Dane mogą być przetwarzane partiami lub przyrostowo. Można zaprojektować równoległe przepływy pracy i każdy z nich będzie uruchamiany w osobnym wątku.
Dostępne są różne komponenty Źródła danych, oszczędzacze danych, filtry, klasyfikatory, klastry, ocena i wizualizacja.
# 5) Środowisko pracy
WEKA posiada moduł workbench, który zawiera wszystkie GUI w jednym oknie.
Cechy WEKA Explorer
# 1) Zbiór danych
Zbiór danych składa się z elementów. Reprezentuje obiekt na przykład: w marketingowej bazie danych będzie reprezentować klientów i produkty. Zbiory danych są opisane za pomocą atrybutów. Zestaw danych zawiera krotki danych w bazie danych. Zestaw danych ma atrybuty, które mogą być nominalne, numeryczne lub łańcuchowe. W Weka zbiór danych jest reprezentowany przez weka.core.Instances klasa.
Reprezentacja zbioru danych z 5 przykładami:
@dane
słonecznie, FAŁSZ, 85,85, nie
słonecznie, PRAWDA, 80,90, nie
zachmurzenie, FALSE, 83,86, tak
deszczowo, FAŁSZ, 70,96, tak
deszczowo, FAŁSZ, 68,80, tak
Co to jest atrybut?
Atrybut to pole danych reprezentujące charakterystykę obiektu danych. Na przykład, w bazie danych klientów będą to atrybuty id_klienta, e-mail_klienta, adres_klienta, itd. Atrybuty mają różne typy.
Te możliwe typy to:
A) Nominalne atrybuty: Atrybut, który odnosi się do nazwy i ma predefiniowane wartości, takie jak kolor, pogoda. Te atrybuty nazywane są atrybuty kategorialne . Te atrybuty nie mają żadnego porządku, a ich wartości są również nazywane wyliczeniami.
@attribute outlook {słonecznie, pochmurno, deszczowo}: deklaracja nominalnego atrybutu.
B) Atrybuty binarne: Te atrybuty reprezentują tylko wartości 0 i 1. Są to typy atrybutów nominalnych z tylko 2 kategoriami. Te atrybuty są również nazywane wartościami logicznymi.
C) Atrybuty porządkowe: Atrybuty, które zachowują wśród nich pewien porządek lub ranking, są atrybutami porządkowymi. Nie można przewidzieć kolejnych wartości, ale zachowana jest tylko kolejność. Przykład: rozmiar, gatunek itp.
D) Atrybuty liczbowe: Atrybuty reprezentujące mierzalne ilości są atrybutami liczbowymi. Są one reprezentowane przez liczby rzeczywiste lub całkowite. Przykład: temperatura, wilgotność.
@ Attribute wilgotność rzeczywista: deklaracja atrybutu liczbowego
E) Atrybuty ciągów: Te atrybuty przedstawiają listę znaków przedstawionych w cudzysłowach.
# 2) Format danych ARFF
WEKA pracuje na pliku ARFF do analizy danych. ARFF oznacza format pliku relacji atrybutów. Ma 3 sekcje: relacja, atrybuty i dane. Każda sekcja zaczyna się od „@”.
jak zainicjować kolejkę w java
Pliki ARFF mają atrybuty danych nominalnych, liczbowych, łańcuchowych, dat i relacyjnych. Niektóre z dobrze znanych zestawów danych uczenia maszynowego są obecne w WEKA jako ARFF.
Format ARFF to:
@relacja
@atrybut
@dane
Przykładem pliku ARFF jest:
@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes
# 3) Format danych XRFF
XRFF oznacza format pliku relacji atrybutów XML. Reprezentuje dane, które mogą przechowywać komentarze, atrybuty i wagi instancji. Ma rozszerzenie .xrff i .xrff.gz (format skompresowany). Pliki XRFF reprezentowały dane w formacie XML.
# 4) Łączność z bazą danych
Dzięki WEKA można łatwo połączyć się z bazą danych za pomocą sterownika JDBC. Sterownik JDBC niezbędny do połączenia się z bazą danych, przykład:
MS SQL Server (com.microsoft.jdbc.sqlserver.SQLServerDriver)
Wyrocznia (oracle.jdbc.driver.OracleDriver)
# 5) Klasyfikatory
Aby przewidzieć dane wyjściowe, WEKA zawiera klasyfikatory. Algorytmy klasyfikacyjne dostępne do uczenia to drzewa decyzyjne, maszyny wektorów nośnych, klasyfikatory oparte na instancjach i regresja logistyczna oraz sieci bayesowskie. W zależności od wymagań za pomocą prób i testów, użytkownik może znaleźć odpowiedni algorytm do analizy danych. Klasyfikatory służą do klasyfikowania zbiorów danych w oparciu o cechy atrybutów.
# 6) Klastrowanie
WEKA wykorzystuje kartę Klaster do przewidywania podobieństw w zbiorze danych. Na podstawie grupowania użytkownik może znaleźć atrybuty przydatne do analizy i zignorować inne atrybuty. Dostępne algorytmy grupowania w WEKA to k-średnie, EM, Cobweb, X-średnie i FarhtestFirst.
# 7) Stowarzyszenie
Jedynym algorytmem dostępnym w WEKA do wyszukiwania reguł asocjacji jest Apriori.
# 8) Miary sekcji atrybutów
WEKA stosuje 2 podejścia do najlepszego wyboru atrybutów do celów obliczeniowych:
- Korzystanie z algorytmu metody wyszukiwania: Najpierw najlepszy, wybór do przodu, algorytm losowy, wyczerpujący, algorytm genetyczny i algorytm rankingu.
- Korzystanie z algorytmów metody oceny: Oparte na korelacji, opakowanie, przyrost informacji, chi-kwadrat.
# 9) Wizualizacja
WEKA obsługuje reprezentację danych 2D, wizualizacje 3D z obrotem i reprezentację 1D pojedynczego atrybutu. Posiada opcję „Jitter” dla atrybutów nominalnych i „ukrytych” punktów danych.
Inne główne cechy WEKA to:
- Jest to narzędzie typu open source z graficznym interfejsem użytkownika w postaci „Eksploratora”, „Eksperymentatora” i „Przepływu wiedzy”.
- Jest niezależny od platformy.
- Zawiera 49 narzędzi do wstępnego przetwarzania danych.
- 76 algorytmów klasyfikacji i regresji, 8 algorytmów grupowania jest obecnych w WEKA
- Posiada 15 algorytmów wyboru atrybutów i 10 algorytmów wyboru cech.
- Posiada 3 algorytmy do znajdowania reguły asocjacyjnej.
- Korzystając z WEKA, użytkownicy mogą tworzyć własny kod do uczenia maszynowego.
Wniosek
W tym samouczku WEKA przedstawiliśmy wprowadzenie do oprogramowania WEKA Machine Learning o otwartym kodzie źródłowym i wyjaśniliśmy krok po kroku proces pobierania i instalacji. Widzieliśmy również pięć opcji dostępnych dla graficznego interfejsu użytkownika Weka, a mianowicie Explorer, Experimenter, Przepływ wiedzy, Środowisko pracy i Prosty interfejs CLI.
Dowiedzieliśmy się również o cechach WEKA z przykładami. Funkcje obejmują zestaw danych, format danych ARFF, łączność z bazą danych itp.
=> Odwiedź tutaj, aby zapoznać się z ekskluzywną serią uczenia maszynowego
rekomendowane lektury
- Zestaw danych WEKA, klasyfikator i algorytm J48 dla drzewa decyzyjnego
- WEKA Explorer: wizualizacja, grupowanie, wydobywanie reguł asocjacyjnych
- 11 najpopularniejszych narzędzi oprogramowania do uczenia maszynowego w 2021 r
- Kompletny przewodnik po sztucznej sieci neuronowej w uczeniu maszynowym
- Wydobywanie danych kontra uczenie maszynowe, sztuczna inteligencja kontra uczenie głębokie
- Samouczek uczenia maszynowego: wprowadzenie do ML i jej aplikacji
- 13 najlepszych firm zajmujących się uczeniem maszynowym [zaktualizowana lista w 2021 r.]
- Co to jest maszyna wektorów wsparcia (SVM) w uczeniu maszynowym