Samouczek Weka - Jak pobrać, zainstalować i używać narzędzia Weka

weka tutorial how download

Wypróbuj Nasz Instrument Do Eliminowania Problemów

Wybierz System Operacyjny Wybierz Program Projekcji (Opcjonalnie)

Opisz Swój Problem

Ten samouczek WEKA wyjaśnia, czym jest narzędzie Weka Machine Learning, jego funkcje oraz jak pobierać, instalować i używać oprogramowania Weka Machine Learning:

w Poprzedni samouczek , dowiedzieliśmy się o maszynie wektorów wsparcia w ML i powiązanych koncepcjach, takich jak hiperpłaszczyzna, wektory pomocnicze i aplikacje SVM.

Uczenie maszynowe to dziedzina nauki, w której maszyny działają jako sztucznie inteligentny system. Maszyny mogą się uczyć samodzielnie, bez żadnego wyraźnego kodowania. Jest to proces iteracyjny, który uzyskuje dostęp do danych, sam się uczy i przewiduje wynik. Do wykonywania zadań uczenia maszynowego potrzeba wielu narzędzi i skryptów.

WEKA to platforma uczenia maszynowego składająca się z wielu narzędzi ułatwiających wiele działań z zakresu uczenia maszynowego.

=> Przeczytaj całą serię szkoleń z zakresu uczenia maszynowego

Czego się nauczysz:

Co to jest WEKA

Logo WEKA Bird

WEKAGUIChooser

Weka to narzędzie open source zaprojektowane i opracowane przez naukowców / badaczy z University of Waikato w Nowej Zelandii. WEKA to skrót od Waikato Environment for Knowledge Analysis. Jest rozwijany przez międzynarodową społeczność naukową i rozpowszechniany na wolnej licencji GNU GPL.

WEKA jest w pełni rozwinięta w Javie. Zapewnia integrację z bazą danych SQL za pomocą łączności Java Database. Zapewnia wiele algorytmów uczenia maszynowego do realizacji zadań eksploracji danych. Algorytmy te mogą być używane bezpośrednio za pomocą narzędzia WEKA lub mogą być używane z innymi aplikacjami wykorzystującymi język programowania Java.

c ++ konwertuj znak na ciąg

Zapewnia wiele narzędzi do wstępnego przetwarzania danych, klasyfikacji, grupowania, analizy regresji, tworzenia reguł asocjacyjnych, wyodrębniania cech i wizualizacji danych. To potężne narzędzie wspierające rozwój nowych algorytmów w uczeniu maszynowym.

Dlaczego warto korzystać z narzędzia WEKA Machine Learning

Dzięki WEKA algorytmy uczenia maszynowego są łatwo dostępne dla użytkowników. Specjaliści ML mogą wykorzystać te metody do wydobycia przydatnych informacji z dużych ilości danych. Tutaj specjaliści mogą stworzyć środowisko do opracowywania nowych metod uczenia maszynowego i wdrażania ich na rzeczywistych danych.

WEKA jest używana przez naukowców zajmujących się uczeniem maszynowym i naukami stosowanymi do celów edukacyjnych. Jest wydajnym narzędziem do wykonywania wielu zadań eksploracji danych.

WEKA Pobieranie i instalacja

# 1) Pobierz oprogramowanie z tutaj .

Sprawdź konfigurację systemu komputerowego i pobierz z tej strony stabilną wersję WEKI (obecnie 3.8).

Pobierz stabilną wersję WEKA

#dwa) Po pomyślnym pobraniu otwórz lokalizację pliku i kliknij dwukrotnie pobrany plik. Pojawi się kreator Step Up. Kliknij Dalej.

Kreator Step Up

# 3) Otworzą się warunki umowy licencyjnej. Przeczytaj go dokładnie i kliknij „Zgadzam się”.

Warunki umowy licencyjnej

# 4) Zgodnie z wymaganiami wybierz komponenty do zainstalowania. Zalecana jest pełna instalacja komponentów. Kliknij Dalej.

wybierz komponenty do zainstalowania

# 5) Wybierz folder docelowy i kliknij Dalej.

folder docelowy

# 6) Następnie rozpocznie się instalacja.

Okno instalacji

# 7) Jeśli Java nie jest zainstalowana w systemie, najpierw zainstaluje Java.

Okno instalacji Java

# 8) Po zakończeniu instalacji pojawi się następujące okno. Kliknij Dalej.

Okno zakończenia instalacji

# 9) Zaznacz pole wyboru Uruchom Weka. Kliknij Zakończ.

pytania do wywiadu do działu pomocy technicznej

Zaznacz pole wyboru Uruchom Weka

# 10) Otworzy się okno WEKA Tool i Explorer.

WEKA Tool i Explorer

#jedenaście) Podręcznik WEKA można pobrać ze strony tutaj.

Graficzny interfejs użytkownika WEKA

GUI WEKA daje pięć opcji: Explorer, Experimenter, Knowledge flow, Workbench i Simple CLI. Rozumiemy każdy z nich indywidualnie.

1) Prosty interfejs CLI

Prosty interfejs CLI

Prosty CLI to Weka Shell z wierszem poleceń i wyjściem. Za pomocą „pomocy” można zobaczyć przegląd wszystkich poleceń. Prosty interfejs CLI zapewnia dostęp do wszystkich klas, takich jak klasyfikatory, klastry i filtry itp.

Niektóre z prostych poleceń CLI to:

Przerwa: Aby zatrzymać bieżący wątek
Wyjście: Wyjdź z CLI
Wsparcie() : Wyświetla pomoc dotyczącą określonego polecenia
-java weka.classifiers.trees.J48 -t c: /temp/iris.arff: Aby wywołać klasę WEKA, należy poprzedzić ją Java. Polecenie to nakazuje WEKA załadowanie klasy i wykonanie jej z zadanymi parametrami. W tym poleceniu klasyfikator J48 jest wywoływany w zestawie danych IRIS.

proste polecenia CLI

# 2) Explorer

poszukiwacz

Okna WEKA Explorer pokazują różne zakładki, zaczynając od preprocesu. Początkowo karta przetwarzania wstępnego jest aktywna, ponieważ najpierw zestaw danych jest wstępnie przetwarzany przed zastosowaniem do niego algorytmów i eksploracją zbioru danych.

Zakładki są następujące:

Przetwarzanie wstępne: Wybierz i zmodyfikuj załadowane dane.
Klasyfikować: Zastosuj algorytmy uczenia i testowania do danych, które będą klasyfikować i regresować dane.
Grupa: Twórz klastry na podstawie danych.
Współpracownik: Moja reguła asocjacji dla danych.
Wybierz atrybuty: Stosowane są miary wyboru atrybutów.
Wyobrażać sobie: Widoczna jest reprezentacja danych w 2D.
Pasek stanu: W najniższej części okna znajduje się pasek stanu. Ta sekcja pokazuje, co się obecnie dzieje w formie wiadomości, na przykład ładowanie pliku. Kliknij prawym przyciskiem myszy, Pamięć Informacja można zobaczyć, a także Biegać Śmieci kolektor aby zwolnić miejsce można uruchomić.
Przycisk dziennika: Przechowuje dziennik wszystkich działań w Weka wraz ze znacznikiem czasu. Dzienniki są wyświetlane w osobnym oknie po kliknięciu przycisku Dziennik.
Ikona ptaka WEKA: Obecny w prawym dolnym rogu ptaszek WEKA przedstawia liczbę procesów uruchomionych jednocześnie (x.). W trakcie procesu ptak będzie się poruszał.

# 3) Experimenter

Eksperymentator

Przycisk WEKA Experimenter umożliwia użytkownikom tworzenie, uruchamianie i modyfikowanie różnych schematów w ramach jednego eksperymentu na zbiorze danych. Eksperymentator ma 2 rodzaje konfiguracji: Proste i zaawansowane. Obie konfiguracje umożliwiają użytkownikom przeprowadzanie eksperymentów lokalnie i na komputerach zdalnych.

Przyciski „Otwórz” i „Nowy” otworzą nowe okno eksperymentu, które użytkownicy mogą wykonać.
Wyniki: Ustaw wynikowy plik docelowy z pliku ARFF, JDFC i CSV.
Typ eksperymentu: Użytkownik może wybrać między walidacją krzyżową a podziałem procentowym trenowania / testowania. Użytkownik może wybrać między klasyfikacją a regresją w oparciu o zestaw danych i zastosowany klasyfikator.
Zestawy danych: Tutaj użytkownik może przeglądać i wybierać zestawy danych. W przypadku pracy na różnych komputerach zaznaczane jest pole wyboru ścieżki względnej. Obsługiwane formaty zestawów danych to ARFF, C4.5, CSV, libsvm, bsi i XRFF.
Iteracja: Domyślna liczba iteracji jest ustawiona na 10. Najpierw zestawy danych, a algorytmy najpierw pomagają w przełączaniu między zestawem danych a algorytmami, tak aby algorytmy można było uruchomić na wszystkich zestawach danych.
Algorytmy: Nowe algorytmy dodaje „Nowy przycisk”. Użytkownik może wybrać klasyfikator.
Zapisz eksperyment za pomocą przycisku Zapisz.
Uruchom eksperyment za pomocą przycisku Uruchom.

Ustaw do wyboru algorytmu

# 4) Przepływ wiedzy

WEKA KnowledgeFlow

Przepływ wiedzy przedstawia graficzną reprezentację algorytmów WEKA. Użytkownik może wybrać komponenty i stworzyć przepływ pracy do analizy zbiorów danych. Dane mogą być przetwarzane partiami lub przyrostowo. Można zaprojektować równoległe przepływy pracy i każdy z nich będzie uruchamiany w osobnym wątku.

Dostępne są różne komponenty Źródła danych, oszczędzacze danych, filtry, klasyfikatory, klastry, ocena i wizualizacja.

# 5) Środowisko pracy

WEKA posiada moduł workbench, który zawiera wszystkie GUI w jednym oknie.

WEKA Workbench

Cechy WEKA Explorer

# 1) Zbiór danych

Zbiór danych składa się z elementów. Reprezentuje obiekt na przykład: w marketingowej bazie danych będzie reprezentować klientów i produkty. Zbiory danych są opisane za pomocą atrybutów. Zestaw danych zawiera krotki danych w bazie danych. Zestaw danych ma atrybuty, które mogą być nominalne, numeryczne lub łańcuchowe. W Weka zbiór danych jest reprezentowany przez weka.core.Instances klasa.

Reprezentacja zbioru danych z 5 przykładami:

@dane
słonecznie, FAŁSZ, 85,85, nie
słonecznie, PRAWDA, 80,90, nie
zachmurzenie, FALSE, 83,86, tak
deszczowo, FAŁSZ, 70,96, tak
deszczowo, FAŁSZ, 68,80, tak

Co to jest atrybut?

Atrybut to pole danych reprezentujące charakterystykę obiektu danych. Na przykład, w bazie danych klientów będą to atrybuty id_klienta, e-mail_klienta, adres_klienta, itd. Atrybuty mają różne typy.

Te możliwe typy to:

A) Nominalne atrybuty: Atrybut, który odnosi się do nazwy i ma predefiniowane wartości, takie jak kolor, pogoda. Te atrybuty nazywane są atrybuty kategorialne . Te atrybuty nie mają żadnego porządku, a ich wartości są również nazywane wyliczeniami.

@attribute outlook {słonecznie, pochmurno, deszczowo}: deklaracja nominalnego atrybutu.

B) Atrybuty binarne: Te atrybuty reprezentują tylko wartości 0 i 1. Są to typy atrybutów nominalnych z tylko 2 kategoriami. Te atrybuty są również nazywane wartościami logicznymi.

C) Atrybuty porządkowe: Atrybuty, które zachowują wśród nich pewien porządek lub ranking, są atrybutami porządkowymi. Nie można przewidzieć kolejnych wartości, ale zachowana jest tylko kolejność. Przykład: rozmiar, gatunek itp.

D) Atrybuty liczbowe: Atrybuty reprezentujące mierzalne ilości są atrybutami liczbowymi. Są one reprezentowane przez liczby rzeczywiste lub całkowite. Przykład: temperatura, wilgotność.

@ Attribute wilgotność rzeczywista: deklaracja atrybutu liczbowego

E) Atrybuty ciągów: Te atrybuty przedstawiają listę znaków przedstawionych w cudzysłowach.

# 2) Format danych ARFF

WEKA pracuje na pliku ARFF do analizy danych. ARFF oznacza format pliku relacji atrybutów. Ma 3 sekcje: relacja, atrybuty i dane. Każda sekcja zaczyna się od „@”.

jak zainicjować kolejkę w java

Pliki ARFF mają atrybuty danych nominalnych, liczbowych, łańcuchowych, dat i relacyjnych. Niektóre z dobrze znanych zestawów danych uczenia maszynowego są obecne w WEKA jako ARFF.

Format ARFF to:

@relacja
@atrybut
@dane

Przykładem pliku ARFF jest:

@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes

# 3) Format danych XRFF

XRFF oznacza format pliku relacji atrybutów XML. Reprezentuje dane, które mogą przechowywać komentarze, atrybuty i wagi instancji. Ma rozszerzenie .xrff i .xrff.gz (format skompresowany). Pliki XRFF reprezentowały dane w formacie XML.

# 4) Łączność z bazą danych

Dzięki WEKA można łatwo połączyć się z bazą danych za pomocą sterownika JDBC. Sterownik JDBC niezbędny do połączenia się z bazą danych, przykład:

MS SQL Server (com.microsoft.jdbc.sqlserver.SQLServerDriver)

Wyrocznia (oracle.jdbc.driver.OracleDriver)

# 5) Klasyfikatory

Aby przewidzieć dane wyjściowe, WEKA zawiera klasyfikatory. Algorytmy klasyfikacyjne dostępne do uczenia to drzewa decyzyjne, maszyny wektorów nośnych, klasyfikatory oparte na instancjach i regresja logistyczna oraz sieci bayesowskie. W zależności od wymagań za pomocą prób i testów, użytkownik może znaleźć odpowiedni algorytm do analizy danych. Klasyfikatory służą do klasyfikowania zbiorów danych w oparciu o cechy atrybutów.

# 6) Klastrowanie

WEKA wykorzystuje kartę Klaster do przewidywania podobieństw w zbiorze danych. Na podstawie grupowania użytkownik może znaleźć atrybuty przydatne do analizy i zignorować inne atrybuty. Dostępne algorytmy grupowania w WEKA to k-średnie, EM, Cobweb, X-średnie i FarhtestFirst.

# 7) Stowarzyszenie

Jedynym algorytmem dostępnym w WEKA do wyszukiwania reguł asocjacji jest Apriori.

# 8) Miary sekcji atrybutów

WEKA stosuje 2 podejścia do najlepszego wyboru atrybutów do celów obliczeniowych:

Korzystanie z algorytmu metody wyszukiwania: Najpierw najlepszy, wybór do przodu, algorytm losowy, wyczerpujący, algorytm genetyczny i algorytm rankingu.
Korzystanie z algorytmów metody oceny: Oparte na korelacji, opakowanie, przyrost informacji, chi-kwadrat.

# 9) Wizualizacja

WEKA obsługuje reprezentację danych 2D, wizualizacje 3D z obrotem i reprezentację 1D pojedynczego atrybutu. Posiada opcję „Jitter” dla atrybutów nominalnych i „ukrytych” punktów danych.

Inne główne cechy WEKA to:

Jest to narzędzie typu open source z graficznym interfejsem użytkownika w postaci „Eksploratora”, „Eksperymentatora” i „Przepływu wiedzy”.
Jest niezależny od platformy.
Zawiera 49 narzędzi do wstępnego przetwarzania danych.
76 algorytmów klasyfikacji i regresji, 8 algorytmów grupowania jest obecnych w WEKA
Posiada 15 algorytmów wyboru atrybutów i 10 algorytmów wyboru cech.
Posiada 3 algorytmy do znajdowania reguły asocjacyjnej.
Korzystając z WEKA, użytkownicy mogą tworzyć własny kod do uczenia maszynowego.

Wniosek

W tym samouczku WEKA przedstawiliśmy wprowadzenie do oprogramowania WEKA Machine Learning o otwartym kodzie źródłowym i wyjaśniliśmy krok po kroku proces pobierania i instalacji. Widzieliśmy również pięć opcji dostępnych dla graficznego interfejsu użytkownika Weka, a mianowicie Explorer, Experimenter, Przepływ wiedzy, Środowisko pracy i Prosty interfejs CLI.

Dowiedzieliśmy się również o cechach WEKA z przykładami. Funkcje obejmują zestaw danych, format danych ARFF, łączność z bazą danych itp.

=> Odwiedź tutaj, aby zapoznać się z ekskluzywną serią uczenia maszynowego

Samouczek Weka - Jak pobrać, zainstalować i używać narzędzia Weka

Co to jest WEKA

Dlaczego warto korzystać z narzędzia WEKA Machine Learning

WEKA Pobieranie i instalacja

Graficzny interfejs użytkownika WEKA

1) Prosty interfejs CLI

# 2) Explorer

# 3) Experimenter

# 4) Przepływ wiedzy

# 5) Środowisko pracy

Cechy WEKA Explorer

# 1) Zbiór danych

# 2) Format danych ARFF

# 3) Format danych XRFF

# 4) Łączność z bazą danych

# 5) Klasyfikatory

# 6) Klastrowanie

# 7) Stowarzyszenie

# 8) Miary sekcji atrybutów

# 9) Wizualizacja

Wniosek

rekomendowane lektury

Ciekawe Artykuły

Wybór Redakcji

Dekadę później League of Legends jeszcze nie przyniosło zysków jako e-sport

Najnowsza łatka Pokemon Scarlet & Violet dodaje nowy sposób zawieszania gry

DLC Stranger of Paradise: Final Fantasy Origin przedstawia potężnego Gilgamesha

Spider-Man 2 z dziewięcioma nominacjami D.I.C.E

Wersja deweloperska Phasmofobii przedstawia nowe karty identyfikacyjne i mikrofony paraboliczne

Jak ewoluować Prismatic Missile w Luminaire w Vampire Survivors Tides of the Foscari

Square Enix przejmuje twórcę Jestem Setsuna, Tokyo RPG Factory

Letnia wyprzedaż PlayStation powraca przez najbliższe dwa tygodnie

Jak nauczyć Pokemona Egg Moves w kolorze Scarlet & Violet

Wszystkie odpowiedzi Kei Cabaret Club w Like a Dragon Gaiden

Pobierz grę Nintendo: Bayonetta Origins: Cereza and the Lost Demon

Jak zdobyć Mimic Tear Ashes w Elden Ring?