Techniki Data Mining w RDATA-MINING-R

Dostępne na zamówienie dla grup.

Żaden termin nie pasuje? Zaproponuj własny termin szkolenia

Tryb zdalny: online na żywo z trenerem i grupą. Zobacz więcej o kursach zdalnych i zakł. "Terminy".
Można: zrezygnować do 15 dni przed startem; w każdej chwili przejść z trybu "na sali" na zdalny.
Dostępne na zamówienie, w terminie i lokalizacji do uzgodnienia, dla grup od 4 osób.

cena netto
dla podmiotów publicznych - zwolnione z VAT

Cena szkolenia: 2990 PLN

poczęstunek w cenie

stanowisko komputerowe w cenie

first minute (30+ dni do startu) - 3%

Kategorie: Analiza danych i statystyka, R

Szkolenie przeznaczone jest dla osób, które chcą poznać podstawowe techniki data mining lub odświeżyć bądź uzupełnić swoją wiedzę na ich temat. Ideą szkolenia jest dokonanie przeglądu najpopularniejszych metod data mining, wskazanie obszarów ich stosowania oraz zapoznanie uczestników z implementacjami tychże metod w R. Po ukończeniu szkolenia, uczestnik będzie potrafił dobrać odpowiednią metodę do problemu, przed którym staje, wykonać obliczenia w R oraz zinterpretować ich wyniki. Omówione podczas szkolenia techniki są elementami składowymi bardziej złożonych algorytmów analizy danych. Uczestnik szkolenia nabędzie więc wiedzę i umiejętności niezbędne do dalszego zgłębiania tajników analizy danych i konstruowania własnych rozwiązań analitycznych.

Program szkolenia kładzie dużo większy nacisk na praktyczne stosowania omawianych technik niż na stojącą za nimi teorię. Teoretyczne aspekty analizy danych są uczestnikom sygnalizowane, tak by byli oni świadomi nie tylko zalet, ale też i wad stosowanych przez siebie metod.

Gros szkolenia stanowią warsztaty praktyczne, podczas których wykorzystywany jest język R. Podstawowa jego znajomość jest więc bardzo przydatnym atutem. Nie jest jednak obowiązkowa. Wszystkie wykorzystywane podczas szkolenia pakiety (czyli rozszerzenia) R są „samowystarczalne” – nie wymagają żadnej znajomości poleceń spoza omawianego podczas szkolenia obszaru.

Czas trwania

3 dni

Program

  1. Metody redukcji wymiaru
    • analiza składowych głównych (PCA, principal component analysis),
    • analiza czynnikowa (EFA, exploratory factor analysis),
    • skalowanie wielowymiarowe (MDS, multidimensional scaling).
  2. Analiza skupień (grupowanie, klastrowanie)
    • metoda K-średnich (K-means clustering),
    • grupowanie wokół centroidów (PAM, partitioning around medoids),
    • klastrowanie hierarchiczne (hierarchical clustering).
  3. Analiza dyskryminacyjna (klasyfikacja)
    • metoda K-najbliższych sąsiadów (KNN, K-nearest neighbours),
    • liniowa analiza dyskryminacyjna (LDA, linear discriminant analysis),
    • kwadratowa analiza dyskryminacyjna (QDA, quadratric discriminant analysis).
  4. Metoda wektorów nośnych (SVM, support vector machines)
  5. Drzewa klasyfikacyjne i regresyjne
    • drzewa klasyfikacyjne (classification trees),
    • drzewa regresyjne (regression trees),
    • las losowy (random forest).
  6. Metody weryfikacja jakości algorytmów i doboru wartości parametrów
    • sprawdzian krzyżowy (cross-validation),
    • bootrstrap.
  7. “Meta-techniki”
    • metody “zespołowe” (ensemble learning),
    • agregacja bootstrapowa (bootstrap aggregating, bagging),
    • wzmacnianie (boosting),
    • algorytm XGBoost.

Pobierz w wersji PDF

Training also available in English.

Przeznaczenie i wymagania

Brak szczegółowych wymagań wobec uczestników szkolenia.

Certyfikaty

Uczestnicy szkolenia otrzymują imienne certyfikaty sygnowane przez ALX.

Obecnie brak terminów

Podaj swój adres e-mail, a my powiadomimy Cię o przyszłych terminach

Masz pytanie?

Tu możesz zadać niezobowiązujące i szybkie pytanie na temat szkolenia

* Wyrażam zgodę na przetwarzanie danych osobowych przez ALX Academy sp. z o.o. z siedzibą w Warszawie w celu realizacji zgłoszenia.