Analiza statystyczna w R - od podstaw w 3 dniR-INTRO-LONG

Obecnie brak terminów otwartych

Zdalnie
  • 20.10
  • 23.10 (Z)
Warszawa
  • 20.10
  • 23.10 (Z)
Z - zaoczny
Żaden termin nie pasuje? Zaproponuj własny termin szkolenia

Tryb zdalny: online na żywo z trenerem i grupą. Zobacz więcej o kursach zdalnych i zakł. "Terminy".
Zajęcia stacjonarne - są również dostępne (wznowione od 7 czerwca 2021).
Można: zrezygnować do 15 dni przed startem; w każdej chwili przejść z trybu "na sali" na zdalny.
Dostępne również na zamówienie, w terminie i lokalizacji do uzgodnienia, dla grup od 6 osób.

4,8/5 (102)
Stars
cena netto
dla podmiotów publicznych - zwolnione z VAT

Cena szkolenia: 1840 PLN

poczęstunek w cenie

stanowisko komputerowe w cenie

Analiza statystyczna w R - od podstaw w 3 dni

Kategorie: Analiza danych i statystyka, R

Dla wszystkich kursantów, którzy chcą poznać tajniki analizy danych w najszybciej zyskującym popularność programie statystycznym przygotowaliśmy to kompleksowe szkolenie.
Wiedzę o programie R uzyskaną na początku szkolenia kursanci będą mogli od razu wykorzystać podczas nauki podstaw statystyki. Drugiego dnia skupiamy się na regresji liniowej – jednej z podstawowych metod analizy stosowanej w małych i dużych firmach. Trzeciego dnia poszerzamy znajomość R i uczymy się wykorzystywać jego możliwości do prezentowania wyników w formie czytelnych wykresów.

Szkolenie prowadzone jest w formie warsztatów, gdzie teoria przeplata się z praktyką umożliwiając natychmiastowe przećwiczenie nowo poznanych narzędzi na życiowych, praktycznych przykładach.

Szkolenie jest dość intensywne i skupia się na warsztacie analityka – poznaniu środowiska R i wykorzystaniu go do przeprowadzenia przerabianych przykładów. Nie uczymy tutaj samych idei/fundamentów analizy danych od podstaw. Osobom, które dopiero zaczynają przygotowanie do pracy analityka, sugerujemy nasz dłuższy kurs Analiza danych w R.

Czas trwania

3 dni

Program

  1. Wprowadzenie do R i RStudio
    • R jako język programowania i RStudio jako wygodny interfejs użytkownika
    • Typy danych w R: skalar, wektor, macierz, ramka danych, factor, lista
    • R jako kalkulator: operatory arytmetyczne, porównawcze i logiczne, rodzaje poleceń: wyrażenia vs przypisania
    • Przetwarzanie danych: wybór elementów wektora/macierzy na podstawie indeksów, tworzenie nowych kolumn w ramce danych, wybór wierszy z ramki danych na podstawie warunków
    • Podstawowa analiza danych numerycznych (obliczanie średniej, sumy, itp.) i tekstowych (tabela częstości)
  2. Statystyka opisowa i wizualizacja danych w R
    • Rodzaje danych statystycznych: ilościowe vs jakościowe
    • Obliczanie i interpretacja statystyk opisowych dotyczących wartości przeciętnej, zróżnicowania oraz kształtu rozkładu zmiennej ilościowej
    • Nieparametryczne miary rozkładu: dominanta/moda, mediana, kwartyle, decyle, kwantyle
    • Podsumowanie rozkładu zmiennej jakościowej – tabele częstości
    • Analiza graficzna rozkładu zmiennej ilościowej – histogram i wykres ramkowy
    • Analiza graficzna zmiennej jakościowej – wykres słupkowy, kołowy
    • Dostosowywanie opcji graficznych w R (marginesy)
    • Dodawanie nowych elementów do wykresów (legenda, punkty, linie)
    • Zestawianie kilku wykresów w jednym oknie graficznym
    • Analiza i wizualizacja danych w podgrupach
  3. Wnioskowanie statystyczne
    • Popularne rozkłady prawdopodobieństwa, m.in. jednostajny, normalny, t-Studenta, Chi-kwadrat, F-Snedecora
    • Generowanie liczb (pseudo)losowych, określanie ziarna generatora
    • Estymacja punktowa vs. estymacja przedziałowa: przedział ufności, poziom istotności, wartość p
    • Testowanie hipotez dotyczących średniej i wariancji w jednej próbie
    • Testowanie hipotez dotyczących porównania średniej i wariancji w dwóch próbach zależnych i dwóch próbach niezależnych
    • Analiza korelacji liniowej Pearsona i Spearmana dla zmiennych ilościowych
    • Analiza zależności dla zmiennych jakościowych (test chi-kwadrat)
    • Testowanie hipotez dotyczących średniej i wariancji w więcej niż dwóch próbach niezależnych (jednoczynnikowa ANOVA), testy porównań wielokrotnych
    • Testy nieparametryczne do porównywania rozkładów: test znaków, test Wilcoxona-Manna-Whitney’a, test rangowanych znaków Wilcoxona, test Kruskala-Wallisa
    • Testy dla wskaźnika struktury w jednej próbie oraz dwóch i więcej próbach zależnych i niezależnych: test chi-kwadrat, test McNemara, test Cochrana
  4. Analiza regresji liniowej w R
    • Założenia modelu regresji liniowej, interpretacja wyników regresji (parametry, dopasowanie, istotność zmiennych i modelu)
    • Jakościowe zmienne objaśniające w modelu – rozkodowanie na zmienne zero-jedynkowe
    • Wykrywanie obserwacji nietypowych
    • Testowanie hipotez prostych i złożonych, metoda od ogólnego do szczególnego, metody automatycznego doboru zmiennych
    • Diagnostyka modelu, testowanie spełnienia założeń: testowanie normalności reszt, testowanie współliniowości, testowanie poprawności formy funkcyjnej, testowanie stabilności parametrów, testowanie homoskedastyczności, testowanie braku autokorelacji
    • Postępowanie w przypadku niespełnienia założeń
    • Zlogarytmowana zmienna zależna – interpretacja wyników modelu (elastyczności, semi-elastyczności)
    • Prognozowanie na podstawie oszacowanego modelu, sprawdzanie jakości prognozy, podział na próbę uczącą i testową

Pobierz w wersji PDF

Training also available in English.

Przeznaczenie i wymagania

Znajomość statystyki ani R nie jest konieczna do uczestnictwa w szkoleniu.

Certyfikaty

Uczestnicy szkolenia otrzymują imienne certyfikaty sygnowane przez ALX.

Zapisz się

Wybierz interesujący Cię termin oraz miasto

Zdalnie:
Warszawa:

Żaden termin nie pasuje?

Podaj swój adres e-mail, a my powiadomimy Cię o przyszłych terminach

Masz pytanie?

Tu możesz zadać niezobowiązujące i szybkie pytanie na temat szkolenia

* Wyrażam zgodę na przetwarzanie danych osobowych przez „ALX” Sp. z o.o. Sp. k. z siedzibą w Warszawie w celu realizacji zgłoszenia.