Jak można analizować dane w firmie z wykorzystaniem pythona – podstawowe modele statystyczne
Przeznaczenie szkolenia
Ten kurs ma na celu zapoznanie uczestników w praktyczny sposób z podstawowymi modelami statystycznymi pakietami wykorzystywanymi w analizie danych. Uczestnik pozna pakiety numpy, scipy, statsmodel. Podczas zajęć uczestnik własnoręcznie zastosuje zdobytą wiedzę w analizę praktycznych problemów.
Odbiorca kursu
Szkolenie skierowane jest do:
- osób zainteresowanych wykorzystaniem pythona w codziennej pracy związanej z analizą danych, modelowaniem danych, robieniem wykresów statystycznych czy tworzeniem prezentacji/raportów z analizy
- studentów wszystkich kierunków studiów, gdzie przeprowadzona jest analiza danych (np. z ankiet, pomiarów, zebranych wyników doświadczeń itd.) czy modelowanie statystyczne
Wymagania wstepne: wiedza z zakresu szkolenia „Wprowadzenie do codziennej pracy z pythonem w firmie”
Ilość godzin szkoleniowych: 2 dni – 2 x 8h
Konspekt kursu
Środowisko programistyczne
- ipython
- Biblioteki: numpy, scipy, statsmodel, pandas
- Jupyter notebook
Manipulacja danymi
- Import danych z różnych źródeł
- Wielowymiarowe tablice danych
- Wczytywanie danych
- Obliczenia z wykorzystaniem numpy: agregacje, eksploracja funkcji, broadcasting
- Filtrowanie tablic
- Sortowanie tablic
- Łączenie i dzielenie tablic
- Tablice ustrukturyzowane
Ramki danych
- Tworzenie ramek danych
- Importowanie ramek danych z plików i innych źródeł
- Obiekty typu Series
- Obiekty typu Index
- Indeksowanie zmiennych i ramek danych
- Braki w danych
- Indeksy hierarchiczne
- Operacje na danych tekstowych
- Szeregi czasowe
- Wybrane operacje
Przetwarzanie danych
- Czyszczenie danych
- Transformacja danych
- Zmiana kształtu zbioru danych
- Tabele przestawne
- Usuwanie duplikatów
- Wykrywanie danych odstających
- Przekodowywanie danych
- Agregacja danych
- Operacje na grupach danych
Podstawy statystyki
- Czym jest statystyka?
- Rodzaje badań statystycznych
- Etapy w badaniu statystycznym
- Zmienne losowe dyskretne i ciągłe
- Metody doboru próby
Elementy wnioskowania statystycznego
- Podstawy weryfikacji hipotez
- Testy istotności, zgodności i niezależności
- Estymacja parametrów
- Przedziały ufności
- Testowanie hipotez statystycznych dla jednej populacji
- Testowanie hipotez statystycznych dla dwóch populacji
Korelacja i modele regresyjne
- Współczynnik korelacji, wykres rozrzutu
- Regresja liniowa
- Uogólniona regresja liniowa
- Odporne modele liniowe
- Regresja wieloraka
Analiza wariancji
Analiza szeregów czasowych
- ARMA
- VARMA
Najbliższe szkolenie
Do uzgodnienia. Osoby zainteresowane szkoleniem, prosimy o wysłanie formularza zgłoszeniowego.