Jak można analizować dane w firmie z wykorzystaniem pythona – podstawowe modele statystyczne

Przeznaczenie szkolenia

Ten kurs ma na celu zapoznanie uczestników w praktyczny sposób z podstawowymi modelami statystycznymi pakietami wykorzystywanymi w analizie danych. Uczestnik pozna pakiety numpy, scipy, statsmodel. Podczas zajęć uczestnik własnoręcznie zastosuje zdobytą wiedzę w analizę praktycznych problemów.

Odbiorca kursu

Szkolenie skierowane jest do:

  • osób zainteresowanych wykorzystaniem pythona w codziennej pracy związanej z analizą danych, modelowaniem danych, robieniem wykresów statystycznych czy tworzeniem prezentacji/raportów z analizy
  • studentów wszystkich kierunków studiów, gdzie przeprowadzona jest analiza danych (np. z ankiet, pomiarów, zebranych wyników doświadczeń itd.) czy modelowanie statystyczne

Wymagania wstepne: wiedza z zakresu szkolenia „Wprowadzenie do codziennej pracy z pythonem w firmie”

Ilość godzin szkoleniowych: 2 dni – 2 x 8h

Konspekt kursu

Środowisko programistyczne

  • ipython
  • Biblioteki: numpy, scipy, statsmodel, pandas
  • Jupyter notebook

Manipulacja danymi

  • Import danych z różnych źródeł
  • Wielowymiarowe tablice danych
  • Wczytywanie danych
  • Obliczenia z wykorzystaniem numpy: agregacje, eksploracja funkcji, broadcasting
  • Filtrowanie tablic
  • Sortowanie tablic
  • Łączenie i dzielenie tablic
  • Tablice ustrukturyzowane

Ramki danych

  • Tworzenie ramek danych
  • Importowanie ramek danych z plików i innych źródeł
  • Obiekty typu Series
  • Obiekty typu Index
  • Indeksowanie zmiennych i ramek danych
  • Braki w danych
  • Indeksy hierarchiczne
  • Operacje na danych tekstowych
  • Szeregi czasowe
  • Wybrane operacje

Przetwarzanie danych

  • Czyszczenie danych
  • Transformacja danych
  • Zmiana kształtu zbioru danych
  • Tabele przestawne
  • Usuwanie duplikatów
  • Wykrywanie danych odstających
  • Przekodowywanie danych
  • Agregacja danych
  • Operacje na grupach danych

Podstawy statystyki

  • Czym jest statystyka?
  • Rodzaje badań statystycznych
  • Etapy w badaniu statystycznym
  • Zmienne losowe dyskretne i ciągłe
  • Metody doboru próby

Elementy wnioskowania statystycznego

  • Podstawy weryfikacji hipotez
  • Testy istotności, zgodności i niezależności
  • Estymacja parametrów
  • Przedziały ufności
  • Testowanie hipotez statystycznych dla jednej populacji
  • Testowanie hipotez statystycznych dla dwóch populacji

Korelacja i modele regresyjne

  • Współczynnik korelacji, wykres rozrzutu
  • Regresja liniowa
  • Uogólniona regresja liniowa
  • Odporne modele liniowe
  • Regresja wieloraka

Analiza wariancji

Analiza szeregów czasowych

  • ARMA
  • VARMA

Najbliższe szkolenie

Do uzgodnienia. Osoby zainteresowane szkoleniem, prosimy o wysłanie formularza zgłoszeniowego.

* Wyrażam zgodę na przechowywanie i przetwarzanie danych osobowych dla potrzeb procesu realizacji zgłoszenia na szkolenie dla Data Science Consulting sp. z o.o., ul. Kościelna 37, 41-700 Ruda Śląska, zgodnie z Ustawą z dnia 29.08.1997 o Ochronie Danych Osobowych Dz. U. Nr 133 poz. 883). Jestem świadom(a) faktu, że przysługuje mi prawo wglądu do swoich danych, prawo do ich poprawiania oraz prawo do żądania zaprzestania ich przetwarzania.

Wyrażam zgodę na przechowywanie i przetwarzanie danych osobowych w celach marketingowych Data Science Consulting sp. z o.o., ul. Kościelna 37, 41-700 Ruda Śląska, zgodnie z Ustawą z dnia 29.08.1997 o Ochronie Danych Osobowych Dz. U. Nr 133 poz. 883). Jestem świadom(a) faktu, że przysługuje mi prawo wglądu do swoich danych, prawo do ich poprawiania oraz prawo do żądania zaprzestania ich przetwarzania.

* pola wymagane