Program R-CRAN jest obecnie jednym z najpopularniejszych programów do statystycznej i ekonometrycznej analizy danych. Jego siłą jest darmowość (licencja pozwala na wykorzystywanie programu bezpłatnie także w zastosowaniach komercyjnych), wszechstronność (stale tworzone są nowe pakiety zawierające procedury statystyczne wykorzystywane w m. in. analizach ekonometrycznych, psychometrycznych, socjologicznych, geologicznych pogodowych czy biomedycznych) oraz olbrzymia społeczność użytkowników współtworząca nowe pakiety i wspierająca się nawzajem za pośrednictwem internetowych forów. R jest również najlepszym obecnie programem do wizualizacji danych.
Kurs jest przeznaczony dla osób, które chcą opanować zaawansowane metody analizy i wizualizacji danych i/lub opanować w stopniu zaawansowanym program R. Biegłe posługiwanie się tym programem wymaga poznanie specjalistycznego języka poleceń, który jest językiem programistycznym (wszystkie polecenia wydaje się wyłącznie za pomocą odpowiednich komend). Dlatego ok. 50% czasu zajęciowego zostanie przeznaczone na szczegółowe omawianie języka używanego w R.
Szczegółowa tematyka kursu:
• Podstawy obsługi R – omówienie edytora R-Studio, instalowanie pakietów, import danych, podstawowe komendy, typy obiektów, specyfika pracy w R.
• Eksploracyjna analiza danych – praca na tabelach danych, pakiety: dplyr, tidyr, plyr, data.table
• Podstawy wizualizacji w R – pakiet base i graphics
• Tworzenie diagramów w R – pakiet diagram
• Wizualizacja danych 2D cz. 1– pakiet ggplot2 i jego rozszerzenia
• Wizualizacja danych 2D cz. 2 – przegląd wykresów
• Wizualizacja danych 2D cz. 3– tabele danych, złożone wykresy i infografiki
• Wizualizacja danych 3D cz. 1– pakiety lattice oraz scatterplot3d
• Wizualizacja danych 3D cz. 2 – przegląd wykresów
• Sztuka tworzenia efektywnych i ciekawych wykresów
• Interaktywne wykresy – pakiety RCharts, htmlwidgets, ggvis
• Wizualizacja wyników analiz statystycznych cz. 1 – rysowanie przedziałów ufności, wizualizacja wyników regresji liniowej, korelogramy
• Wizualizacja wyników analiz statystycznych cz. 2– PCA, klasteryzacja, klasyfikacja, text mining (analiza sieci)
• Podstawy programowania w R – instrukcje warunkowe, pętle, rodzina funkcji apply(), praca na obiektach w R, tworzenie własnych funkcji, tworzenie animacji w R
• Automatyzacja pracy – parametryzacja kodu i powtarzalność analiz
• Tworzenie automatycznych raportów i prezentacji za pomocą Rmarkdown
- Teacher: Piotr Ćwiakowski