9 Komunikácia výsledkov

Zhrňme si, čo všetko už doteraz vieme

  • poznáme syntax Rka
  • vieme načítavať datasety z rôznych súborov a upravovať ich
  • pozerať sa na rôzne podvzorky
  • vieme zobrazovať a charakterizovať pravdepodobnostné rozdelenia premenných (stredná hodnota, variancia, histogram, funkcia hustoty…)
  • vieme zobrazovať a charakterizovať súvzťažnosť rôznych premenných (korelácia, lineárna regresia…)
  • poznáme základy štatistického testovanie hypotéz a vieme interpretovať výstupy týchto testov

9.1 R Markdown

Do skladačky nám ešte chýba nejaký elegantný spôsob ako všetky tieto veci robiť a spísať ich do uceleného zmysluplného textu, ako tieto veci odkomunikovať. Môžeme separátne urobiť štatistickú analýzu a potom nakopírovať tabuľky a obrázky do textového editora, v ktorom to upravíme. Toto je však dosť prácne. Pridáte jeden riadok do dátovej tabuľky a celé to môžete prerobiť odznovu. Ak chcete zmeniť nejaký aspekt výberu dát na začiatku (napr. obmedzím sa na nejakú zaujímavú a relevantnú podvzorku dát), tak znova to všetko môžete prerobiť. Rko nám však ponúka veľmi elegantnú alternatívu. Môžeme totiž písať dokumenty (html, pdf, docx) a robiť analýzu naraz a to priamo v Rku. Skrátka si výrazne uľahčíme (pos slovensky) workflow. Sú aj ďalšie veci, ktoré Rko vie: napr. produkovať aplikácie alebo webovské stránky. Aj táto webstránka, na ktorú sa práve pozeráte je vyrobená priamo v RStudio.

Otvoríme si nový RMarkdown dokument.

Uložíme ho (teraz som si uložil ako projekt.Rmd).

Takto potom vyzerá.

Po štuknutí na tlačítko Knit dostaneme takýto html dokument, ktorý je uložený v našom priečinku.

Syntax je priamočiara a stačí zopár základných pravidiel a budeme vedieť väčšinu užitočného. Do textu pridávame chunk-y, to sú kusy kódu. Napríklad tu sú chunky pre zobrazenie sumáru datasetu cars ako aj chunk na zobrazenie obrázka. Symbol ## slúži na definovanie podkapitoly, vidíme ako pridať odkaz na webstránku ako aj ako zvýrazniť text.

Užitočné vlastnosti chunkov sú tieto

  • echo - či sa zobrazí kus kódu alebo nie,
  • cache - či sa má znovu vykonať kus kódu (niektoré časti môžu dlho trvať, tak ich spustíme len raz),
  • warning - vie skryť upozornenia,
  • eval - či sa kus kódu má vykonať,
  • message - vie skryť správy,
  • error - ak nastavené na TRUE tak pokračuje v kompilácii aj keď narazí na chybu.

Pre chunky s obrázkami sú to

  • fig.show - či sa zobrazí obrázok alebo nie,
  • fig.cap - popisok obrázku,
  • out.width - šírka obrázka,
  • fig.asp - aspect ratio,
  • fig.align - zarovnanie (center ak na stred).

 

 

Je užitočné začať tu.

9.2 Cvičenia

Rmd súbor k cvičeniam

Inštrukcie na úspešné skompilovanie:

  • Stiahnite si súbor do adresára v ktorom budete pracovať
  • Zatvorte RStudio a otvorte Rmd súbor priamo z tohoto adresára. Teraz Vám správne nastaví current directory, toto skontrolujete príkazom getwd()
  • Do Vášho adresára nahrajte prázdny priečinok s menom tables. Do tohoto sa potom nahrá súbor s tabuľkami.
  • Nainštalujte si knižnice pacman a eatATA pomocou funkcie install.packages()
  • Stlačte tlačíko Knit
  • Doplňte časti chýbajúceho kódu.

Cvičenie 9.1 (Tutorial) Napíšte v RMarkdowne kratučký tutoriál, ktorý vysvetlí ako sa používa funkcia plot() v R. Postupne pridávajte komplikáciu za komplikáciou, aby bolo z kódu zreteľné, ako táto funkcia funguje.

Cvičenie 9.2 (predošlá úloha v RMD) Napíšte v RMarkdowne prvé dve cvičenia z Vašej poslednej domácej úlohy.