10 Opakovanie

Prebrali sme tieto témy:

  • Interpretácia pravdepodobnosti,
  • Pravdepodobnostný priestor a jeho vlastnosti,
  • Podmienená pravdepodobnosť a Bayesova veta,
  • Náhodná premenná,
  • Diskrétne náhodné premenné,
  • Spojité náhodné premenné,
  • Súvis medzi náhodnými premennými,
  • Zákon veľkých čísel,
  • Centrálna limitná veta.

Zaviedli sme si nasledovné pojmy, ktorých definíciu musíme poznať. Nové pojmy boli vždy označované hrubým písmom:

  • Pravdepodobnostný priestor - množina potenciálnych dopadnutí experimentu \(\Omega\), množina udalostí \(\mathcal{F}\), pravdepodobnosť \(P\),
  • Rozklad množiny,
  • Nezávislosť udalostí,
  • Podmienená pravdepodobnosť,
  • Náhodná premenná,
  • Kumulatívna distribučná funkcia,
  • Pravdepodobnostná funkcia,
  • Funkcia hustoty pravdepodobnosti,
  • Stredná hodnota,
  • Variancia,
  • Smerodajná odchýlka,
  • Medián,
  • Združená kumulatívna distribučná funkcia,
  • Združená pravdepodobnostná funkcia,
  • Združená funkcia hustoty pravdepodobnosti,
  • Nezávislosť náhodných premenných,
  • Kovariancia,
  • Korelácia,
  • Konvergencia podľa pravdepodobnosti,
  • Konvergencia podľa distribúcie.

Taktiež musíme poznať vlastnosti týchto objektov a aké sú medzi nimi vzťahy. Je dôležité poznať tieto vzťahy:

  • Náhodná premenná a pravdepodobnostný priestor,
  • Kumulatívna distribučná funkcia a pravdepododobnosť,
  • Kumulatívna distribučná funkcia a pravdepodobnostná funkcia,
  • Kumulatívna distribučná funkcia a funkcia hustoty,
  • Stredná hodnota, variancia a pravdepodobnosntná funkcia,
  • Stredná hodnota, variancia a funkcia hustoty,
  • Stredná hodnota a kovariancia.
  • Stredná hodnota, smerodajná odchýlka a korelácia.

Hovorili sme tiež o týchto vetách/tvrdeniach:

  • Bayesova veta,
  • Linearita strednej hodnoty: \(\text{E}[aX+bY] = a\text{E}[X] + b\text{E}[Y]\),
  • Vzťah pre varianciu: \(\text{Var}[X] = \text{E}[X^2] - (\text{E}[X])^2\),
  • Variancia lineárnej transformácie: \(\text{Var}[aX+b] = a^2\text{Var}[X]\),
  • Z nezávislosti náhodných premenných vyplýva, že sú nekorelované (naopak to neplatí),
  • Pre varianciu platí \(\text{Var}[X+Y] = \text{Var}[X] + \text{Var}[Y] + 2\text{Cov}[X,Y]\),
  • Markovova nerovnosť,
  • Čebyševova nerovnosť,
  • Zákon veľkých čísel,
  • Z konvergencie podľa pravdepodobnosti vyplýva konvergencia podľa distribúcie (naopak to neplatí),
  • Centrálna limitná veta.

Dosť času sme strávili aj spoznávaním rôznych pravdepodobnostných distribúcií, či už diskrétne alebo spojite rozdelených:

  • Diskrétne: Rovnomerné, Bernoulliho, Binomické, Poissonovo, Geometrické, Hypergeometrické a Negatívne binomické,
  • Spojité: Rovnomerné, Normálne, Exponenciálne, Chí-kvadrát a Studentovo.

Ambíciou tohoto kurzu bolo zjednodušiť prechody medzi rôznymi spôsobmi popisu typu náhodnosti. Ak máme kompletnú informáciu o pravdepodobnostnom správaní, napríklad formou kumulatívnej distribučnej funkcie, musíme byť schopný odvodiť všetko ostatné. Napríklad funkciu hustoty alebo jej charakteristiky ako napríklad strednú hodnotu, varianciu, smerodajnú odchýlku alebo medián. Familiarita a plynulosť prechodu je to, o čo sme sa snažili. Znalosť tohoto jazyka je nutnou podmienkou úspešného pokračovania v štúdiu pravdepodobnosti a štatistiky, ako aj praktickej dátovej analýzy.

Cvičné otázky

  • Zadefinujte pravdepodobnostný priestor a náhodnú premennú, ktoré budú zodpovedať súčtu počtu bodiek na dvoch nezávisle hodených kociek.
  • Dokážte, že so spojitej aditivity pravdepodobnosti vyplýva aj konečná aditivita.
  • Aká je stredná hodnota náhodnej premennej ktorá nadobúda hodnoty \(1,2,3,4,5\) s pravdepodobnosťami \(\frac{c}{1}, \frac{c}{2},\frac{c}{3},\frac{c}{4},\frac{c}{5},\) kde \(c\) je konštanta.
  • Načrtnite kumulatívnu distribučnú funkciu náhodnej premennej, ktorá označuje počet bodiek, ktorý padne na férovej kocke.
  • Vymyslite pravdepodobnostný priestor a dve funkcie \(\Omega \rightarrow \mathbb{R},\) také, že jedna z nich bude náhodná premenná ale druhá nebude.
  • Majme diagnostický test so špecificitou 90% a senzitivitou 99%. Vypočítajte pravdepodobnosť choroby v prípade, že test je pozitívny.
  • Majme dve náhodné premenné \(X\) a \(Y\) také, že \(P(X=0,Y=0)=0.06\), \(P(X=1,Y=0)=0.24\), \(P(X=0,Y=1)=0.14\), \(P(X=1,Y=1)=0.56.\) Vypočítajte \(\text{Cov}[X,Y].\) Sú náhodné premenné \(X\) a \(Y\) nezávislé?
  • Uvažujme náhodnú premennú \(Y\) o ktorej vieme, že \[\begin{eqnarray*} p_Y(1) &=& 0.2,\\ p_Y(2) &=& 0.3,\\ p_Y(3) &=& 0.5.\\ \end{eqnarray*}\] Vypočítajte \(\text{E}[Y], \text{Var}[Y], \text{sd}[Y].\)
  • Majme náhodnú premennú s nasledovnou funkciu hustoty pravdepodobnosti: \[\begin{equation*} f_X(x)= \begin{cases} c(x - \frac{x^3}{4}), & \text{ak}\ x \in (0,2), \\ 0, & \text{inak}. \end{cases} \end{equation*}\] Vypočítajte hodnotu konštanty \(c.\) Nájdite a načrtnite jej kumulatívnu distribučnú funkciu. Vypočítajte jej strednú hodnotu, varianciu, medián a \(P(|X-1| \leq 0.5)\)
  • Majme náhodné premenné \(X,Y\) s nasledovnou združenou funkciou hustoty \[\begin{equation*} f_{XY}(x,y)= \begin{cases} cy^3, & \text{ak}\ x \in [0,3], \ y \in [0,1],\\ 0, & \text{inak}. \end{cases} \end{equation*}\] Vypočítajte hodnotu konštanty \(c,\) \(P(X+Y > 2),\) \(P(X > Y),\) \(P(X = 3Y),\) \(\text{E}[Y],\) \(\text{Cov}[X,Y].\)
  • Aké je pravdepodobnostné rozdelenie počtu uhádnutých otázok na ABC teste z celkového počtu 10 otázok, ak vieme, že z prvých troch otázok otázok bola správne zodpovedaná práve jedna otázka?
  • Nech je pravdepodobnosť nárazu asteroidu na zem \(1/10000\) za rok. Aká je pravdepodobnosť, že za 200 rokov narazí asteroid práve jedenkrát?
  • Ktorým pravdepodobnostným rozdelením by ste modelovali: počet dopravných nehôd? Dobu kým nastavne ďalšia dopravná nehoda? Počet neúspešných žiadostí o grant, kým sa Vám to nepodarí? Výšku afrických slonov? Chybu merania? Priemer z veľkého množstva nezávislých náhodných premenných?
  • Napíšte názov pravdepodobnostného rozdelenie, pre ktoré nemôžeme použiť Zákon veľkých čísel.
  • Skonštruujte dve nekorelované náhodné premenné, ktoré nie sú nezávislé.
  • Majme postupnosť \(X_1, X_2,\dots\) náhodných premenných so strednou hodnotou \(3\) a varianciou \(1\). Aspoň akú veľkú musíme nastaviť hodnotu \(n\) tak, aby platilo, že \[P(3 < \bar{X}_n < 4) \geq 0.8.\] Porovnajte výsledky založené na základe Čebyševovej nerovnosti a Centrálnej limitnej vety.
  • Zo skúseností vieme, že na matematický ples sa lístky veľmi rýchlo vypredajú: každý človek v rade si kúpi v priemere 2.3 lístkov zo smerodajnou odchýlkou 2. Máme 250 voľných miest a v rade čaká 100 ľudí. Aproximujte pravdepodobosť, že sa každému ujde toľko lístkov, koľko chce. Explicitne pomenujte zjednodušujúce predpoklady, ktoré urobíte.
  • Majme 100 mužov na palube lietadla, hmotnosť každého z nich má strednú hodnotu 80 a smerodajnú odchýlku 10. Pomocou CLV aproximujte pravdepodobnosť, že ich celková hmotnosť nepresiahne 9000kg. Uvažujte, že ich váhy sú nezávislé.

Domáca úloha 9

Prosím odovzdať do 8.5.2023 do 19:59.

Cvičenie 10.1 (DÚ 9.1)

  • Uvedťe príklad na reálnu situáciu, kedy frekventistická interpretácia pravdepodobnosti nie je adekvátna.

  • Doplňte:

    • \(P: \ \ \ \ \rightarrow \ \ \ \ \)
    • \(X: \ \ \ \ \rightarrow \ \ \ \ \)
    • \(f_X: \ \ \ \ \rightarrow \ \ \ \ \)
    • \(F_X: \ \ \ \ \rightarrow \ \ \ \ \)
    • \(X \sim Pois(3), \text{E}[X] = \ \ \ , \text{Var}[X] = \ \ \ \ .\)
    • \(X \sim N(0,3^2), Y = 2X + 3, \text{E}[Y] = \ \ \ , \text{Var}[Y] = \ \ \ \ .\)
    • \(X \sim N(0,2^2), Y \sim Bern(0.2), \text{Cov}[X,Y] = 0, Z = X - 3Y\), \(\text{E}[Z] = \ \ \ \, \text{Var}[Y] = \ \ \ .\)
    • Nech \(X \sim Bin(10,0.3)\). Vypočítajte \(P(X=0) = \ \ \ \ \).
    • Nech \(X \sim Geom(0.3)\). Vypočítajte \(P(X=1) = \ \ \ \ \).
    • Ak \(\text{E}[X] = 0\) a \(\text{sd}[X] = 1\) potom \(\text{E}[X^2] = \ \ \ \ .\)

Cvičenie 10.2 (DÚ 9.2)

  • Aká je stredná hodnota a variancia náhodnej premennej ktorá nadobúda hodnoty \(1,2,3,4\) s pravdepodobnosťami \(\frac{c}{1}, \frac{c}{2},\frac{c}{3},\frac{c}{4},\) kde \(c\) je konštanta.

  • Majme test, ktorého senzitivita je \(90\%\) a špecificita \(99.9\%\). Nech je prevalencia choroby \(3\%\). Aká je pravdepodobnosť, že náhodne vybraný človek s pozitívnym testom bude chorý? Porovnajte (kvalitatívne) s človekom, ktorý by nebol náhodne vybraný ale vykazoval by príznaky choroby.

  • Dvakrát za sebou hodíme (nezávisle) férovou kockou. Zostrojte pravdepodobnostnú funkciu náhodnej premennej súčtu počtu bodiek na týchto dvoch hodoch.

Cvičenie 10.3 (DÚ 9.3)

  • Uvedťe príklad pravdepodobnostného priestoru a dvoch funkcií \(\Omega \rightarrow \mathbb{R}\) takých, že jedna z nich je a druhá nie je náhodnou premennou. Vaša odpoveď nech je konkrétna, detailná a úplná.

  • Ktoré diskrétne pravdepodobnostné rozdelenie zvykneme (ale nie vždy!) používať na modelovanie počtu udalostí.

  • Ktoré spojité pravdepodobnostné rozdelenie zvykneme používať na modelovanie životnosti súčiastky, ktorá “nestarne” ?

Cvičenie 10.4 (DÚ 9.4)

  • Majme náhodnú premennú \(X\) s nasledovnou funkciu hustoty pravdepodobnosti: Upozornenie: chýbala konštanta \(\frac{15}{7}\)

\[\begin{equation*} f_X(x)= \begin{cases} \frac{15}{7} \left( x - \frac{x^5}{5} \right), & \text{ak}\ x \in (0,c), \\ 0, & \text{inak}. \end{cases} \end{equation*}\] Nájdite c a načrtnite jej kumulatívnu distribučnú funkciu.

  • Vyberte si jedno konkrétne spojité pravdepodobnostné rozdelenie a napíšte jeho funkciu hustoty, kumulatívnu distribučnú funkciu, strednú hodnotu a varianciu.

Cvičenie 10.5 (DÚ 9.5)

  • Rozhodnite o správnosti nasledovných tvrdení a zdôvodnite:

    • Najmenšia možná množina udalostí \(\mathcal{F}\) má práve dva prvky.
    • Stredná hodnota a variancia jednoznačne definujú náhodnú premennú.
    • Nech \(X\) a \(Y\) sú náhodné premenné. Z tvrdenia \(E[X \cdot Y] = 0\) vyplýva nezávislosť \(X\) a \(Y\).
    • Zákon Veľkých Čísel hovorí o pravdepodobnostom správaní sa aritmetického priemeru vypočítaného z postupnosti nezávislých náhodných premenných.
    • Centrálna Limitná Veta hovorí o konvergencii podľa pravdepodobnosti.
  • Ukážte, že platí \(\text{Cov}[aX+b,cY+d] = ac \cdot \text{Cov}[X,Y]\).

  • Majme postupnosť \(X_1, X_2,\dots\) náhodných premenných so strednou hodnotou \(5\) a varianciou \(4\). Aspoň akú veľkú musíme nastaviť hodnotu \(n\) tak, aby platilo, že \[P(3 \leq \bar{X}_n \leq 7) \geq 0.95.\] Porovnajte výsledky založené na základe Čebyševovej nerovnosti a Centrálnej limitnej vety.

 

 

 

[Budem veľmi rád za akúkoľvek spätnú väzbu. Preklepy, logické chyby, nejasnosti. Ďakujem!]