Care este diferența dintre variație și abaterea standard?


Răspunsul 1:

Media tendinței centrale vă oferă ideea medie a punctelor de date (adică locația centrală a distribuției)

Și acum doriți să știți cât de departe sunt punctele dvs. de date

Deci, aici vine conceptul de varianță pentru a calcula cât de departe sunt punctele dvs. de date (în termeni simpli, este de a calcula variația punctelor dvs. de date față de medie)

Varianța populației:

i=1n(xiμ)2N\sum\limits_{i=1}^n \frac{(x_i-\mu)^2}{N}

Varianță de eșantion:

i=1n(xix)2n1\sum\limits_{i=1}^n \frac{(x_i-\overline{x})^2}{n-1}

Abaterea standard este pur și simplu rădăcina pătrată a variației. Și abaterea standard este utilizată, de asemenea, pentru a calcula variația punctelor dvs. de date

(Și este posibil să vă întrebați, de ce folosim abaterea standard, atunci când avem varianță. Deoarece, pentru a menține calculele în aceleași unități, adică să presupunem că media este în

cm/m,cm/m,

atunci variația este în

cm2/m2cm^2/m^2

, în timp ce abaterea standard este în

cm/mcm/m

, deci folosim cel mai mult abaterea standard)

abaterea standard a populației:

i=1n(xiμ)2N\sqrt{\sum\limits_{i=1}^n \frac{(x_i-\mu)^2}{N}}

deviație standard pentru eșantion:

i=1n(xix)2n1 \sqrt{\sum\limits_{i=1}^n \frac{(x_i-\overline{x})^2}{n-1}}


Răspunsul 2:

Abaterea standard este în unitățile de măsură originale, deci are relevanță practică. Acesta descrie cantitatea tipică care se scapă de valoarea medie.

Varianța este în unități pătrate, deci are o mică utilizare în descrierea efectivă a datelor. Utilitatea sa este într-adevăr doar ca o componentă critică a procedurilor care analizează modul în care mai multe variabile sunt legate, cum ar fi ANOVA, regresie liniară, etc. În esență, lucrul cu sume de abateri pătrate, care este numărătorul formulei de varianță, are proprietăți matematice mai bune.


Răspunsul 3:

Abaterea standard este în unitățile de măsură originale, deci are relevanță practică. Acesta descrie cantitatea tipică care se scapă de valoarea medie.

Varianța este în unități pătrate, deci are o mică utilizare în descrierea efectivă a datelor. Utilitatea sa este într-adevăr doar ca o componentă critică a procedurilor care analizează modul în care mai multe variabile sunt legate, cum ar fi ANOVA, regresie liniară, etc. În esență, lucrul cu sume de abateri pătrate, care este numărătorul formulei de varianță, are proprietăți matematice mai bune.