Wariancja zbioru liczb to średnia wartość kwadratów różnic między poszczególnymi liczbami, a ich średnią arytmetyczną.
Wariancją liczb x 1 , x 2 , … , x n x_1,x_2,\ldots,x_n x 1 , x 2 , … , x n x_1,x_2,\ldots,x_n nazywamy liczbę σ 2 \sigma^2 σ 2 \sigma^2 daną wzorem:
σ 2 = ( x 1 − x ‾ ) 2 + ( x 2 − x ‾ ) 2 + … + ( x n − x ‾ ) 2 n \begin{aligned}
\sigma^2&=\frac{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\ldots+(x_n-\overline{x})^2}{n}
\end{aligned} σ 2 = n ( x 1 − x ) 2 + ( x 2 − x ) 2 + … + ( x n − x ) 2 \begin{aligned}
\sigma^2&=\frac{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\ldots+(x_n-\overline{x})^2}{n}
\end{aligned} (0) lub
σ 2 = x 1 2 + x 2 2 + … + x n 2 n − ( x ‾ ) 2 , \sigma^2=\frac{x_1^2+x_2^2+\ldots+x_n^2}{n}-(\overline{x})^2, σ 2 = n x 1 2 + x 2 2 + … + x n 2 − ( x ) 2 , \sigma^2=\frac{x_1^2+x_2^2+\ldots+x_n^2}{n}-(\overline{x})^2, (0) gdzie x ‾ \overline{x} x \overline{x} jest średnią arytmetyczną liczb x 1 , x 2 , … x n x_1,x_2,\ldots x_n x 1 , x 2 , … x n x_1,x_2,\ldots x_n .
Innymi słowy, wariancja to średnia arytmetyczna kwadratów różnić między danymi liczbami a ich średnią arytmetyczną (odchyleń od średniej).
Odchyleniem standardowym liczb x 1 , x 2 , … x n x_1,x_2,\ldots x_n x 1 , x 2 , … x n x_1,x_2,\ldots x_n nazywamy liczbę σ \sigma σ \sigma daną wzorem:
σ = ( x 1 − x ‾ ) 2 + ( x 2 − x ‾ ) 2 + … + ( x n − x ‾ ) 2 n \sigma=\sqrt{\frac{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\ldots+(x_n-\overline{x})^2}{n}} σ = n ( x 1 − x ) 2 + ( x 2 − x ) 2 + … + ( x n − x ) 2 \sigma=\sqrt{\frac{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\ldots+(x_n-\overline{x})^2}{n}} (0) gdzie x ‾ \overline{x} x \overline{x} jest średnią arytmetyczną liczb x 1 , x 2 , … x n x_1,x_2,\ldots x_n x 1 , x 2 , … x n x_1,x_2,\ldots x_n .
Odchylenie standardowe to nic innego niż pierwiastek kwadratowy z wariancji:
σ = σ 2 \sigma=\sqrt{\sigma^2} σ = σ 2 \sigma=\sqrt{\sigma^2} (0) Dodatkowo, wzór na wariancję można uprościć do wyrażenia:
σ 2 = x 1 2 + x 2 2 + … + x n 2 n − ( x ‾ ) 2 \sigma^2=\frac{x_1^2+x_2^2+\ldots+x_n^2}{n}-(\overline{x})^2 σ 2 = n x 1 2 + x 2 2 + … + x n 2 − ( x ) 2 \sigma^2=\frac{x_1^2+x_2^2+\ldots+x_n^2}{n}-(\overline{x})^2 (0)
Wariancja i odchylenie standardowe obrazują poziom rozproszenia danych wokół średniej arytmetycznej - im mniejsze odchylenie standardowe, tym więcej liczb jest bliżej średniej arytmetycznej.