Odchylenie standardowe
Z Wikipedii
Odchylenie standardowe - klasyczna miara zmienności, obok średniej arytmetycznej najczęściej stosowane pojęcie statystyczne.
Odchylenie standardowe wartości cechy w populacji oznaczamy tradycyjnie przez σ (małe greckie sigma) i definiujemy jako pierwiastek kwadratowy wariancji. Dla skończonych populacji obliczamy je ze wzoru:
gdzie xi to kolejne wartości cechy w populacji, μ to wartość oczekiwana, N to liczba elementów w populacji.
Odchylenie standardowe w populacji można estymować odchyleniem standardowym z próby losowej, oznaczanym przez s. Odpowiedni wzór ma postać:
gdzie xi to kolejne wartości cechy elementów próby losowej, to średnia arytmetyczna z próby, zaś n to liczba elementów w próbie.
Odchylenie standardowe ma szereg własności, które powodują, że jest to miara bardzo przydatna w statystyce opisowej. Przede wszystkim jest ono wyrażone w tych samych jednostkach co wartości cechy, np. jeśli badamy wzrost ludzi w cm, to odchylenie standardowe również wyraża się w cm.
W praktyce często zakłada się, że dane podlegają rozkładowi normalnemu. Jeśli to założenie jest uzasadnione, wówczas prawdziwe są poniższe stwierdzenia:
- 68% wartości cechy leży w odległości od wartości oczekiwanej;
- 95,5% wartości cechy leży w odległości od wartości oczekiwanej;
- 99,7% wartości cechy leży w odległości od wartości oczekiwanej.
Ostatnie stwierdzenie jest również znane jako reguła trzech sigm.
W ogólnym przypadku, gdy rozkład cech nie jest znany, prawdziwa jest nierówność Czebyszewa: dla danego k > 1 prawdopodobieństwo, że wartość losowo wybranej cechy różni się od wartości oczekiwanej o więcej niż wynosi co najwyżej 1 / k2. Na przykład poza przedziałem leży co najwyżej 25% wartości cechy.