Błąd średniokwadratowy
Z Wikipedii
W statystyce błąd średniokwadratowy (ang. Mean Squared Error, MSE) estymatora T nieobserwowanego parametru θ definiowany jest jako:
MSE jest wartością oczekiwaną kwadratu "błędu", czyli rożnicy pomiędzy estymatorem i wartością estymowaną. Błąd średniokwadratowy spełnia tożsamość:
gdzie:
- D2 - oznacza wariancję estymatora T,
- b(T) = E[(T)] − θ, - to obciążenie estymatora.
Obciążenie estymatora jest różnicą między wartością oczekiwaną estymatora, a wartością szacowanego parametru.
Konkretny przykład. Załóżmy, że
czyli jest to próba losowa o liczności n z populacji o rozkładzie normalnym. Najczęściej używane estymatory σ2 to:
gdzie
jest średnią z próby. Pierwszy z tych estymatorów to estymator największej wiarygodności, który jest obciążony, tj. jego obciążenie jest niezerowe, ma jednak mniejszą wariancję od drugiego, który jest nieobciążony. Mniejsza wariancja w pewien sposób kompensuje obciążenie, tak że średni błąd kwadratowy obciążonego estymatora jest nieco mniejszy niż nieobciążony.
Niekiedy, zamiast błędem średniokwadratowym, posługujemy się RMSE (ang. root mean squared error), który jest po prostu pierwiastkiem kwadratowym z MSE.