Wielowymiarowy rozkład normalny
Z Wikipedii
Wielowymiarowy rozkład normalny - rozkład wielowymiarowej zmiennej losowej, będący uogólnieniem rozkładu normalnego na n wymiarów.
Spis treści |
[edytuj] Definicja
n-wymiarowa zmienna losowa podlega n-wymiarowemu rozładowi normalnemu jeśli dowolna kombinacja liniowa
jej składowych ma rozkład normalny.
Funkcja gęstości n-wymiarowego rozkładu normalnego wektora losowego o wektorze wartości oczekiwanych
i macierzy kowariancji
dana jest wzorem:
Oznacza się to w skrócie zapisem
[edytuj] Niezależność zmiennych
Dla wielowymiarowego rozkładu normalnego jeśli składowe wektora losowego o wielowymiarowym rozkładzie normalnym są niezależne to są nieskorelowane i odwrotnie, jeśli są nieskorelowane to są niezależne. Wówczas funkcja gęstości wektora losowego
jest iloczynem funkcji gęstości każdej ze zmiennych:
Zmienne losowe (nawet nieskorelowane) o rozkładzie normalnym nie muszą razem tworzyć wektora o wielowymiarowym rozkładzie normalnym. Wówczas powyższa zależność nie musi być prawdziwa. Na przykład, niech , niech
przyjmuje wartości 1 i -1 z równym prawdopodobieństwem 0.5 oraz niech
. Wówczas
i
są nieskorelowane, normalne, ale są zależne. Nie tworzą one jednak wielowymiarowego rozkładu normalnego. Cała masa prawdopodobieństwa ich wspólnego rozkładu znajduje się na prostych y=x, y=-x, podczas gdy nośnikiem wielowymiarowego rozkładu normalnego jest całą płaszczyzna
. W szczególności zmienna x + y ma rozkład mieszany (dyskretno-ciągły), i z prawdopodobieństwem 0.5 przyjmuje wartość 0, a więc nie jest spełniona definicja wielowymiarowego rozkładu normalnego: pewna kombinacja liniowa składowych wektora losowego nie ma rozkładu normalnego.
[edytuj] Estymacja parametrów
Mając dane n wektorów pobranych z pewnego wielowymiarowego rozkładu normalnego możemy oszacować jego parametry w następujący sposób:
Estymator wartości oczekiwanej:
Estymator macierzy kowariancji o największej wiarygodności :
Estymator nieobciążony macierzy kowariancji:
[edytuj] Symulacja
W celu uzyskania wektora losowego o rozkładzie danym przez wektor średni i macierz kowariancji
, postępujemy według następującego algorytmu:
- Tworzymy wektor
n niezależnych zmiennych losowych o standardowym rozkładzie normalnym, stosując np. metodę Boxa-Mullera.
- Stosujemy rozkład Choleskiego względem macierzy
, tak by otrzymać macierz
, dla której zachodzi: AAT = Σ
- Szukany wektor to