Metoda Hellwiga
Z Wikipedii
Metoda Hellwiga, zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji - formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1969 roku przez Zdzisława Hellwiga.
Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.
Spis treści |
[edytuj] Liczba kombinacji
Jeżeli mamy m potencjalnych zmiennych objaśniających, to liczba wszystkich kombinacji jest równa:
L = 2m − 1
[edytuj] Indywidualna pojemność nośników informacji
Dla wszystkich otrzymanych kombinacji definiujemy tzw. Indywidualną pojemność nośników informacji, która określona jest wzorem:
,
gdzie:
- k - numer kombinacji (k=1,2,...,2m-1),
- mk - liczba zmiennych w k-tej kombinacji,
- j - numer zmiennej w rozpatrywanej kombinacji,
- rj - współczynnik korelacji potencjalnej zmiennej objaśniającej o numerze j ze zmienną objaśnianą (element wektora R0),
- rij - współczynnik korelacji między j-tą i l-tą potencjalną zmienną objaśniającą (element macierzy R).
Wskaźnik hkj mierzy wielkość informacji jaką wnosi zmienna Xj o zmiennej objaśnianej Y w k-tej kombinacji. W związku z tym hkj wzrasta, jeżeli współczynnik korelacji rj wzrasta, a maleje im bardziej zmienna Xj jest skorelowana z pozostałymi zmiennymi objaśniającymi.
[edytuj] Pojemność integralna kombinacji nośników informacji
Dopiero, gdy policzymy indywidualną pojemność nośników informacji dla wszystkich kombinacji, możemy obliczyć pojemność integralną kombinacji nośników informacji według wzoru:
gdzie:
- k - numer kombinacji (k=1,2,...,2m-1),
- mk - liczba zmiennych w k-tej kombinacji,
- j - numer zmiennej w rozpatrywanej kombinacji.
Pojemność integralna kombinacji nośników informacji dla k-tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tą kombinację, gdzie Hk jest największa
[edytuj] Przykład
Dane są:
- zmienna endogeniczna Y
- zbiór potencjalnych zmiennych objaśniających
- wektor współczynników korelacji liniowej między zmiennymi egzogenicznymi i zmnienną endogeniczną
- macierz współczynników korelacji między potencjalnymi zmiennymi objaśniającymi
Liczba możliwych kombinacji zmiennych endogenicznych wynosi
- Kombinacje jednoelementowe:
,
,
- Kombinacje dwuelementowe:
,
,
- Kombinacje trójelementowe:
[edytuj] Bibliografia
- Podstawy ekonometrii, A. Barczak, J. Biolik, Wydawnictwo AE Katowice, Katowice 2003, ISBN 83-87265-87-X,
- Ekonometria. Metody, przykłady, zadania, J. Dziechciarz, Wydawnictwo AE we Wrocławiu, Wrocław 2002, ISBN 83-7011-551-9