Korelacja
Z Wikipedii
Korelacja (słowo pochodzenia łacińskiego oznaczające wzajemny związek), pojęcie matematyczne, oznaczające wzajemne powiązanie, współzależność jakichś zjawisk lub obiektów.
W teorii prawdopodobieństwa i statystyce na ogół rozumie się tutaj zależność liniową zmiennych losowych i stosuje korelację Pearsona. Istnieją inne rodzaje korelacji, np. korelacja rangowa Spearmana, mierząca zależność monotoniczną, niekoniecznie liniową.
Rozważmy dwie zmienne losowe X i Y. Weźmy pod uwagę kowariancję tych zmiennych, czyli liczbę E[(X - EX)(Y - EY)], gdzie EX oznacza wartość średnią (nadzieję matematyczną, wartość oczekiwaną) zmiennej X. Podzielmy teraz tę liczbę przez iloczyn odchyleń standardowych obu zmiennych. To, co otrzymamy, nosi nazwę współczynnika korelacji i jest zawsze liczbą z przedziału [-1, 1].
Jeżeli współczynnik korelacji wynosi 1 lub -1, to zmienne X i Y są całkowicie skorelowane (odpowiednio, dodatnio lub ujemnie); dzieje się tak wówczas, gdy między nimi występuje zależność liniowa. Jeśli współczynnik korelacji jest równy zeru, rozważane zmienne losowe nazywamy nieskorelowanymi.
Dla zastosowań ważny jest fakt, że w przypadku zmiennych X i Y o rozkładzie normalnym, współczynnik korelacji obu zmiennych jest miarą ich zależności i jest równy zeru wtedy i tylko wtedy, gdy obie zmienne są niezależne.
Częstym błędem przyrodników i humanistów, używających pojęcia korelacji, jest przyjmowanie, że zmienne silnie nawet skorelowane są związane jakimś związkiem przyczynowo-skutkowym, tym mocniejszym, im korelacja większa. Nie jest tak, jak uczy taki oto przykład: dźwięk syreny lokomotywy jest niezwykle silnie skorelowany z odjazdem pociągu ze stacji, nie jest on jednak żadną przyczyną ruchu - i odwrotnie, odjazd pociągu nie jest przyczyną dźwięku. W tym wypadku mamy jedynie do czynienia ze współwystępowaniem zjawisk, a nie związkiem przyczynowo-skutkowym.
Podobnie, można by się dopatrzyć silnej dodatniej korelacji między wzrostem liczby ludności w Indiach a liczbą samochodów w Polsce, choć jest to jedynie czysto statystyczna korelacja, współwystępowanie zjawisk, a nie jakikolwiek związek przyczynowo-skutkowy.
Innym częstym błędem jest niesprawdzanie, czy w próbie nie występują elementy odstające, które mogą całkowicie przekłamać wartość i zwrot współczynnika korelacji Pearsona.
Korelacja w naukach społecznych zbieżność stanu, lub zmian występująca pomiędzy jakimiś parametrami badanej próby np.: w badaniach ankietowych, co do których postawiono hipotezę, lub wynikła z analizy wyników z zastosowaniem metod statystyki. Interpretacja korelacji jest obwarowana licznymi rygorami, które ograniczają możliwość dopuszczenia błędnych wniosków.
Zobacz też: przegląd zagadnień z zakresu statystyki