La prueba t de Student
Antecedentes de las escuelas de Wikipedia
SOS Children, que corre cerca de 200 sos escuelas en el mundo en desarrollo, organizó esta selección. Una buena manera de ayudar a otros niños es mediante el patrocinio de un niño
Una prueba t es cualquier prueba de hipótesis estadística en la que la prueba estadística tiene una distribución t de Student si la hipótesis nula es verdadera. Se aplica cuando los tamaños de muestra son lo suficientemente que el uso de un supuesto de pequeña normalidad y la asociada z-cables de prueba incorrecto inferencia.
Historia
El estadístico t se introdujo por William Sealy Gosset para el seguimiento de la calidad barata de cervezas de cerveza ("Estudiante", fue su seudónimo). Gosset fue un estadístico para el Guinness cervecería en Dublín, Irlanda , y fue contratado debido a la política de innovación de Claude Guinness de reclutar a los mejores graduados de Oxford y Cambridge para aplicar la bioquímica y la estadística a los procesos industriales de Guinness. Gosset publicó la prueba t en Biometrika en 1908, pero se vio obligado a utilizar un seudónimo por su empleador que considera el hecho de que estaban usando las estadísticas como un secreto comercial. De hecho, la identidad de Gosset era desconocido, no sólo a los compañeros de los estadísticos sino a su empleador - la compañía insistió en el seudónimo de modo que pudiera hacer la vista gorda ante el incumplimiento de sus normas.
Hoy en día, se aplica de manera más general a la confianza que se puede colocar en las resoluciones adoptadas desde pequeñas muestras .
Uso
Una prueba t es cualquier prueba de hipótesis estadística en la que la prueba estadística tiene una distribución t de Student si la hipótesis nula es verdadera. Se aplica cuando los tamaños de muestra son lo suficientemente pequeños que el uso de un supuesto de normalidad y el z-test asociado conduce a la inferencia incorrecta.
Entre las pruebas de la t de uso más frecuente son:
- Una prueba de la hipótesis nula de que los medios de dos distribuidos normalmente poblaciones son iguales. Dados dos conjuntos de datos, cada uno caracterizado por su media , desviación estándar y el número de puntos de datos, podemos utilizar algún tipo de prueba de la t para determinar si los medios son distintos, a condición de que las distribuciones subyacentes se puede suponer que es normal. Todas estas pruebas se llaman pruebas t de Student, aunque estrictamente hablando ese nombre sólo debe utilizarse si las varianzas de las dos poblaciones también se supone que son iguales; la forma de la prueba utilizada cuando se deja caer esta suposición se llama a veces Prueba t de Welch. Hay diferentes versiones de la prueba de la t en función de si las dos muestras son
- independientes entre sí (por ejemplo, los individuos asignados al azar en dos grupos), o
- emparejado, de modo que cada miembro de una muestra tiene una relación única con un miembro particular de la otra muestra (por ejemplo, la misma gente medidos antes y después de una intervención de las puntuaciones, o las pruebas de IQ de un esposo y esposa).
- Si el calculado p-valor es inferior al umbral elegido para significación estadística (por lo general el nivel de 0,05), entonces la hipótesis nula de que por lo general se afirma que los dos grupos no difieren es rechazado en favor de una hipótesis alternativa, que normalmente indica que los grupos no difieren.
- Una prueba de que la media de una población distribuida normalmente tiene un valor especificado en una hipótesis nula.
- Una prueba de si la pendiente de una recta de regresión difiere significativamente de 0.
Una vez que el valor de t se determina, una p-valor se puede encontrar utilizando una tabla de valores de la distribución t de Student .
Supuestos
- La distribución normal de los datos, probado mediante el uso de una prueba de normalidad, tales como Shapiro-Wilk y Prueba de Kolmogorov-Smirnov.
- La igualdad de las varianzas, prueba usando ya sea el Prueba F, el más robusto Prueba de Levene, Prueba de Bartlett, o la Prueba de Brown-Forsythe.
- Las muestras pueden ser independientes o dependientes, en función de la hipótesis y el tipo de muestras:
- Muestras independientes son por lo general dos grupos seleccionados al azar
- Muestras dependientes pueden ser dos grupos emparejados en alguna variable (por ejemplo, la edad) o son las mismas personas que se están probando dos veces (llamada medidas repetidas)
Dado que todos los cálculos se realizan con sujeción a la hipótesis nula, puede ser muy difícil llegar a una hipótesis nula razonable que da cuenta de la igualdad de medios en presencia de varianzas desiguales. En el caso habitual, la hipótesis nula es que los diferentes tratamientos no tienen ningún efecto - esto hace varianzas desiguales insostenible. En este caso, se debe renunciar a la facilidad de uso de esta variante proporcionada por los paquetes estadísticos. Ver también Problema Behrens-Fisher.
Tipo de Determinación
Para los novatos, la cuestión más difícil es a menudo si las muestras son independientes o dependientes. Muestras independientes consisten normalmente en dos grupos sin relación. Muestras dependientes suelen consistir en una muestra equivalente (o una muestra "emparejado") o un grupo que ha sido probado en dos ocasiones (medidas repetidas).
T-pruebas dependientes también se utilizan para muestras pareadas igualado, en el que dos grupos se corresponde en una variable particular. Por ejemplo, si examinamos las alturas de hombres y mujeres en una relación, los dos grupos se corresponde en estado civil. Esto requeriría una prueba t dependiente porque es una muestra pareada (un hombre emparejado con una mujer). Alternativamente, podríamos contratar a 100 hombres y 100 mujeres, con ninguna relación entre cualquier hombre en particular y cualquier mujer en particular; en este caso usaríamos una prueba de muestras independientes.
Otro ejemplo de una muestra equivalente sería tomar dos grupos de estudiantes, que coincida con cada alumno en un grupo con un estudiante en el otro grupo basado en un resultado de la prueba logro, a continuación, examinar cuánto lee cada estudiante. Un ejemplo podría ser par dos estudiantes que puntúan 90 y 91 o dos estudiantes que obtuvieron 45 y 40 en la misma prueba. La hipótesis sería que los estudiantes que obtuvieron buenos resultados en la prueba pueden o no pueden leer más. Alternativamente, podríamos reclutar estudiantes con puntajes bajos y los estudiantes con altas puntuaciones en dos grupos y evaluar sus cantidades de lectura independiente.
Un ejemplo de medidas repetidas t-test sería si una parte eran antes y después de la prueba. (Este ejemplo se da en la educación con bastante frecuencia.) Si un profesor quería examinar el efecto de una nueva serie de libros de texto sobre el rendimiento estudiantil, (s) de que pudiera probar la clase al comienzo del año (pretest) y al final del el año (post-test). Una prueba t dependiente sería utilizado, tratando el pretest y postest como variables coincidentes (comparados por estudiante).
Cálculos
T-test Dependiente
Esta ecuación se utiliza cuando las muestras son dependientes; es decir, cuando sólo hay una muestra que ha sido probado dos veces (medidas repetidas) o cuando hay dos muestras que han sido emparejados o "emparejados".
Para esta ecuación, se deben calcular las diferencias entre todos los pares. Los pares son pretest y postest partituras ya sea la propia persona o una persona en un grupo de referencia a otra persona en otro grupo (ver tabla). El promedio (X D) y la desviación estándar (s D) de esas diferencias se utilizan en la ecuación. La constante es distinto de cero si quieres probar si el promedio de la diferencia es significativamente diferente de . El grado de libertad utilizado es N-1.
Ejemplo de medidas repetidas | |||
Número | Nombre | Prueba 1 | Prueba 2 |
---|---|---|---|
1 | Micro | 35% | 67% |
2 | Melanie | 50% | 46% |
3 | Toronjil | 90% | 86% |
4 | Mitchell | 78% | 90% |
Ejemplo de pares emparejados | |||
Par | Nombre | Edad | Prueba |
---|---|---|---|
1 | Jon | 35 | 250 |
1 | Jane | 36 | 340 |
2 | Palanqueta | 22 | 460 |
2 | Jessy | 21 | 200 |
Ejemplo
Una muestra aleatoria de tornillos tienen pesos
- 30.02, 29.99, 30.11, 29.97, 30.01, 29.99
Calcula un intervalo de confianza del 95% para el peso promedio de la población.
Suponga que la población se distribuye de la N (μ, σ 2).
El peso medio de las muestras es 30.015 con desviación estándar de 0.0497. Con la media y los primeros cinco pesos es posible calcular la sexta peso. En consecuencia, hay cinco grados de libertad.
Podemos búsqueda en la tabla que para un intervalo de confianza de 95% y cinco grados de libertad, el valor es 2,571. .
es decir,
Si probamos muchas veces, nuestro intervalo sería capturar el verdadero peso promedio 95% del tiempo; por lo tanto, tenemos un 95% de confianza de que el verdadero peso promedio de todos los tornillos caerá entre 29.96 y 30.07
Alternativas a la prueba de la t
Recordemos que la prueba de la t se puede utilizar para probar la igualdad de las medias de dos poblaciones normales con desconocido, pero iguales, la varianza.
- Para relajar el supuesto de normalidad, una alternativa no paramétrica a la prueba t se puede utilizar, y las opciones habituales son:
- para muestras independientes, la Prueba de Mann-Whitney
- para muestras relacionadas, ya sea la prueba binomial o el Prueba de los rangos con signo de Wilcoxon
- Para probar la igualdad de las medias de más de dos poblaciones normales, una Análisis de varianza se puede realizar
- Para probar la igualdad de las medias de dos poblaciones normales con varianza conocida, un Z-prueba se puede realizar
Implementaciones
Más programas de hojas de cálculo y paquetes estadísticas incluyen implementaciones de la prueba t de Student.
Las calculadoras en línea
- Emparejado / Unpaired / Welch T-Test Calculadora de GraphPad