Contenido Checked

Estadística

Temas relacionados: Matemáticas

Antecedentes de las escuelas de Wikipedia

SOS Children produjo este sitio web para las escuelas, así como este sitio web video sobre África . Para comparar obras de caridad de patrocinio este es el mejor vínculo de patrocinio .

Una gráfica de una curva normal de campana que muestra estadísticas utilizadas en evaluación de las pruebas estandarizadas. Las escalas incluyen desviaciones estándar , porcentajes acumulados, equivalentes de percentiles, puntajes Z, T-score, nueves estándar y porcentajes en nueves estándar.

La estadística es una ciencia matemática referente a la recolección, análisis, interpretación o explicación, y la presentación de datos. Es aplicable a una amplia variedad de disciplinas académicas, desde los naturales y sociales ciencias a las humanidades , y al gobierno y los negocios.

Los métodos estadísticos pueden utilizarse para resumir o describir una colección de datos; se llama estadísticas descriptivas. Además, los patrones en los datos pueden ser modelada en una forma que representa aleatoriedad y la incertidumbre en las observaciones, y luego utilizados para sacar conclusiones sobre el proceso o población estudiada; se llama estadística inferencial. Tanto la estadística descriptiva e inferencial comprenden estadística aplicada. Hay también una disciplina llamada estadística matemática, que se ocupan de la base teórica de la asignatura.

Las estadísticas de palabras es también el plural de estadística (singular), que se refiere al resultado de la aplicación de un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas, las estadísticas de delincuencia, etc.

Historia

Estadísticas surgieron, a más tardar en el siglo 18 , a partir de la necesidad de los Estados de recoger datos sobre sus pueblos y economías, con el fin de administrarlos. Su significado ampliado a principios del siglo 19 para incluir la recopilación y análisis de datos en general. Estadísticas actuales se emplean ampliamente en el gobierno, los negocios y las ciencias naturales y sociales.

Debido a sus orígenes en el gobierno y su visión del mundo centrada en los datos, las estadísticas se considera que no es un subcampo de las matemáticas, sino más bien un campo distinto que utiliza las matemáticas. Sus fundamentos matemáticos se establecieron en las 17a y 18a siglos con el desarrollo de la teoría de la probabilidad . El método de los mínimos cuadrados , una técnica central de la disciplina, fue inventado en el siglo 19 por varios autores. Desde entonces las nuevas técnicas de probabilidad y estadística han estado en continuo desarrollo. Modernos equipos han acelerado cálculo estadístico a gran escala, y también han hecho posibles métodos nuevos que serían poco prácticas para llevar a cabo manualmente.

Visión de conjunto

En la aplicación de las estadísticas a un problema científico, industrial o social, se parte de un proceso o población a ser estudiada. Esto podría ser una población de personas de un país, de granos de cristal en una roca, o de productos manufacturados por una fábrica en particular durante un período determinado. En cambio, puede ser un proceso observado en varias ocasiones; los datos recogidos sobre este tipo de "población" constituyen lo que se llama un series de tiempo.

Por razones prácticas, en lugar de compilar datos sobre toda una población, por lo general se estudia un subconjunto elegido de la población, llamada muestra . Se recogen datos sobre la muestra en un estudio observacional o entorno experimental. Los datos se sometieron a análisis estadístico, que sirve para dos propósitos relacionados: descripción y inferencia.

  • La estadística descriptiva se pueden utilizar para resumir los datos, ya sea numérica o gráficamente, para describir la muestra. Ejemplos básicos de descriptores numéricos son la media y la desviación estándar . Sumarizaciones gráficas incluyen varios tipos de tablas y gráficos.
  • La estadística inferencial se utiliza para modelar patrones en los datos, lo que representa el azar y hacer inferencias sobre la población mayor. Estas inferencias pueden tomar la forma de respuestas a preguntas sí / no ( prueba de hipótesis), estimaciones de características numéricas ( de estimación), descripciones de asociación ( correlación ), o el modelado de las relaciones ( regresión ). Otro técnicas de modelado incluyen ANOVA, series de tiempo, y minería de datos.

"... Es sólo la manipulación de la incertidumbre que nos interesa. Nosotros no estamos interesados en la materia que es incierto. Por lo tanto no estudiamos el mecanismo de la lluvia; sólo si lloverá ".

Dennis Lindley, "La Filosofía de las estadísticas", El Estadístico (2000).

El concepto de correlación es particularmente notable. El análisis estadístico de una conjunto de datos puede revelar que dos variables (es decir, dos propiedades de la población en estudio) tienden a variar entre sí, como si están conectados. Por ejemplo, un estudio de los ingresos anuales y la edad de muerte entre las personas puede encontrar que los pobres tienden a tener vidas más cortas que las personas ricas. Las dos variables se dice que están correlacionados. Sin embargo, no se puede inferir inmediatamente la existencia de una relación causal entre las dos variables (ver La correlación no implica causalidad). Los fenómenos correlacionados podría ser causado por un tercer fenómeno, previamente no considerada, llamado acecho variable.

Si la muestra es representativa de la población, a continuación, inferencias y conclusiones de la muestra se pueden extender a la población en su conjunto. Un problema importante consiste en determinar el grado en que la muestra elegida es representativo. Estadísticas ofrece métodos para calcular y corregir la aleatoriedad en la muestra y en el procedimiento de recogida de datos, así como métodos para diseñar experimentos robustos en el primer lugar (véase diseño experimental).

El concepto matemático fundamental empleada en la comprensión de tales aleatoriedad es probabilidad . Estadística matemática (también llamadas teoría estadística) es la rama de la matemática aplicada que utiliza la teoría y la probabilidad de análisis para examinar la base teórica de la estadística.

El uso de cualquier método estadístico es válido sólo cuando el sistema o población bajo consideración satisface los supuestos matemáticos básicos del método. El mal uso de las estadísticas pueden producir errores sutiles pero importantes en la descripción e interpretación - sutil en que los profesionales experimentados, incluso a veces a hacer este tipo de errores, y serio en que puede afectar a la política social, la práctica médica y la fiabilidad de las estructuras, como puentes y centrales nucleares. Aun cuando las estadísticas se aplican correctamente, los resultados pueden ser difíciles de interpretar para una persona no experta. Por ejemplo, el significación estadística de una tendencia en los datos - que mide el grado en que la tendencia podría ser causada por la variación aleatoria en la muestra - puede no estar de acuerdo con el propio sentido intuitivo de su significado. El conjunto de habilidades básicas de estadísticas (y el escepticismo) que necesitan las personas para hacer frente a la información en su vida cotidiana se conoce como cultura estadística.

Métodos estadísticos

Los estudios experimentales y de observación

Un objetivo común para un proyecto de investigación estadística es investigar causalidad, y en particular para llegar a una conclusión sobre el efecto de los cambios en los valores de predictores o variables independientes sobre la respuesta o variables dependientes. Hay dos tipos principales de estudios estadísticos causales, estudios experimentales y estudios observacionales. En ambos tipos de estudios, se observó el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de la variable dependiente. La diferencia entre los dos tipos es en realidad cómo se llevó a cabo el estudio. Cada uno puede ser muy eficaz.

Un estudio experimental consiste en tomar mediciones del sistema en estudio, la manipulación del sistema, y luego tomar mediciones adicionales usando el mismo procedimiento para determinar si la manipulación puede haber modificado los valores de las mediciones. En contraste, un estudio observacional no implica la manipulación experimental. En su lugar los datos son recogidos y las correlaciones entre los predictores y la respuesta se investigan.

Un ejemplo de un estudio experimental es el famoso Estudios de Hawthorne que intentaban probar cambios en el ambiente de trabajo en la planta de Hawthorne de la Western Electric Company. Los investigadores estaban interesados en si el aumento de la iluminación aumentaría la productividad de la trabajadores de la línea de montaje. Los investigadores midieron primero productividad en la planta entonces modificarse la iluminación en un área de la planta para ver si los cambios en la iluminación afectarían la productividad. Como resultado, la productividad mejoró en todas las condiciones experimentales (véase Efecto Hawthorne). Sin embargo, el estudio es hoy fuertemente criticado por errores en los procedimientos experimentales, específicamente la falta de una grupo de control y blindedness .

Un ejemplo de un estudio observacional es un estudio que explora la relación entre fumar y el cáncer de pulmón. Este tipo de estudio por lo general utiliza una encuesta para recoger observaciones sobre el área de interés y luego realizar el análisis estadístico. En este caso, los investigadores recogerían observaciones de los fumadores y los no fumadores, quizás a través de un estudio de casos y controles y, a continuación, mira el número de casos de cáncer de pulmón en cada grupo.

Los pasos básicos para un experimento son:

  1. planificar la investigación, incluidas las fuentes de información, que determinan la selección de sujetos de investigación y éticos consideraciones para la investigación y el método propuesto,
  2. Diseño del experimento concentrándose en el modelo del sistema y la interacción de las variables independientes y dependientes,
  3. resumir una colección de observaciones para presentar su comunalidad suprimiendo detalles ( estadísticas descriptivas),
  4. llegar a un consenso sobre lo que las observaciones nos dicen sobre el mundo que observamos ( inferencia estadística),
  5. documentar y presentar los resultados del estudio.

Niveles de medición

Ver: Stanley Stevens "Escalas de medición" (1946): nominal, ordinal, de intervalo, la relación

Hay cuatro tipos de mediciones o escalas de medición utilizados en las estadísticas. Los cuatro tipos o niveles de medición (nominal, ordinal, intervalo y proporción) tienen diferentes grados de utilidad en estadística investigación. Mediciones de relación, donde se definen tanto un valor de cero y distancias entre diferentes mediciones, proporcionan la mayor flexibilidad en los métodos estadísticos que se puede utilizar para el análisis de los datos. Mediciones de intervalo tienen distancias significativas entre las mediciones, pero no tiene valor significativo cero (como mediciones de coeficiente intelectual o mediciones de temperatura en Fahrenheit). Mediciones ordinales tienen imprecisas diferencias entre valores consecutivos, pero un orden significativo a esos valores. Las medidas nominales no tienen ningún orden de importancia significativa entre los valores.

Variables conformes sólo con las mediciones nominales u ordinales están juntos a veces se llaman las variables categóricas, ya que no se pueden medir razonablemente numéricamente, mientras que las mediciones ratio y el intervalo se agrupan como cuantitativa o las variables continuas debido a su naturaleza numérica.

Las técnicas estadísticas

Algunos muy conocidos estadística pruebas y procedimientos para investigación observaciones son:

Disciplinas especializadas

Algunos campos de uso indagación estadística aplicada tan extensivamente que tienen terminología especializada. Estas disciplinas son:

  • La ciencia actuarial
  • Economía Aplicada información
  • Bioestadística
  • Manos a la Obra y El remuestreo jackknife
  • Estadísticas de las empresas
  • La minería de datos (aplicación de estadísticas y reconocimiento de patrones para descubrir el conocimiento a partir de datos)
  • Demografía
  • Estadísticas económicas (Econometría)
  • Estadísticas de energía
  • Estadísticas de Ingeniería
  • Estadísticas Ambientales
  • Epidemiología
  • Geografía y Sistemas de Información Geográfica, más específicamente en El análisis espacial
  • Procesamiento de imágenes
  • Análisis Multivariante
  • Estadísticas psicológicos
  • Calidad
  • Estadísticas sociales
  • Alfabetización estadística
  • Los modelos estadísticos
  • Los estudios estadísticos
  • Análisis de procesos y Quimiometría (para el análisis de los datos de la química analítica y ingeniería química)
  • El análisis de supervivencia
  • La ingeniería de confiabilidad
  • Estadísticas en varios deportes, especialmente béisbol y cricket

Estadísticas forman una herramienta clave en la base de negocio y de fabricación, así. Se utiliza para entender la variabilidad sistemas de medición, los procesos de control (como en estadística de control de procesos o SPC), para resumir los datos, y para tomar decisiones basadas en datos. En estos papeles es una herramienta clave, y tal vez la única herramienta fiable.

Computación estadística

Los aumentos rápidos y sostenidos en el cómputo de partida de alimentación de la segunda mitad del siglo 20 han tenido un impacto considerable en la práctica de la ciencia estadística. Los primeros modelos estadísticos fueron casi siempre de la clase de modelos lineales, sino poderosas computadoras, junto con numéricos adecuados algoritmos , provocaron un resurgimiento del interés en modelos no lineales (especialmente redes neuronales y árboles de decisión) y la creación de nuevos tipos, como modelos lineales generalizados y modelos multinivel.

El aumento de potencia de cálculo ha llevado también a la creciente popularidad de los métodos computacionalmente intensivas con base en muestreo, tales como pruebas de permutación y la de arranque, mientras que técnicas como la Muestreo de Gibbs han hecho los métodos bayesianos más factible. La revolución de la computadora tiene implicaciones para el futuro de las estadísticas, con un nuevo énfasis en las estadísticas "empíricos" "experimentales" y. Un gran número de tanto uso general y especial paquetes estadísticos están ahora disponibles para los profesionales.

Mal uso

Hay una percepción general de que el conocimiento estadístico es con demasiada frecuencia intencionalmente mal uso, mediante la búsqueda de maneras de interpretar los datos que son favorables al presentador. Un famoso dicho atribuido a Benjamin Disraeli es " Hay tres clases de mentiras:. Mentiras, malditas mentiras y estadísticas "Y el presidente de Harvard Lawrence Lowell escribió en 1909 que las estadísticas ", como las empanadas de ternera, son buenas si usted conoce a la persona que los hizo, y están seguros de los ingredientes."

Si varios estudios parecen contradecirse entre sí, entonces el público puede venir a desconfiar de este tipo de estudios. Por ejemplo, un estudio puede sugerir que una dieta o actividad eleva la presión arterial , mientras que otro puede sugerir que disminuye la presión arterial. La discrepancia puede deberse a variaciones sutiles en el diseño experimental, como las diferencias en los grupos de pacientes o protocolos de investigación, que no se entienden fácilmente por los no expertos. (Informes de los medios a veces omiten esta información contextual vitales por completo.)

Al elegir (o rechazar o modificar) una determinada muestra, los resultados pueden ser manipulados; tirar los valores extremos es uno de los medios de hacerlo. Estas manipulaciones no tienen por qué ser maliciosas o tortuosa; que pueden surgir de sesgos no intencionales de la investigadora. Los gráficos utilizados para resumir los datos también pueden ser engañosas.

Las críticas más profundas provienen del hecho de que el enfoque de la prueba de hipótesis, ampliamente utilizado y en muchos casos requeridos por ley o reglamento, obliga a una hipótesis (la hipótesis nula) para ser "favoreció", y también se puede parecer a exagerar la importancia de las pequeñas diferencias en los grandes estudios. Una diferencia que es estadísticamente muy significativa todavía puede ser de ninguna importancia práctica. (Ver la crítica de la prueba de hipótesis y controversia sobre la hipótesis nula.)

Una respuesta ha sido un mayor énfasis en la p-valor sobre sólo informar si una hipótesis fue rechazada en el nivel dado de importancia. El p-valor, sin embargo, no indica el tamaño del efecto. Otro método cada vez más común es informar intervalos de confianza. Aunque éstos se producen a partir de los mismos cálculos como pruebas de hipótesis o los valores de p, que describen tanto el tamaño del efecto y la incertidumbre que lo rodea.

Recuperado de " http://en.wikipedia.org/w/index.php?title=Statistics&oldid=198286905 "