Contenido Checked

Muestreo (estadísticas)

Temas relacionados: Matemáticas

Acerca de este escuelas selección Wikipedia

Esta selección wikipedia ha sido elegido por los voluntarios que ayudan Infantil SOS de Wikipedia para esta Selección Wikipedia para las escuelas. Todos los niños disponibles para el apadrinamiento de niños de Aldeas Infantiles SOS son atendidos en una casa de familia por la caridad. Leer más ...

El muestreo es que parte de práctica estadística se ocupa de la selección de las observaciones individuales destinados para dar un poco de conocimiento acerca de un población de interés, especialmente para los fines de inferencia estadística. Cada observación mide una o más propiedades (peso, ubicación, etc.) de una entidad observable enumerado distinguir objetos o personas. Ponderaciones de la encuesta a menudo necesitan ser aplicado a los datos para ajustar el diseño de la muestra. Los resultados de la teoría de probabilidad y teoría estadística se emplean para guiar la práctica.

El proceso de muestreo comprende varias etapas:

  • Definir la población de interés
  • Especificación de un marco de muestreo , un conjunto de elementos o acontecimientos posibles de medir
  • Especificación de un método de muestreo para seleccionar elementos o acontecimientos de la trama
  • Determinar el tamaño de la muestra
  • Implementar el plan de muestreo
  • El muestreo y recogida de datos
  • Revisar el proceso de muestreo

Definición Población

El éxito de la práctica estadística está basada en concentrado definición del problema. Por lo general, tratamos de tomar una decisión sobre algunos de la población, por ejemplo cuando una lote de material desde la producción debe ser liberado al cliente o sancionado por chatarra o reproceso.

Alternativamente, buscamos el conocimiento sobre el sistema causa de que la población es un resultado, por ejemplo, cuando un investigador realiza un experimento en ratas con la intención de obtener conocimientos sobre la bioquímica que se pueden aplicar para el beneficio de los seres humanos . En este último caso, la población de interés puede ser difícil de especificar, como lo es en el caso de la medición de alguna característica física tal como la conductividad eléctrica del cobre .

Sin embargo, en todos los casos, el tiempo pasado en la toma de la población de interés precisa a menudo bien invertido, a menudo porque plantea muchas cuestiones, las ambigüedades y las preguntas que se le habría pasado por alto en esta etapa.

Marco muestral

En el caso más sencillo, tales como la condena de un lote de material de producción ( muestreo de aceptación por lotes), es posible identificar y medir cada artículo en la población y que incluya cualquiera de ellos en nuestra muestra. Sin embargo, en el caso más general esto no es posible. No hay manera de identificar todas las ratas en el conjunto de todas las ratas. No hay forma de identificar a cada votante en una próxima elección (antes de la elección).

Estas poblaciones imprecisas no son susceptibles de muestreo en alguna de las formas siguientes y al que podrían aplicar la teoría estadística.

Como remedio, buscamos un marco de muestreo que tiene la propiedad de que podemos identificar cada elemento e incluir ninguna en nuestra muestra. Por ejemplo, en una sondeo de opinión, los posibles marcos de muestreo incluyen:

  • Registro Electoral
  • Directorio telefónico
  • Los compradores en cualquier ciudad, Calle principal en el lunes por la tarde antes de la elección.

El marco de la muestra debe ser representativa de la población y esta es una pregunta fuera del ámbito de la teoría estadística exigiendo el juicio de los expertos en el tema en particular asunto se está estudiando. Todos los cuadros anteriores omiten algunas personas que van a votar en las próximas elecciones y contener algunas personas que no lo hará. Las personas que no están en el marco tienen ninguna perspectiva de ser muestreado. La teoría estadística nos habla de las incertidumbres en la extrapolación de una muestra en el cuadro. En la extrapolación de marco a la población, su papel es motivador y sugerente.

Hay, sin embargo, una fuerte división de opiniones acerca de la aceptabilidad de un muestreo representativo a través de diferentes dominios de estudio. Para el filósofo, el procedimiento de muestreo representativo no tiene justificación alguna, ya que no es así como se busca la verdad en la filosofía. "Para el científico, sin embargo, el muestreo representativo es el único procedimiento justificada por elegir uno de los objetos para su uso como base de la generalización, y es, por tanto, suele ser la única base aceptable para determinar la verdad." (Andrew A. Marino) . Es importante entender esta diferencia mantenerse al margen de las prescripciones confusas que se encuentran en muchas páginas web.

En la definición de la estructura, práctica, las cuestiones económicas, éticas y técnicas deben ser abordados. La necesidad de obtener resultados oportunos pueden prevenir la ampliación del marco de lejos en el futuro.

Las dificultades pueden ser extremas en que la población y el marco son disjuntos. Este es un problema particular en previsión donde inferencias sobre el futuro se hacen de histórico datos. De hecho, en 1703, cuando Jacob Bernoulli propuso Gottfried Leibniz la posibilidad de utilizar los datos de mortalidad históricos para predecir la probabilidad de muerte prematura de un hombre vivo, Gottfried Leibniz reconoció el problema en responder:

"La naturaleza ha establecido patrones procedentes de la devolución de los acontecimientos, pero sólo en su mayor parte. Nuevas enfermedades inundan la raza humana, por lo que no importa cuántos experimentos que han hecho en los cadáveres, no se han impuesto por lo tanto un límite en la naturaleza de los eventos de modo que en el futuro no podrían variar ".

Después de haber establecido el marco, hay un número de maneras para organizar a mejorar la eficiencia y efectividad.

Es en esta etapa que el investigador debe decidir si la muestra es, de hecho, ser toda la población y por lo tanto sería un censo.

Método de muestreo

Dentro de cualquiera de los tipos de marco identificado anteriormente, una variedad de métodos de muestreo se puede emplear, de forma individual o en combinación.

El muestreo por cuotas

En el muestreo por cuotas, la población está segmentada por primera vez en subgrupos mutuamente excluyentes, al igual que en muestreo estratificado. A continuación, el juicio se utiliza para seleccionar los sujetos o unidades de cada segmento sobre la base de una proporción especificada. Por ejemplo, un entrevistador se le puede decir a la muestra 200 mujeres y 300 varones entre las edades de 45 y 60 años.

Es este segundo paso que hace que la técnica de uno de muestreo no probabilístico. En la cuota de muestreo La selección de la muestra es no azar. Por ejemplo entrevistadores podrían verse tentados a entrevistar a los que miran más útil. El problema es que estas muestras pueden ser parcial, porque no todo el mundo tiene una oportunidad de selección. Este elemento aleatorio es su mayor debilidad y cuota frente probabilidad ha sido motivo de controversia durante muchos años.

El muestreo aleatorio simple

En un muestra aleatoria simple de un tamaño determinado, tales subconjuntos de la trama se dan la misma probabilidad. Cada elemento de la trama por lo tanto tiene una probabilidad igual de selección: el marco no se subdivide o repartió. Es posible que la muestra no será completamente al azar.

El muestreo estratificado

Cuando la población abarca un número de categorías distintas, el marco puede ser organizado por estas categorías en separado "estratos". A continuación, la muestra se selecciona de cada "estrato" separado, produciendo una muestra estratificada. Las dos principales razones para el uso de un diseño de muestreo estratificado son [1] para garantizar que determinados grupos dentro de una población están debidamente representados en la muestra, y para mejorar la eficiencia mediante la obtención de un mayor control sobre la composición de la muestra. En el segundo caso, mayores ganancias en la eficiencia (ya sea tamaños de muestra más bajos o más altos de precisión) se puede lograr mediante la variación de la fracción de muestreo del estrato a estrato. El tamaño de la muestra suele ser proporcional al tamaño relativo de los estratos. Sin embargo, si las variaciones difieren significativamente entre los estratos, tamaño de las muestras deben ser proporcionales al estrato desviación estándar . Estratificación no proporcional puede proporcionar una mejor precisión que la estratificación proporcional. Típicamente, los estratos se debe elegir a:

  • tener medios que difieren sustancialmente entre sí
  • minimizar la varianza dentro de los estratos y maximizar la varianza entre los estratos.

El muestreo por conglomerados

A veces es más barato «cluster» de la muestra, de alguna manera, por ejemplo, mediante la selección de los encuestados de sólo ciertas áreas, o ciertas solamente plazos. (Casi todas las muestras están en cierto sentido 'clúster' en el tiempo - aunque esto rara vez se toma en cuenta en el análisis.)

El muestreo por conglomerados es un ejemplo de ' muestreo en dos etapas "o" muestreo de varias fases ': en la primera etapa se elige una muestra de áreas; en la segunda etapa se selecciona una muestra de demandado dentro de esas áreas.

Esto puede reducir los viajes y otros gastos administrativos. También significa que uno no necesita un marco de muestreo para toda la población, pero sólo para los conglomerados seleccionados. El muestreo por conglomerados en general, aumenta la variabilidad de las estimaciones de la muestra por encima de la de un muestreo aleatorio simple, en función de cómo los grupos se diferencian entre sí, en comparación con la variación dentro de la agrupación.

El muestreo aleatorio

En el muestreo aleatorio, también conocido como el muestreo de probabilidad, cada combinación de elementos de la trama, o estrato, tiene una probabilidad conocida de ocurrir, pero estas probabilidades no son necesariamente iguales. Con cualquier forma de muestreo hay un riesgo de que la muestra puede no representa adecuadamente la población pero con muestreo aleatorio hay un gran cuerpo de la teoría estadística que cuantifica el riesgo y por lo tanto permite a un tamaño de muestra adecuado para ser elegido. Por otra parte, una vez tomada la muestra del error de muestreo asociado con los resultados medidos se puede calcular. Con el muestreo no aleatorio no existe una medida del error de muestreo asociado. Si bien esos métodos pueden ser más barato este es en gran parte sin sentido ya que no hay medida de calidad. Hay varias formas de muestreo aleatorio. Por ejemplo, en muestreo aleatorio simple, cada elemento tiene la misma probabilidad de ser seleccionado. Otra forma de muestreo aleatorio es Muestreo Bernoulli en el que cada elemento tiene la misma probabilidad de ser seleccionado, al igual que en el muestreo aleatorio simple. Sin embargo, el muestreo Bernoulli conduce a una variable tamaño de la muestra, mientras que durante el muestreo aleatorio simple el tamaño de la muestra se mantiene constante. De muestreo Bernoulli es un caso especial de Muestreo de Poisson en el que cada elemento tiene una probabilidad diferente de ser seleccionado. Otros ejemplos de muestreo probabilístico incluyen muestreo estratificado y muestreo polietápico ..

Muestreo aleatorio Igualados

Un método de asignación de los participantes a los grupos en los que parejas de participantes se cotejan primero en alguna característica y luego asignados aleatoriamente a los grupos de forma individual. (Brown, Cozby, Kee, y Worden, 1999, p.371).

El Procedimiento de muestreo aleatorio Igualados puede ser informado con los siguientes contextos,

a) Dos muestras en las que los miembros están claramente emparejados, o se cotejan explícitamente por el investigador. Por ejemplo, las mediciones de coeficiente intelectual o pares de gemelos idénticos.

b) Las muestras en las que el mismo atributo, o variable, se midieron dos veces en cada tema, en diferentes circunstancias. Comúnmente llamado medidas repetidas. Los ejemplos incluyen los tiempos de un grupo de atletas de 1.500 metros antes y después de una semana de entrenamiento especial; los rendimientos de leche de las vacas antes y después de ser alimentados con una dieta particular. Babu HM

El muestreo sistemático

Selección de (por ejemplo) cada 10 º nombre de la guía telefónica se denomina cada muestra de 10 º, que es un ejemplo de muestreo sistemático. Es un tipo de muestreo probabilístico menos que el directorio en sí no es aleatorizado. Es fácil de implementar y la estratificación inducida puede hacer que sea eficiente, pero es especialmente vulnerable a periodicidades en la lista. Si la periodicidad está presente y el período es un múltiplo de 10, entonces resultará sesgo. Es importante que el primer nombre elegido no es simplemente el primero en la lista, pero se elige para que sea (por ejemplo) la º 7, donde 7 es un entero aleatorio en el rango de 1, ..., 10 -1. Cada 10 de muestreo es especialmente útil para el muestreo eficiente desde bases de datos.

Recogida de muestras mecánica

Muestreo mecánico se usa típicamente en muestreo de sólidos , líquidos y los gases , utilizando dispositivos tales como cucharas, cucharones, sondas ladrón, el COLIWASA y splitter tipo rifle.

Hay que tener cuidado en asegurar que la muestra es representativa de la trama. Gran parte del trabajo en esta área ha sido desarrollado por Pierre Gy.

El muestreo de conveniencia

A veces llamado agarre o muestreo oportunidad, este es el método de elección de los elementos arbitrariamente y de forma no estructurada del marco. Aunque casi imposible de tratar rigurosamente, es el método más comúnmente empleado en muchas situaciones prácticas. En la investigación de las ciencias sociales, muestreo de bola de nieve es una técnica similar, cuando se utilizan los sujetos de estudio existentes para reclutar a más sujetos en la muestra.

Muestreo Line intercepto

Toma de muestras de línea de intersección es un método de elementos de muestreo en una región de las que un elemento se muestrea si un segmento de línea elegida, llamado un "transecta", se cruza con el elemento.

Tipos de datos

Categórico y numérica

Hay dos tipos de variables aleatorias:. Categóricas y numéricas variables aleatorias categóricas dan respuestas tales como "sí" o "no". Las variables categóricas pueden rendir más de dos respuestas posibles. Por ejemplo: "¿Qué día de la semana son lo más probable para lavar la ropa? 'Variables aleatorias numéricos producen respuestas numéricas, como su altura en centímetros.

Hay dos tipos de variables numéricas:. Discretas y continuas variables aleatorias discretas producen respuestas numéricas de un proceso de conteo. Un ejemplo es "¿cuántas veces usted visita el cajero automático en un mes normal? 'Variables aleatorias continuas producen respuestas de un proceso de medición. Altura es un ejemplo de una variable continua porque la respuesta adquiere un valor de un intervalo. La precisión del instrumento (s) de medición puede dar lugar a observaciones atadas. Una observación atado se produce cuando el dispositivo de medición no es sensible o sofisticado suficiente para detectar diferencias incrementales en los datos experimentales o encuesta.

Generalmente variable aleatoria continua requiere menos muestras que de variable aleatoria discreta. Esto puede ser justificado por referencia a la Teorema del límite central

El muestreo y recogida de datos

Buena recopilación de datos implica:

  • Tras el proceso de muestreo definido
  • Mantener los datos en el orden del tiempo
  • Tomando nota de los comentarios y otros eventos contextuales
  • Grabación de la falta de respuesta

La mayoría de los libros de muestreo y los documentos escritos por los no estadísticos se centran sólo en el aspecto de la recopilación de datos, que es sólo una pequeña parte del proceso de toma de muestras.

Revisión del proceso de muestreo

Después del muestreo, la revisión debería celebrarse del proceso exacto seguido en el muestreo, en lugar de la prevista, con el fin de estudiar los efectos que las divergencias podrían tener en el análisis posterior. Un problema particular es el de la falta de respuesta.

La falta de respuesta

En muestreo de la encuesta, muchas de las personas identificadas como parte de la muestra puede no estar dispuestos a participar o imposible contactar. En este caso, hay un riesgo de diferencias, entre (por ejemplo) la disposición y dispuestos, que lleva a sesgo de selección en las conclusiones. Esto es a menudo tratada por los estudios de seguimiento que hacen un repetido intento de ponerse en contacto con el que no responde y caracterizar sus similitudes y diferencias con el resto de la trama. Los efectos también pueden ser mitigados mediante la ponderación de los datos cuando los puntos de referencia de población están disponibles.

Ponderaciones de la encuesta

En muchas situaciones la fracción de la muestra puede ser variado por estrato y datos tendrá que ser ponderados para representar correctamente la población. Así, por ejemplo, una muestra aleatoria simple de las personas en el Reino Unido podría incluir algunos en islas escocesas remotas que serían excesivamente caro para degustar. Un método más barato sería el uso de una muestra estratificada con estratos urbanos y rurales. La muestra rural podría ser sub-representadas en la muestra, pero pondera de forma apropiada en el análisis para compensar.

De manera más general, los datos generalmente se deben ponderar si el diseño de la muestra no da a cada individuo la misma oportunidad de ser seleccionado. Por ejemplo, cuando los hogares tienen probabilidades de selección iguales pero una persona es entrevistado dentro de cada hogar, esto da a la gente de los hogares grandes menos posibilidades de ser entrevistado. Esto se puede explicar usando ponderaciones de la encuesta. Del mismo modo, los hogares con más de una línea telefónica tienen una mayor probabilidad de ser seleccionado en una muestra de la marcación de dígitos al azar, y los pesos pueden ajustar esto.

Los pesos también pueden servir para otros fines, tales como ayudar a corregir la falta de respuesta.

Historia

El muestreo aleatorio utilizando lotes es una vieja idea, menciona varias veces en la Biblia. En 1786 Pierre Simon Laplace calculó que la población de Francia mediante el uso de una muestra, junto con estimador de razón. También calcula las estimaciones probabilísticas del error. Estos no se expresaron como moderna los intervalos de confianza, pero como el tamaño de la muestra que se necesita para lograr un superior particular con destino en el error de muestreo con probabilidad 1000/1001. Sus estimaciones utilizadas El teorema de Bayes con un uniforme probabilidad anterior y asumió su muestra era la teoría aleatoria.Las de estadísticas con muestras pequeñas desarrollada por William Sealy Gosset puso el tema sobre una base más rigurosa en el siglo 20. Sin embargo, la importancia de un muestreo aleatorio no fue universalmente apreciado y en los EE.UU. el 1936 Predicción Literary Digest de una victoria republicana en la elección presidencial fue mal mal, debido a la severa sesgo. Un tamaño de muestra de un millón se obtuvo a través de listas de suscripción de revistas y directorios telefónicos. No se aprecia que estas listas fueron fuertemente sesgadas hacia los republicanos y la muestra resultante, aunque muy grande, era profundamente defectuoso.

Recuperado de " http://en.wikipedia.org/w/index.php?title=Sampling_(statistics)&oldid=208695328 "