Cómo calcular el margen de error para una media de muestreo

Cuando una pregunta de investigación le pida que encuentre una media (o promedio) de la muestra estadística, debe informar un margen de error, o MOE, para la media de la muestra. La fórmula general para el margen de error de la media de la muestra (suponiendo que se cumpla una determinada condición, véase más adelante) es la siguiente:

Es la desviación estándar de la población, n es el tamaño de la muestra y z* es el valor de z* apropiado para su nivel de confianza deseado (que puede encontrar en la siguiente tabla).

z*-Valores para Confianza Seleccionada (Porcentaje)
NivelesPorcentaje de confianzaz*-Valor801.28901.645951.96982.33992.58Note

que estos valores se toman de la distribución normal (Z-) estándar. El área entre cada valor z* y el negativo de ese valor z* es el porcentaje de confianza (aproximadamente). Por ejemplo, el área entre z*=1.28 y z=-1.28 es aproximadamente 0.80. Este gráfico también se puede ampliar a otros porcentajes de confianza. El gráfico muestra sólo los porcentajes de confianza más comúnmente utilizados.

A continuación se describen los pasos para calcular el margen de error de una media de muestreo:

  1. Encuentre la desviación estándar de la población y el tamaño de la muestra, n.La desviación estándar de la población, se dará en el problema.
  2. Divida la desviación estándar de la población por la raíz cuadrada del tamaño de la muestra.
  3. Multiplique por el valor de z* apropiado (consulte la tabla anterior) Por ejemplo, el valor de z* es 1.96 si desea tener un 95% de confianza.

La población original tiene una distribución normal

La condición que debe cumplir para utilizar un valor z* en la fórmula del margen de error para una media de muestreo es cualquiera de las dos: 1) La población original tiene una distribución normal para empezar, o 2) El tamaño de la muestra es lo suficientemente grande como para que se pueda utilizar la distribución normal (es decir, se aplica el Teorema del Límite Central). En general, el tamaño de la muestra, n, debe ser superior a 30 para que el Teorema del Límite Central sea aplicable. Ahora, si es 29, no se asuste – 30 no es un número mágico, es sólo una regla general. (La desviación estándar de la población debe conocerse de cualquier manera.)

Aquí hay un ejemplo: Suponga que usted es el gerente de una heladería y está capacitando a los nuevos empleados para que puedan llenar los conos de gran tamaño con la cantidad adecuada de helado (10 onzas cada uno). Usted desea estimar el peso promedio de los conos que fabrican en un período de un día, incluyendo un margen de error. En lugar de pesar cada uno de los conos fabricados, pídale a cada uno de sus nuevos empleados que comprueben al azar los pesos de una muestra aleatoria de los conos grandes que fabrican y registren esos pesos en un bloc de notas. Para n = 50 conos muestreados, se encontró que la media de la muestra era de 10.3 onzas. Supongamos que la desviación estándar de la población es de 0.6 onzas.

¿Cuál es el margen de error?

(Suponga que desea un nivel de confianza del 95%.) Se calcula de esta manera:

Así que para reportar estos resultados, usted dice que basado en la muestra de 50 conos, usted estima que el peso promedio de todos los conos grandes hechos por los nuevos empleados en un período de un día es de 10.3 onzas, con un margen de error de más o menos 0.17 onzas. En otras palabras, el rango de valores probables para el peso promedio de todos los conos grandes hechos para el día se estima (con un 95% de confianza) entre 10.30 – 0.17 = 10.13 onzas y 10.30 + 0.17 = 10.47 onzas. Los nuevos empleados parecen estar repartiendo demasiado helado (aunque los clientes probablemente no estén demasiado ofendidos).

Las unidades son onzas

Observe en este ejemplo, las unidades son onzas, no porcentajes! Al trabajar y reportar resultados sobre los datos, recuerde siempre cuáles son las unidades. También, asegúrese de que las estadísticas sean reportadas con sus unidades de medida correctas, y si no lo son, pregunte cuáles son las unidades.

En los casos en los que n es demasiado pequeño (en general, menos de 30) para el Teorema del Límite Central que se va a utilizar, pero todavía cree que los datos proceden de una distribución normal, puede utilizar un valor t* en lugar de un valor z* en sus fórmulas.

Un valor t* es aquel que proviene de una distribución t con n – 1 grados de libertad. De hecho, muchos estadísticos siguen adelante y utilizan los valores t* en lugar de los valores z* de forma consistente, porque si el tamaño de la muestra es grande, los valores t* y z* son aproximadamente iguales de todos modos. Además, para los casos en los que no se conoce la desviación estándar de la población,

puede sustituirlo por s, la desviación estándar del muestreo; a partir de ahí, también puede utilizar un valor t* en lugar de un valor z* en sus fórmulas.

Leave a Reply