6 Estimación de parámetros poblacionales
Los modelos de distribución de probabilidad vistos en el tema anterior explican el comportamiento de las variables aleatorias, pero para ello debemos saber qué modelo de distribución sigue una determinada variable. Este es el primer paso de la etapa de Inferencia Estadística.
Para determinar con exactitud el modelo de distribución de una variable hay que conocer la característica estudiada en todos los individuos de la población, lo cual no es posible en la mayoría de los casos (inviabilidad económica, física, temporal, etc.).
Para evitar estos inconvenientes se recurre al estudio de una muestra, a partir de la cual se trata de averiguar, de manera aproximada, el modelo de distribución de la variable en la población.
Estudiar un número reducido de individuos de una muestra en lugar de toda la población tiene indudables ventajas:
- Menor coste.
- Mayor rapidez.
- Mayor facilidad.
Pero también presenta algunos inconvenientes:
- Necesidad de conseguir una muestra representativa.
- Posibilidad de cometer errores (sesgos).
Afortunadamente, estos errores pueden ser superados: La representatividad de la muestra se consigue eligiendo la modalidad de muestreo más apropiada para el tipo de estudio; en el caso de los errores, aunque no se pueden evitar, se tratará de reducirlos al máximo y acotarlos.
6.1 Distribuciones muestrales
Los valores de una variable
Definición 6.1 (Variable aleatoria muestral) Una variable aleatoria muestral de una variable
- Cada una de las variables
sigue la misma distribución de probabilidad que la variable en la población. - Todas las variables
son mutuamente independientes.
Los valores que puede tomar esta variable
Las tres características fundamentales de la variable aleatoria muestral son:
Homogeneidad: Las
variables que componen la variable aleatoria muestral siguen la misma distribución.Independencia: Las variables son independientes entre sí.
Modelo de distribución: El modelo de distribución que siguen las
variables.
Las dos primeras cuestiones pueden resolverse si se utiliza muestreo aleatorio simple para obtener la muestra. En cuanto a la última, hay que responder, a su vez, a dos cuestiones:
- ¿Qué modelo de distribución se ajusta mejor a nuestro conjunto de datos? Esto se resolverá, en parte, mediante la utilización de técnicas no paramétricas.
- Una vez seleccionado el modelo de distribución más apropiado, ¿qué estadístico del modelo nos interesa y cómo determinar su valor? De esto último se encarga la parte de la inferencia estadística conocida como Estimación de Parámetros.
En este tema se abordará la segunda cuestión, es decir, suponiendo que se conoce el modelo de distribución de una población, se intentará estimar los principales parámetros que la definen. Por ejemplo, los principales parámetros que definen las distribuciones vistas en el tema anterior son:
Distribución | Parámetro |
---|---|
Binomial | |
Poisson | |
Uniforme | |
Normal | |
Chi-cuadrado | |
T-Student | |
F-Fisher |
La distribución de probabilidad de los valores de la variable muestral depende claramente de la distribución de probabilidad de los valores de la población.
Ejemplo 6.1 Sea una población en la que la cuarta parte de las familias no tienen hijos, la mitad de las familias tiene 1 hijo, y el resto tiene 2 hijos.
Por ser función de una variable aleatoria, un estadístico en el muestreo es también una variable aleatoria. Por tanto, su distribución de probabilidad también depende de la distribución de la población y de los parámetros que la determinan (
Ejemplo 6.2 Si se toma la media muestral
¿Cuál es la probabilidad de obtener una media muestral que aproxime la media poblacional con un error máximo de 0.5?
Como hemos visto, para conocer la distribución de un estadístico muestral, es necesario conocer la distribución de la población, lo cual no siempre es posible. Afortunadamente, para muestras grandes es posible aproximar la distribución de algunos estadísticos como la media, gracias al siguiente teorema:
Teorema 6.1 (Teorema central del límite) Si
Este teorema además es la explicación de que la mayoría de las variables biológicas presenten una distribución normal, ya que suelen ser causa de múltiples factores que suman sus efectos de manera independiente.
6.1.1 Distribución de la media muestral para muestras grandes ( )
La media muestral de una muestra aleatoria de tamaño
De acuerdo a las propiedades de las transformaciones lineales, la media y la varianza de cada una de estas variables son
con
Entonces, si el tamaño de la muestra es grande (
Ejemplo 6.3 (Ejemplo para muestras grandes (
¿Qué probabilidad hay de estimar
De acuerdo al teorema central del límite se tiene:
- Para
, y
- Para
, y
6.1.2 Distribución de una proporción muestral para muestras grandes ( )
Una proporción
y con media y varianza
Entonces, si el tamaño de la muestra es grande (
6.2 Estimadores
Los estadísticos muestrales pueden utilizarse para aproximar los parámetros de la población, y cuando un estadístico se utiliza con este fin se le llama estimador del parámetro.
Definición 6.2 (Estimador y estimación) Un estimador es una función de la variable aleatoria muestral
Dada una muestra concreta
Por ser una función de la variable aleatoria muestral, un estimador es, a su vez, una variable aleatoria cuya distribución depende de la población de partida.
Mientras que el estimador es una función que es única, la estimación no es única, sino que depende de la muestra tomada.
Ejemplo 6.4 Supóngase que se quiere saber la proporción
Si se toma una muestra aleatoria de tamaño 5,
Este estimador es una variable que se distribuye
Si se toman distintas muestras, se obtienen diferentes estimaciones:
La estimación de parámetros puede realizar de de dos formas:
- Estimación puntual: Se utiliza un único estimador que proporciona un valor o estimación aproximada del parámetro. El principal inconveniente de este tipo de estimación es que no se especifica la bondad de la estimación.
- Estimación por intervalos: Se utilizan dos estimadores que proporcionan los extremos de un intervalo dentro del cual se cree que está el verdadero valor del parámetro con un cierto grado de seguridad. Esta forma de estimar sí permite controlar el error cometido en la estimación.
6.3 Estimación puntual
La estimación puntual utiliza un único estimador para estimar el valor del parámetro desconocido de la población.
En teoría pueden utilizarse distintos estimadores para estimar un mismo parámetro. Por ejemplo, en el caso de estimar la proporción de fumadores en una ciudad, podrían haberse utilizado otros posibles estimadores además de la proporción muestral, como pueden ser:
¿Cuál es el mejor estimador?
La respuesta a esta cuestión depende de las propiedades de cada estimador.
Aunque la estimación puntual no proporciona ninguna medida del grado de bondad de la estimación, existen varias propiedades que garantizan dicha bondad.
Las propiedades más deseables en un estimador son:
- Insesgadez
- Eficiencia
- Consistencia
- Normalidad asintótica
- Suficiencia
Definición 6.3 (Estimador insesgado) Un estimador
Cuando un estimador no es insesgado, a la diferencia entre su esperanza y el valor del parámetro
Cuanto menor sea el sesgo de un estimador, mejor se aproximarán sus estimaciones al verdadero valor del parámetro.
Definición 6.4 (Estimador consistente) Un estimador
Las condiciones suficientes para que un estimador sea consistente son:
o . .
Así pues, si la varianza y el sesgo disminuyen a medida que aumenta el tamaño de la muestra, el estimador será consistente.
Definición 6.5 (Estimador eficiente) Un estimador
Definición 6.6 (Estimador asintóticamente normal) Un estimador
Como veremos más adelante esta propiedad es muy interesante para hacer estimaciones de parámetros mediante intervalos.
Definición 6.7 (Estimador suficiente) Un estimador
Esto significa que cuando se obtiene una estimación, cualquier otra información es irrelevante para
El estimador que se suele utilizar para estimar la media poblacional es la media muestral.
Para muestras de tamaño
Si la población de partida tiene media
Así pues, la media muestral es un estimador insesgado, y como su varianza disminuye a medida que aumenta el tamaño muestral, también es consistente y eficiente.
Sin embargo, la varianza muestral
es un estimador sesgado para la varianza poblacional, ya que
No obstante, resulta sencillo corregir este sesgo para llegar a un estimador insesgado:
Definición 6.8 (Cuasivarianza muestral) Dada una muestra de tamaño
6.4 Estimación por intervalos
El principal problema de la estimación puntual es que, una vez seleccionada la muestra y hecha la estimación, resulta imposible saber el error cometido.
Para controlar el error de la estimación es mejor utilizar la estimación por intervalos
La estimación por intervalos trata de construir a partir de la muestra un intervalo dentro del cual se supone que se encuentra el parámetro a estimar con un cierto grado de confianza. Para ello se utilizan dos estimadores, uno para el límite inferior del intervalo y otro para el superior.
Definición 6.9 (Intervalo de confianza) Dados dos estimadores
Un intervalo de confianza nunca garantiza con absoluta certeza que el parámetro se encuentra dentro él.
Tampoco se puede decir que la probabilidad de que el parámetro esté dentro del intervalo es
Lo que si se deduce de la definición es que el
Para que un intervalo sea útil su nivel de confianza debe ser alto:
siendo
Teóricamente, de cada 100 intervalos para estimar un parámetro
6.4.1 Error de estimación
Otro de los aspectos más importantes de un intervalo de confianza es su error.
Definición 6.10 (Error o imprecisión de un intervalo) El error o la imprecisión de un intervalo de confianza
Para que un intervalo sea útil no debe ser demasiado impreciso.
En general, la precisión de un intervalo depende de tres factores:
La dispersión de la población. Cuanto más dispersa sea, menos preciso será el intervalo.
El nivel de confianza. Cuanto mayor sea el nivel de confianza, menos preciso será el intervalo.
El tamaño muestral. Cuanto mayor sea el tamaño muestral, más preciso será el intervalo.
Si la confianza y la precisión están reñidas, ¿cómo se puede ganar precisión sin perder confianza?
Habitualmente, para calcular un intervalo de confianza se suele partir de un estimador puntual del que se conoce su distribución muestral.
A partir de este estimador se calculan los extremos del intervalo sobre su distribución, buscando los valores que dejan encerrada una probabilidad
6.5 Intervalos de confianza para una población
A continuación se presentan los intervalos de confianza para estimar un parámetro de una poblacion:
- Intervalo para la media de una población normal con varianza conocida.
- Intervalo para la media de una población normal con varianza desconocida.
- Intervalo para la media de una población con varianza desconocida a partir de muestras grandes.
- Intervalo para la varianza de una población normal.
- Intervalo para un proporción de una población.
6.5.1 Intervalo de confianza para la media de una población normal con varianza conocida
Sea
- Su distribución es normal
. - La media
es desconocida, pero su varianza es conocida.
Bajo estas hipótesis, la media muestral, para muestras de tamaño
Tipificando la variable se tiene
Sobre esta distribución resulta sencillo calcular los valores
Como la distribución normal estándar es simétrica respecto al 0, lo mejor es tomar valores opuestos
A partir de aquí, deshaciendo la tipificación, resulta sencillo llegar a los estimadores que darán los extremos del intervalo de confianza:
Así pues, el intervalo de confianza para la media de una población normal con varianza conocida es:
Teorema 6.2 (Intervalo de confianza para la media de una población normal con varianza conocida) Si
De la fórmula del intervalo de confianza
se deducen varias características:
El intervalo está centrado en la media muestral
que era el mejor estimador de la media poblacional.La amplitud o imprecisión del intervalo es
de manera que depende de:
: cuanto mayor sea la varianza poblacional, mayor será la imprecisión. : que a su vez depende del nivel de confianza, y cuanto mayor sea , mayor será la imprecisión. : cuanto mayor sea el tamaño de la muestra, menor será la imprecisión.
Por tanto, la única forma de reducir la imprecisión del intervalo, manteniendo la confianza, es aumentando el tamaño muestral.
6.5.1.1 Cálculo del tamaño muestra para estimar la media de una población normal con varianza conocida
Teniendo en cuenta que la amplitud o imprecisión del intervalo para la media de una población normal con varianza conocida es
se puede calcular fácilmente el tamaño muestral necesario para conseguir un intervalo de amplitud
de donde se deduce
Ejemplo 6.5 Sea una población de estudiantes en la que la puntuación obtenida en un examen sigue una distribución normal
Para estimar la nota media
A partir de esta muestra, podemos calcular el intervalo de confianza para
puntos. es el valor de la normal estándar que deja una probabilidad acumulada superior de , que vale aproximadamente .
Sustituyendo estos valores en la fórmula del intervalo, se tiene
Es decir,
Ejemplo 6.6 La imprecisión del intervalo anterior es de
Si se desea reducir esta imprecisión a
Por tanto, se necesitaría una muestra de al menos 35 estudiantes para conseguir un intervalo del 95% de confianza y una precisión de
6.5.2 Intervalo de confianza para la media de una población normal con varianza desconocida
Sea
- Su distribución es normal
. - Tanto su media
como su varianza son desconocidas.
Cuando se desconoce la varianza poblacional se suele estimar mediante la cuasivarianza
Como la distribución T de Student, al igual que la normal, también es simétrica respecto al 0, se pueden tomar dos valores opuestos
Teorema 6.3 (Intervalo de confianza para la media de una población normal con varianza desconocida) Si
o bien
6.5.2.1 Calculo del tamaño muestral para estimar la media de una población normal con varianza desconocida
Al igual que antes, teniendo en cuenta que la amplitud o imprecisión del intervalo para la media de una población con varianza desconocida es
se puede calcular fácilmente el tamaño muestral necesario para conseguir un intervalo de amplitud
de donde se deduce
El único problema, a diferencia del caso anterior en que
Ejemplo 6.7 Supóngase que en el ejemplo anterior no se conoce la varianza poblacional de las puntuaciones.
Trabajando con la misma muestra de las puntuaciones de 10 estudiantes
se puede calcular el intervalo de confianza para
puntos. y puntos. es el valor de la T de Student de 9 grados de libertad, que deja una probabilidad acumulada superior de , que vale .
Sustituyendo estos valores en la fórmula del intervalo, se tiene
Ejemplo 6.8 Como se puede apreciar, la imprecisión del intervalo anterior es de
Ahora, el tamaño muestral necesario para reducir la imprecisión a
Por tanto, si se desconoce la varianza de la población se necesita una muestra de al menos 55 estudiantes para conseguir un intervalo del 95% de confianza y una precisión de
6.5.3 Intervalo de confianza para la media de una población no normal
Sea
- Su distribución no es normal.
- Tanto su media
como su varianza son desconocidas.
Si la población no es normal las distribuciones de los estimadores de referencia cambian, de manera que los intervalos anteriores no son válidos.
No obstante, si la muestras es grande (
En consecuencia, sigue siendo válido el intervalo anterior.
Teorema 6.4 (Intervalo de confianza para la media de una población no normal con muestras grandes) Si
6.5.4 Intervalo de confianza para la varianza de una población normal
Sea
- Su distribución es normal
. - Tanto su media
como su varianza son desconocidas.
Para estimar la varianza de una población normal, se parte del estimador de referencia
que sigue una distribución chi-cuadrado de
Sobre esta distribución hay que calcular los valores
Como la distribución chi-cuadrado no es simétrica respecto al 0, se toman dos valores
Así pues, se tiene
Por tanto, el intervalo de confianza para la varianza de una población normal es:
Teorema 6.5 (Intervalo de confianza para la varianza de una población normal) Si
Ejemplo 6.9 Siguiendo con el ejemplo de las puntuaciones en un examen, si se quiere estimar la varianza a partir de la muestra:
para el intervalo de confianza para
puntos . es el valor de la chi-cuadrado de 9 grados de libertad, que deja una probabilidad acumulada inferior de , y vale . es el valor de la chi-cuadrado de 9 grados de libertad, que deja una probabilidad acumulada inferior de , y vale .
Sustituyendo estos valores en la fórmula del intervalo, se llega a
6.5.5 Intervalo de confianza para una proporción
Para estimar la proporción
Como ya se vio, si el tamaño muestral es suficientemente grande (en realidad basta que se cumpla
En consecuencia, la proporción muestral
que es el estimador de referencia.
Trabajando con la distribución del estimador de referencia
tras tipificar, se pueden encontrar fácilmente, al igual que hicimos antes, valores
Así pues, deshaciendo la tipificación y razonando como antes, se tiene
Por tanto, el intervalo de confianza para una proporción es
Teorema 6.6 (Intervalo de confianza para una proporción) Si
o bien
6.5.5.1 Cálculo del tamaño muestra para estimar una proporción
La amplitud o imprecisión del intervalo para la proporción de una población es
así que se puede calcular fácilmente el tamaño muestral necesario para conseguir un intervalo de amplitud
de donde se deduce
Para poder hacer el cálculo se necesita una estimación de la proporción
Ejemplo 6.10 Supóngase que se quiere estimar la proporción de fumadores que hay en una determinada población. Para ello se toma una muestra de 20 personas y se observa si fuman (1) o no (0):
Entonces:
, por tanto, se cumple y . es el valor de la normal estándar que deja una probabilidad acumulada superior de , que vale aproximadamente .
Sustituyendo estos valores en la fórmula del intervalo, se tiene
Es decir,
Ejemplo 6.11 Como se puede apreciar la imprecisión del intervalo anterior es
Para conseguir intervalos precisos para estimar proporciones se necesitan tamaños muestrales bastante grandes. Si por ejemplo se quiere una precisión de
Es decir, se necesitarían al menos 369 individuos para conseguir un intervalo para la proporción con una confianza del
6.6 Intervalos de confianza para la comparación dos poblaciones
En muchos estudios el objetivo en sí no es averiguar el valor de un parámetro, sino compararlo con el de otra población. Por ejemplo, comparar si un determinado parámetro vale lo mismo en la población de hombres y en la de mujeres.
En estos casos no interesa realmente estimar los dos parámetros por separado, sino hacer una estimación que permita su comparación.
Se verán tres casos:
- Comparación de medias: Se estima la diferencia de medias
. - Comparación de varianzas: Se estima la razón de varianzas
. - Comparación de proporciones: Se estima la diferencia de proporciones
.
A continuación se presentan los siguientes intervalos de confianza para la comparación de dos poblaciones:
- Intervalo para la diferencia de medias de dos poblaciones normales con varianzas conocidas.
- Intervalo para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales.
- Intervalo para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y diferentes.
- Intervalo para el cociente de varianzas de dos poblaciones normales.
- Intervalo para la diferencia de proporciones de dos poblaciones.
6.6.1 Intervalo de confianza para la diferencia de medias de poblaciones normales con varianzas conocidas
Sean
- Su distribución es normal
y . - Sus medias
y son desconocidas, pero sus varianzas y son conocidas.
Bajo estas hipótesis, si se toman dos muestras independientes, una de cada población, de tamaños
A partir de aquí, tipificando, se pueden buscar los valores de la normal estándar
Y deshaciendo la tipificación, se tiene
Así pues, el intervalo de confianza para la diferencia de medias es
Teorema 6.7 (Intervalo de confianza para la diferencia de medias de poblaciones normales con varianzas conocidas) Si
o bien
6.6.2 Intervalo de confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas e iguales
Sean
- Su distribución es normal
y . - Sus medias
y son desconocidas y sus varianzas también, pero son iguales .
Cuando se desconoce la varianza poblacional se puede estimar a partir de las muestras de tamaños
El estimador de referencia en este caso sigue una distribución T de Student:
A partir de aquí, se pueden buscar los valores de la T de Student
Y deshaciendo la transformación se tiene
Así pues, el intervalo de confianza para la diferencia de medias es
Teorema 6.8 (Intervalo de confianza para la diferencia de medias de poblaciones normales con varianzas desconocidas iguales) Si
o bien
Si
con una confianza del
Por consiguiente, según los valores del intervalo de confianza se tiene:
- Si todos los valores del intervalo son negativos
, entonces se puede concluir que y por tanto . - Si todos los valores del intervalo son positivos
, entonces se puede concluir que y por tanto . - Si el intervalo tiene tanto valores positivos como negativos, y por tanto contiene al 0 (
, entonces no se puede afirmar que una media sea mayor que la otra. En este caso se suele asumir la hipótesis de que las medias son iguales .
Tanto en el primer como en el segundo caso se dice que entre las medias hay diferencias estadísticamente significativas.
Ejemplo 6.12 Supóngase que se quiere comparar el rendimiento académico de dos grupos de alumnos, uno con 10 alumnos y otro con 12, que han seguido metodologías diferentes. Para ello se les realiza un examen y se obtienen las siguientes puntuaciones:
Si se supone que ambas variables tienen la misma varianza, se tiene
y puntos. y puntos . puntos , y . es el valor de la T de Student de 20 grados de libertad que deja una probabilidad acumulada superior de , y que vale aproximadamente .
Y sustituyendo en la fórmula del intervalo llegamos a
Es decir, la diferencia de puntuaciones medias
A la vista del intervalo se puede concluir que, puesto que el intervalo contiene tanto valores positivos como negativos, y por tanto contiene al 0, no puede afirmarse que una de las medias se mayor que la otra, de modo que se supone que son iguales y no se puede decir que haya diferencias significativas entre los grupos.
6.6.3 Intervalo de confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y distintas
Sean
- Su distribución es normal
y . - Sus medias
, y varianzas , , son desconocidas, pero .
En este caso el estimador de referencia sigue una distribución T de Student
donde el número de grados de libertad es
A partir de aquí, una vez más, se pueden buscar los valores de la T de Student
Y deshaciendo la transformación se llega a
Así pues, el intervalo de confianza para la diferencia de medias es
Teorema 6.9 (Intervalo de confianza para la diferencia de medias de poblaciones normales con varianzas desconocidas distintas) Si
o bien
Como se acaba de ver, existen dos intervalos posibles para estimar la diferencia de medias: uno para cuando las varianzas poblacionales son iguales y otro para cuando no lo son.
Ahora bien, si las varianzas poblacionales son desconocidas,
¿cómo saber qué intervalo utilizar?
La respuesta está en el próximo intervalo que se verá, que permite estimar la razón de varianzas
Así pues, antes de calcular el intervalo de confianza para la comparación de medias, cuando las varianzas poblacionales sean desconocidas, es necesario calcular el intervalo de confianza para la razón de varianzas y elegir el intervalo para la comparación de medias en función del valor de dicho intervalo.
6.6.4 Intervalo de confianza para el cociente de varianzas
Sean
- Su distribución es normal
y . - Sus medias
, y varianzas , son desconocidas.
En este caso, para muestras de ambas poblaciones de tamaños
Como la distribución F de Fisher-Snedecor no es simétrica respecto al 0, se toman dos valores
Así pues, se tiene
Por tanto, el intervalo de confianza para la comparación de varianzas de dos poblaciones normales es
Teorema 6.10 (Intervalo de confianza para el cociente de varianzas de poblaciones normales) Si
Si
con una confianza del
Por consiguiente, según los valores del intervalo de confianza se tiene:
- Si todos los valores del intervalo son menores que 1
, entonces se puede concluir que y por tanto . - Si todos los valores del intervalo son mayores que 1
, entonces se puede concluir que y por tanto . - Si el intervalo tiene tanto valores mayores como menores que 1, y por tanto contiene al 1 (
, entonces no se puede afirmar que una varianza sea mayor que la otra. En este caso se suele asumir la hipótesis de que las varianzas son iguales .
Ejemplo 6.13 Siguiendo con el ejemplo de las puntuaciones en dos grupos:
Para calcular el intervalo de confianza para la razón de varianzas con una confianza del
puntos y puntos. puntos y puntos . es el valor de la F de Fisher de 11 y 9 grados de libertad que deja una probabilidad acumulada inferior de , y que vale aproximadamente . es el valor de la F de Fisher de 11 y 9 grados de libertad que deja una probabilidad acumulada inferior de , y que vale aproximadamente .
Sustituyendo en la fórmula del intervalo se llega a
Es decir, la razón de varianzas
Como el intervalo tiene tanto valores menores como mayores que 1, no se puede concluir que una varianza sea mayor que la otra, y por tanto se mantiene la hipótesis de que ambas varianzas son iguales.
Si ahora se quisiesen comparar las medias de ambas poblaciones, el intervalo de confianza para la diferencia de medias que habría que tomar es el que parte de la hipótesis de igualdad de varianzas, que precisamente es el que se ha utilizado antes.
6.6.5 Intervalo de confianza para la diferencia de proporciones
Para comparar las proporciones
Si se toma una muestra de cada población, de tamaños
Cuando los tamaños muestrales son grandes (en realidad basta que se cumpla
y las proporciones muestrales
A partir de las proporciones muestrales se construye el estimador de referencia
Tipificando, se buscan valores
Y deshaciendo la tipificación, se llega a
Así pues, el intervalo de confianza para la diferencia de proporciones es
Teorema 6.11 (Intervalo de confianza para la diferencia de proporciones) Si
Ejemplo 6.14 Supóngase que se quieren comparar las proporciones o porcentajes de aprobados en dos grupos que han seguido metodologías distintas. En el primer grupo han aprobado 24 alumnos de un total de 40, mientras que en el segundo han aprobado 48 de 60.
Para calcular el intervalo de confianza para la diferencia de proporciones con un nivel de confianza del
y , de manera que se cumplen las hipótesis , , y . .
Sustituyendo en la fórmula del intervalo se tiene
Como el intervalo es negativo se tiene