Contrastes de Hipótesis

Hipótesis estadísticas y tipos de contrastes de hipótesis

Hipótesis estadística

En muchos estudios estadísticos, el objetivo, más que estimar el valor de un parámetro desconocido en la población, es comprobar la veracidad de una hipótesis formulada sobre la población objeto de estudio.

El investigador, de acuerdo a su experiencia o a estudios previos, suele tener conjeturas sobre la población estudiada que expresa en forma de hipótesis.

Definición - Hipótesis estadística. Una hipótesis estadística es cualquier afirmación o conjetura que determina, total o parcialmente, la distribución de una o varias variables de la población.

Ejemplo. Para contrastar el rendimiento académico de un grupo de alumnos en una determinada asignatura, podríamos platear la hipótesis de si el porcentaje de aprobados es mayor del 50%.

Contraste de hipótesis

En general nunca se sabrá con absoluta certeza si una hipótesis estadística es cierta o falsa, ya que para ello habría que estudiar a todos los individuos de la población.

Para comprobar la veracidad o falsedad de estas hipótesis hay que contrastarlas con los resultados empíricos obtenidos de las muestras. Si los resultados observados en las muestras coinciden, dentro del margen de error admisible debido al azar, con lo que cabría esperar en caso de que la hipótesis fuese cierta, la hipótesis se aceptará como verdadera, mientras que en caso contrario se rechazará como falsa y se buscarán nuevas hipótesis capaces de explicar los datos observados.

Como las muestras se obtienen aleatoriamente, la decisión de aceptar o rechazar una hipótesis estadística se tomará sobre una base de probabilidad.

La metodología que se encarga de contrastar la veracidad de las hipótesis estadísticas se conoce como contraste de hipótesis.

Tipos de contrastes de hipótesis

  • Contrastes de bondad de ajuste: El objetivo es comprobar una hipótesis sobre la forma de la distribución de la población.

Ejemplo. Contrastar si las notas de un grupo de alumnos siguen una distribución normal.

  • Contrastes de conformidad: El objetivo es comprobar una hipótesis sobre alguno de los parámetros de la población.

    Ejemplo. Contrastar si las nota media en un grupo de alumnos es igual a 5.

  • Contrastes de homogeneidad : El objetivo es comparar dos poblaciones con respecto a alguno de sus parámetros.

    Ejemplo. Contrastar si el rendimiento de dos grupos de alumnos es el mismo comparando sus notas medias.

  • Contrastes de independencia: El objetivo es comprobar si existe relación entre dos variables de la población.

    Ejemplo. Contrastar si existe relación entre la notas de dos asignaturas diferentes.

Cuando las hipótesis se plantean sobre parámetros de la población, también se habla de contrastes paramétricos.

Planteamiento de un contraste de hipótesis

Hipótesis nula e hipótesis alternativa

En la mayoría de los casos un contraste supone tomar una decisión entre dos hipótesis antagonistas:

  • Hipótesis nula: Es la hipótesis conservadora, ya que se mantendrá mientras que los datos de las muestras no reflejen claramente su falsedad. Se representa como H0.

  • Hipótesis alternativa: Es la negación de la hipótesis nula y generalmente representa la afirmación que se pretende probar. Se representa como H1.

Ambas hipótesis se eligen de acuerdo con el principio de simplicidad científica:

“Solamente se debe abandonar un modelo simple por otro más complejo cuando la evidencia a favor del último sea fuerte.” (Navaja de Occam)

Elección de las hipótesis nula y alternativa

Analogía con un juicio

En el caso de un juicio, en el que el juez debe decidir si el acusado es culpable o inocente, la elección de hipótesis debería ser

H0: InocenteH1: Culpable

ya que la inocencia se asume, mientras que la culpabilidad hay que demostrarla.

Según esto, el juez sólo aceptaría la hipótesis alternativa cuando hubiese pruebas significativas de la culpabilidad del acusado.

El investigador jugaría el papel del fiscal, ya que su objetivo consistiría en intentar rechazar la hipótesis nula, es decir, demostrar culpabilidad del acusado.

¡Esta metodología siempre favorece a la hipótesis nula!

Contrastes de hipótesis paramétricos

En muchos contrastes, sobre todo en las pruebas de conformidad y de homogeneidad, las hipótesis se formulan sobre parámetros desconocidos de la población como puede ser una media, una varianza o una proporción.

En tal caso, la hipótesis nula siempre asigna al parámetro un valor concreto, mientras que la alternativa suele ser una hipótesis abierta que, aunque opuesta a la hipótesis nula, no fija el valor del parámetro.

Esto da lugar a tres tipos de contrastes:

Bilateral Unilateral menor Unilateral mayor
H0: θ=θ0 H0: θ=θ0 H0: θ=θ0
H1: θθ0 H1: θ<θ0 H1: θ>θ0

Elección del tipo de contraste

Ejemplo. Supóngase que existen sospechas de que en una población hay menos hombres que mujeres.

¿Qué tipo de contraste debería plantearse para validar o refutar esta sospecha?

  1. Las sospechas se refieren al porcentaje o la proporción p de hombres en la población, por lo que se trata de un contraste paramétrico.

  2. El objetivo es averiguar el valor de p, por lo que se trata de una prueba de conformidad. En la hipótesis nula el valor de p se fijará a 0.5 ya que, de acuerdo a las leyes de la genética, en la población debería haber la misma proporción de hombres que de mujeres.

  3. Finalmente, existen sospechas de que el porcentaje de hombres es menor que el de mujeres, por lo que la hipótesis alternativa será de menor p<0.5.

Así pues, el contraste que debería plantearse es el siguiente:

H0:p=0.5H1:p<0.5

Estadístico del contraste

La aceptación o rechazo de la hipótesis nula depende, en última instancia, de lo que se observe en la muestra.

La decisión se tomará según el valor que presente algún estadístico de la muestra relacionado con el parámetro o característica que se esté contrastando, y cuya distribución de probabilidad debe ser conocida suponiendo cierta la hipótesis nula y una vez fijado el tamaño de la muestra. Este estadístico recibe el nombre de estadístico del contraste.

Para cada muestra, el estadístico dará una estimación a partir de la cual se tomará la decisión: si la estimación difiere demasiado del valor esperado bajo la hipótesis H0, entonces se rechazará, y en caso contrario se aceptará.

La lógica que guía la decisión es la de mantener la hipótesis nula a no ser que en la muestra haya pruebas contundentes de su falsedad. Siguiendo con el símil del juicio, se trataría de mantener la inocencia mientras no haya pruebas claras de culpabilidad.

Ejemplo. Volviendo al ejemplo del contraste sobre la proporción de hombres de una población

H0:p=0.5H1:p<0.5

Si para resolver el contraste se toma una muestra aleatoria de 10 personas, podría tomarse como estadístico del contraste X el número de hombres en la muestra.

Suponiendo cierta la hipótesis nula, el estadístico del contraste seguiría una distribución binomial XB(10,,0.5), de manera que el número esperado de hombres en la muestra sería 5.

Así pues, es lógico aceptar la hipótesis nula si en la muestra se obtiene un número de hombres próximo a 5 y rechazarla cuando el número de hombres sea muy inferior a 5. Pero, ¿dónde poner el límite entre los valores X que lleven a la aceptación y los que lleven al rechazo?

Regiones de aceptación y de rechazo

Una vez elegido el estadístico del contraste, lo siguiente es decidir para qué valores de este estadístico se decidirá aceptar la hipótesis nula y para que valores se rechazará. Esto divide del conjunto de valores posibles del estadístico en dos regiones:

  • Región de aceptación: Es el conjunto de valores del estadístico del contraste a partir de los cuales se decidirá aceptar la hipótesis nula.

  • Región de rechazo: Es el conjunto de valores del estadístico del contraste a partir de los cuales se decidirá rechazar la hipótesis nula, y por tanto, aceptar la hipótesis alternativa.

Dependiendo de la dirección del contraste, la región de rechazo quedará a un lado u otro del valor esperado del estadístico del contraste según la hipótesis nula:

  • Contraste bilateral H0: θ=θ0 H1: θθ0. Regiones de un contraste bilateral

  • Contraste unilateral de menor H0: θ=θ0 &H_1:\ \theta<\theta_0$. Regiones de un contraste unilateral de menor

  • Contraste unilateral de mayor H0: θ=θ0 H1: θ>θ0. Regiones de un contraste unilateral de mayor

Ejemplo. Siguiendo con el ejemplo del contraste sobre la proporción de hombres de una población

H0:p=0.5H1:p<0.5

Como el estadístico del contraste tenía una distribución binomial XB(10,,0.5) suponiendo cierta la hipótesis nula, su recorrido será de 0 a 10 y su valor esperado 5, por lo que, al tratarse de un contraste unilateral de menor, la región de rechazo quedará por debajo del 5. Pero, ¿dónde poner el límite entre las regiones de aceptación y de rechazo?

Regiones de un contraste sobre la proporción de hombres en una muestra de tamño 10.

Errores en un contraste de hipótesis

Hemos visto que un contraste de hipótesis se realiza mediante una regla de decisión que permite aceptar o rechazar la hipótesis nula dependiendo del valor que tome el estadístico del contraste.

Al final el contraste se resuelve tomando una decisión de acuerdo a esta regla. El problema es que nunca se conocerá con absoluta certeza la veracidad o falsedad de una hipótesis, de modo que al aceptarla o rechazarla es posible que se esté tomando una decisión equivocada.

Los errores que se pueden cometer en un contraste de hipótesis son de dos tipos:

  • Error de tipo I: Se comete cuando se rechaza la hipótesis nula siendo esta verdadera.

  • Error de tipo II: Se comete cuando se acepta la hipótesis nula siendo esta falsa.

DecisiónH0 ciertaH1 ciertaAceptar H0Decisión correctaError de tipo IIRechazar H0Error de tipo IDecisión correcta

Riesgos de los errores de un contraste de hipótesis

Los riesgos de cometer cada tipo de error se cuantifican mediante probabilidades:

Definición - Riesgos α y β. En un contraste de hipótesis, se define el riesgo α como la máxima probabilidad de cometer un error de tipo I, es decir,

P(Rechazar H0|H0)α,

y se define el riesgo β como la máxima probabilidad de cometer un error de tipo II, es decir,

P(Aceptar H0|H1)β.$

Interpretación del riesgo α

En principio, puesto que esta metodología favorece a la hipótesis nula, el error del tipo I suele ser más grave que el error del tipo II, y por tanto, el riesgo α suele fijarse a niveles bajos de 0.1, 0.05 o 0.01, siendo 0.05 lo más habitual.

Debe tenerse cuidado al interpretar el riesgo α ya que se trata de una probabilidad condicionada a que la hipótesis nula sea cierta. Por tanto, cuando se rechace la hipótesis nula con un riesgo α=0.05, es erróneo decir 5 de cada 100 veces nos equivocaremos, ya que esto sería cierto sólo si la hipótesis nula fuese siempre verdadera.

Tampoco tiene sentido hablar de la probabilidad de haberse equivocado una vez tomada una decisión a partir de una muestra concreta, pues en tal caso, si se ha tomado la decisión acertada, la probabilidad de error es 0 y si se ha tomado la decisión equivocada, la probabilidad de error es 1.

Determinación de las regiones de aceptación y de rechazo en función del riesgo α

Una vez fijado el riesgo α que se está dispuesto a tolerar, es posible delimitar las regiones de aceptación y de rechazo para el estadístico del contraste de manera que la probabilidad acumulada en la región de rechazo sea α, suponiendo cierta la hipótesis nula.

Regiones de un contraste bilateral en una distribución normal Regiones de un contraste unilateral de mayor en una distribución normal

Ejemplo. Siguiendo con el contraste sobre la proporción de hombres de una población, como el estadístico del contraste sigue una distribución binomial XB(10,0.5), si se decide rechazar la hipótesis nula cuando en la muestra haya 2 o menos hombres, la probabilidad de cometer un error de tipo I será

P(X2)=f(0)+f(1)+f(2)=0.0010+0.0098+0.0439=0.0547.

Si riesgo máximo de error de tipo I que se está dispuesto a tolerar es α=0.05, ¿qué valores del estadístico permitirán rechazar la hipótesis nula? P(X1)=f(0)+f(1)=0.0010+0.0098=0.0107. Es decir, sólo se podría rechazar la hipótesis nula con 0 o 1 hombres en la muestra.

Regiones de un contraste sobre la proporción de hombres en una muestra de tamño 10.

Riesgo β y tamaño del efecto

Aunque el error de tipo II pueda parecer menos grave, también interesa que el riesgo β sea bajo, ya que de lo contrario será difícil rechazar la hipótesis nula (que es lo que se persigue la mayoría de las veces), aunque haya pruebas muy claras de su falsedad.

El problema, en el caso de contrastes paramétricos, es que la hipótesis alternativa es una hipótesis abierta en la que no se fija el valor del parámetro a contrastar, de modo que, para poder calcular el riesgo β es necesario fijar dicho valor.

Lo normal es fijar el valor del parámetro del contraste a la mínima cantidad para admitir diferencias significativas desde un punto de vista práctico o clínico. Esa mínima diferencia que se considera clínicamente significativa se conoce como tamaño del efecto y se representa por δ.

Potencia de un contraste

Puesto que el objetivo del investigador suele ser rechazar la hipótesis nula, a menudo, lo más interesante de un contraste es su capacidad para detectar la falsedad de la hipótesis nula cuando realmente hay diferencias mayores que δ entre el verdadero valor del parámetro y el que establece la hipótesis nula.

Definición - Potencia de un contraste. La potencia de un contraste de hipótesis se define como

Potencia=P(Rechazar H0|H1)=1P(Aceptar H0|H1)=1β.

Así pues, al reducir el riesgo β se aumentará la potencia del contraste.

Un contraste poco potente no suele ser interesante ya que no permitirá rechazar la hipótesis nula aunque haya evidencias en su contra.

Cálculo del riesgo β y de la potencia 1β

Ejemplo Supóngase que en el contraste sobre la proporción de hombres no se considera importante una diferencia de menos de un 10% con respecto al valor que establece la hipótesis nula, es decir, δ=0.1.

Esto permite fijar la hipótesis alternativa

H1: p=0.50.1=0.4.

Suponiendo cierta esta hipótesis el estadístico del contraste seguiría una distribución binomial XB(10,,0.4).

En tal caso, el riesgo β para las regiones de aceptación y rechazo fijadas antes será

β=P(Aceptar H0|H1)=P(X2)=1P(X<2)=10.0464=0.9536.

Como puede apreciarse, se trata de un riesgo β muy alto, por lo que la potencia del contraste sería sólo de

1β=10.9536=0.0464,

lo que indica que no se trataría de un buen contraste para detectar diferencias de un 10% en el valor del parámetro.

Relación del riesgo β y el tamaño del efecto δ

El riesgo β depende directamente de la mínima diferencia δ que se desea detectar con respecto al valor del parámetro que establece la hipótesis nula.

Riesgo beta para un tamaño del efecto pequeño. Riesgo beta para un tamaño del efecto grande.

Ejemplo. Si en el contraste sobre la proporción de hombres se desease detectar una diferencia de al menos un 20% con respecto al valor que establece la hipótesis nula, es decir, δ=0.2, entonces la hipótesis alternativa se fijaría a

H1: p=0.50.2=0.3,

y bajo esta hipótesis el estadístico del contraste seguiría una distribución binomial XB(10,,0.3).

En tal caso, el riesgo β para las regiones de aceptación y rechazo fijadas antes sería

β=P(Aceptar H0|H1)=P(X2)=1P(X<2)=10.1493=0.8507,

por lo que el riesgo riesgo β disminuiría y la potencia del contraste aumentaría

1β=10.8507=0.1493,

aunque seguiría siendo un contraste poco potente.

Relación entre los riesgos α y β

Los riesgos α y β están enfrentados, es decir, cuando uno aumenta el otro disminuye y viceversa.

Riesgo beta para un tamaño del efecto pequeño. Riesgo beta para un tamaño del efecto grande.

Ejemplo. Si en el contraste sobre la proporción de hombres toma como riesgo α=0.1, entonces la región de rechazo sería X2 ya que, suponiendo cierta la hipótesis nula, XB(10,,0.5), y

P(X2)=0.05470.1=α.

Entonces, para una diferencia mínima δ=0.1 y suponiendo cierta la hipótesis alternativa, XB(10,,0.4), el riesgo β será

β=P(Aceptar H0|H1)=P(X3)=1P(X<3)=10.1673=0.8327,

y ahora la potencia ha subido hasta

1β=10.8327=0.1673.

Relación de los riesgos de error y el tamaño muestral

Los riesgos de error también dependen el tamaño de la muestra, ya que al aumentar el tamaño de la muestra, la dispersión del estadístico del contraste disminuye y con ello también lo hacen los riesgos de error.

Riesgo beta para un tamaño del efecto grande. Riesgo beta para un tamaño del efecto grande.

Ejemplo. Si para realizar el contraste sobre la proporción de hombres se hubiese tomado una muestra de tamaño 100, en lugar de 10, entonces, bajo la suposición de certeza de la hipótesis nula, el estadístico del contraste seguiría una distribución binomial B(100,,0.5), y ahora la región de rechazo sería X41, ya que

P(X41)=0.04430.05=α.

Entonces, para δ=0.1 y suponiendo cierta la hipótesis alternativa, XB(100,,0.4), el riesgo β sería

β=P(Aceptar H0|H1)=P(X42)=0.3775,

y ahora la potencia habría aumentado considerablemente

1β=10.3775=0.6225.

Este contraste sería mucho más útil para detectar una diferencia de al menos un 10% con respecto al valor del parámetro que establece la hipótesis nula.

Curva de potencia

La potencia de un contraste depende del valor del parámetro que establezca la hipótesis alternativa y, por tanto, es una función de este

Potencia(x)=P(Rechazar H0|θ=x).

Esta función da la probabilidad de rechazar la hipótesis nula para cada valor del parámetro y se conoce como curva de potencia.

Cuando no se puede fijar el valor concreto del parámetro en la hipótesis alternativa, resulta útil representar esta curva para ver la bondad del contraste cuando no se rechaza la hipótesis nula. También es útil cuando sólo de dispone de un número determinado de individuos en la muestra, para ver si merece la pena hacer el estudio.

Un contraste será mejor cuanto mayor sea el área encerrada por debajo de la curva de potencia.

Ejemplo. La curva de potencia correspondiente al contraste sobre la proporción de hombres en la población es la siguiente

Curva de potencia para muestras de distinto tamaño.

p-valor de un contraste de hipótesis

En general, siempre que la estimación del estadístico caiga dentro de la región de rechazo, rechazaremos la hipótesis nula, pero evidentemente, si dicha estimación se aleja bastante de la región de aceptación tendremos más confianza en el rechazo que si la estimación está cerca del límite entre las regiones de aceptación y rechazo.

Por este motivo, al realizar un contraste, también se calcula la probabilidad de obtener una discrepancia mayor o igual a la observada entre la estimación del estadístico del contraste y su valor esperado según la hipótesis nula.

Definición- p-valor. En un contraste de hipótesis, para cada estimación x0 del estadístico del contraste X, dependiendo del tipo de contraste, se define el p-valor del contraste como

Contraste bilateral:2P(Xx0|H0)Contraste unilateral de menor:P(Xx0|H0)Contraste unilateral de mayor:P(Xx0|H0)

En cierto modo, el p-valor expresa la confianza que se tiene al tomar la decisión de rechazar la hipótesis nula. Cuanto más próximo esté el p-valor a 1, mayor confianza existe al aceptar la hipótesis nula, y cuanto más próximo esté a 0, mayor confianza hay al rechazarla.

Una vez fijado el riesgo α, la regla de decisión para realizar un contraste también puede expresarse de la siguiente manera:

Regla de decisión de un contraste

Si p-valor αRechazar H0Si p-valor >αAceptar H0.

De este modo, el p-valor nos da información de para qué niveles de significación puede rechazarse la hipótesis nula y para cuales no.

Ejemplo. Si el contraste sobre la proporción de hombres se toma una muestra de tamaño 10 y se observa 1 hombre, entonces el p-valor, bajo a supuesta certeza de la hipótesis nula, XB(10,,0.5), será

p=P(X1)=0.0107,

mientras que si en la muestra se observan 0 hombres, entonces el p-valor será

p=P(X0)=0.001.

En el primer caso se rechazaría la hipótesis nula para un riesgo α=0.05, pero no podría rechazarse par un riesgo α=0.01, mientas que en el segundo caso también se rechazaría para α=0.01. Es evidente que en el segundo la decisión de rechazar la hipótesis nula se tomaría con mayor confianza.

Pasos para la realización de un contraste de hipótesis

  1. Formular la hipótesis nula H0 y la alternativa H1.
  2. Fijar los riesgos α y β deseados.
  3. Seleccionar el estadístico del contraste.
  4. Fijar la mínima diferencia clínicamente significativa (tamaño del efecto) δ.
  5. Calcular el tamaño muestral necesario n.
  6. Delimitar las regiones de aceptación y rechazo.
  7. Tomar una muestra de tamaño n.
  8. Calcular el estadístico del contraste en la muestra.
  9. Rechazar la hipótesis nula si la estimación cae en la región de rechazo o bien si el p-valor es menor que el riesgo α y aceptarla en caso contrario.

Contrastes paramétricos más importantes

Pruebas de conformidad:

  • Contraste para la media de una población normal con varianza conocida.
  • Contraste para la media de una población normal con varianza desconocida.
  • Contraste para la media de una población con varianza desconocida a partir de muestras grandes.
  • Contraste para la varianza de una población normal.
  • Contraste para un proporción de una población.

Pruebas de homogeneidad:

  • Contraste de comparación de medias de dos poblaciones normales con varianzas conocidas.
  • Contraste de comparación de medias de dos poblaciones normales con varianzas desconocidas pero iguales.
  • Contraste de comparación de medias de dos poblaciones normales con varianzas desconocidas y diferentes.
  • Contraste de comparación de varianzas de dos poblaciones normales.
  • Contraste de comparación de proporciones de dos poblaciones.

Pruebas de conformidad

Contraste para la media de una población normal con varianza conocida

Sea X una variable aleatoria que cumple las siguientes condiciones:

  • Su distribución es normal XN(μ,σ).
  • La media μ es desconocida, pero su varianza σ2 es conocida.

Contraste:

H0:μ=μ0H1:μμ0

Estadístico del contraste:

x¯N(μ0,σn)Z=x¯μ0σ/nN(0,1).

Región de aceptación: zα/2<Z<z1α/2.
Región de rechazo: Zzα/2 y Zz1α/2.

Contraste para la media de una población normal con varianza desconocida

Sea X una variable aleatoria que cumple las siguientes condiciones:

  • Su distribución es normal XN(μ,σ).
  • Tanto su media μ como su varianza σ2 son desconocidas.

Contraste:

H0:μ=μ0H1:μμ0

Estadístico del contraste: Utilizando la cuasivarianza como estimador de la varianza poblacional se tiene

x¯N(μ0,σn)T=x¯μ0s^/nT(n1).

Región de aceptación: tα/2n1<T<t1α/2n1.
Región de rechazo: Ttα/2n1 y Tt1α/2n1.

Ejemplo. En un grupo de alumnos se quiere contrastar si la nota media de estadística es mayor que 5 puntos. Para ello se toma la siguiente muestra:

6.3, 5.4, 4.1, 5.0, 8.2, 7.6, 6.4, 5.6, 4.3, 5.2

El contraste que se plantea es

H0:μ=5H1:μ>5

Para realizar el contraste se tiene:

  • x¯=6.3++5.210=58.110=5.81 puntos.
  • s^2=(6.35.56)2++(5.25.56)29=15.9499=1.7721 puntos2, y s^=1.3312 puntos.

Y el estadístico del contraste vale

T=x¯μ0s^/n=5.8151.3312/10=1.9246.

El p-valor del contraste es P(T(9)1.9246)=0.04323, lo que indica que se rechazaría la hipótesis nula para α=0.05.

La región de rechazo es

T=x¯51.3312/10t0.959=1.8331x¯5+1.83311.331210=5.7717,

de modo que se rechazará la hipótesis nula siempre que la media de la muestra sea mayor que 5.7717 y se aceptará en caso contrario.

Suponiendo que en la práctica la mínima diferencia importante en la nota media fuese de un punto δ=1, entonces bajo la hipótesis alternativa H1:μ=6, si se decidiese rechazar la hipótesis nula, el riesgo β sería

β=P(T(9)5.771761.331210)=P(T(9)0.5424)=0.3004,

de manera que la potencia del contraste para detectar una diferencia de δ=1 punto sería 1β=10.3004=0.6996.

Determinación del tamaño muestral en un contraste para la media

Se ha visto que para un riesgo α la región de rechazo era

$$ T=\frac{\bar x-\mu_0}{\hat s/\sqrt{n}} \geq t^{n-1}{1-\alpha} \approx z{1-\alpha}\quad \mbox{para } n\geq 30. $$

o lo que es equivalente

x¯μ0+z1αs^n.

Si el tamaño del efecto es δ, para una hipótesis alternativa H1:μ=μ0+δ, el riesgo β es

β=P(Z<μ0+z1αs^n(μ0+δ)s^n)=P(Z<z1αs^nδs^n).

de modo que

zβ=z1αs^nδs^nδ=(z1αzβ)s^nn=(z1αzβ)2s^2δ2=(zα+zβ)2s^2δ2.

Ejemplo. Se ha visto en el ejemplo anterior que la potencia del contraste para detectar una diferencia en la nota media de 1 punto era del 69.96. Para aumentar la potencia del test hasta un 90, ¿cuántos alumnos habría que tomar en la muestra?

Como se desea una potencia 1β=0.9, el riesgo β=0.1 y mirando en la tabla de la normal estándar se puede comprobar que zβ=z0.1=1.2816.

Aplicando la fórmula anterior para determinar el tamaño muestral necesario, se tiene

n=(zα+zβ)2s^2δ2=(1.6449+1.2816)21.772112=15.18,

de manera que habría que haber tomado al menos 16 alumnos.

Contraste para la media de una población con varianza desconocida y muestras grandes n30

Sea X una variable aleatoria que cumple las siguientes condiciones:

  • Su distribución puede ser de cualquier tipo.
  • Tanto su media μ como su varianza σ2 son desconocidas.

Contraste:

H0:μ=μ0H1:μμ0

Estadístico del contraste: Utilizando la cuasivarianza como estimador de la varianza poblacional y gracias al teorema central del límite por tratarse de muestras grandes (n30) se tiene

x¯N(μ0,σn)Z=x¯μ0s^/nN(0,1).

Región de aceptación: zα/2<Z<zα/2.
Región de rechazo: Zzα/2 y Zzα/2.

Contraste para la varianza de una población normal

Sea X una variable aleatoria que cumple las siguientes hipótesis:

  • Su distribución es normal XN(μ,σ).
  • Tanto su media μ como su varianza σ2 son desconocidas.

Contraste:

H0:σ=σ0H1:σσ0

Estadístico del contraste: Partiendo de la cuasivarianza muestral como estimador de la varianza poblacional, se tiene

J=nS2σ02=(n1)S^2σ02χ2(n1),

que sigue una distribución chi-cuadrado de n1 grados de libertad.

Región de aceptación: χα/2n1<J<χ1α/2n1.
Región de rechazo: Jχα/2n1 y Jχ1α/2n1.

Ejemplo. En un grupo de alumnos se quiere contrastar si la desviación típica de la nota es mayor de 1 punto. Para ello se toma la siguiente muestra:

6.3, 5.4, 4.1, 5.0, 8.2, 7.6, 6.4, 5.6, 4.3, 5.2

El contraste que se plantea es

H0:σ=1H1:σ>1

Para realizar el contraste se tiene:

  • x¯=6.3++5.210=58.110=5.81 puntos.
  • s^2=(6.35.56)2++(5.25.56)29=15.9499=1.7721 puntos2.

El estadístico del contraste vale

J=(n1)S^2σ02=91.772112=15.949,

y el p-valor del contraste es P(χ(9)15.949)=0.068, por lo que no se puede rechazar la hipótesis nula para α=0.05.

Contraste para proporción de una población

Sea p la proporción de individuos de una población que tienen una determinada característica.

Contraste:

H0:p=p0H1:pp0

Estadístico del contraste: La variable que mide el número de individuos con la característica en una muestra aleatoria de tamaño n sigue una distribución binomial XB(n,p0). De acuerdo al teorema central del límite, para muestras grandes (np5 y n(1p)5), XN(np0,np0(1p0)), y se cumple

p^=XnN(p0,p0(1p0)n)Z=p^p0p0(1p0)/nN(0,1).

Región de aceptación: zα/2<Z<z1α/2.
Región de rechazo: Zzα/2 y Zz1α/2.

Ejemplo. En un grupo de alumnos se desea estimar si el porcentaje de aprobados es mayor del 50. Para ello se toma una muestra de 80 alumnos entre los que hay 50 aprobados.

El contraste que se plantea es

H0:p=0.5H1:p>0.5

Para realizar el contraste se tiene que p^=50/80=0.625 y como se cumple np^=800.625=505 y n(1p^)=80(10.625)=305, el estadístico del contraste vale

Z=p^p0p0(1p0)/n=0.6250.50.5(10.5)/80=2.2361.

y el p-valor del contraste es P(Z2.2361)=0.0127, por lo que se rechaza la hipótesis nula para α=0.05 y se concluye que el porcentaje de aprobados es mayor de la mitad.

Pruebas de homogeneidad

Contraste de comparación de medias de dos poblaciones normales con varianzas conocidas

Sean X1 y X2 dos variables aleatorias que cumplen las siguientes condiciones:

  • Su distribución es normal X1N(μ1,σ1) X2N(μ2,σ2).
  • Sus medias μ1 y μ2 son desconocidas, pero sus varianzas σ12 y σ22 son conocidas.

Contraste:

H0:μ1=μ2H1:μ1μ2

Estadístico del contraste:

X¯1N(μ1,σ1n1)X¯2N(μ2,σ2n2)} X¯1X¯2N(μ1μ2,σ12n1+σ22n2)Z=X¯1X¯2σ12n1+σ22n2N(0,1).

Región de aceptación: zα/2<Z<zα/2.
Región de rechazo: Zzα/2 y Zzα/2.

Contraste de comparación de medias de dos poblaciones normales con varianzas desconocidas e iguales

Sean X1 y X2 dos variables aleatorias que cumplen las siguientes condiciones:

  • Su distribución es normal X1N(μ1,σ1) y X2N(μ2,σ2).
  • Sus medias μ1 y μ2 son desconocidas y sus varianzas también, pero son iguales σ12=σ22=σ2.

Contraste:

H0:μ1=μ2H1:μ1μ2

Estadístico del contraste:

X¯1X¯2N(μ1μ2,σn1+n2n1n2)n1S12+n2S22σ2χ2(n1+n22)}T=X¯1X¯2S^pn1+n2n1n2T(n1+n22).

Región de aceptación: tα/2n1+n22<T<tα/2n1+n22.
Región de rechazo: Ttα/2n1+n22 y Ttα/2n1+n22.

Ejemplo. Se quiere comparar el rendimiento académico de dos grupos de alumnos, uno con 10 alumnos y otro con 12, que han seguido metodologías diferentes. Para ello se les realiza un examen y se obtienen las siguientes puntuaciones:

X1:4687765253X2:895387868757

El contraste que se plantea es

H0:μ1=μ2H1:μ1μ2

Para realizar el contraste, se tiene

  • X¯1=4++310=5.3 puntos y X¯2=8++712=6.75 puntos.
  • S12=(42++32105.32=3.21 puntos2 y S22=82++32126.752=2.69 puntos2.
  • S^p2=103.21+122.687510+122=3.2175 puntos2, y S^p=1.7937.

Si se suponen varianzas iguales, el estadístico del contraste vale

T=X¯1X¯2S^pn1+n2n1n2=5.36.751.793710+121012=1.8879,

y el p-valor del contraste es 2P(T(20)1.8879)=0.0736, de modo que no se puede rechazar la hipótesis nula y se concluye que no hay diferencias significativas entre las notas medias de los grupos.

Contraste de comparación de medias de dos poblaciones normales con varianzas desconocidas

Sean X1 y X2 dos variables aleatorias que cumplen las siguientes condiciones:

  • Su distribución es normal X1N(μ1,σ1) y X2N(μ2,σ2).
  • Sus medias μ1, μ2 y varianzas σ12, σ22, son desconocidas, pero σ12σ22.

Contraste:

H0:μ1=μ2H1:μ1μ2

Estadístico del contraste:

T=(X¯1X¯2)(μ1μ2)S^12n1+S^22n2T(g),

con g=n1+n22Δ y

Δ=(n21n1S^12n11n2S^22)2n21n12S^14+n11n22S^24.

Región de aceptación: tα/2g<T<tα/2g.
Región de rechazo: Ttα/2g y Ttα/2g.

Contraste de comparación de varianzas de dos poblaciones normales

Sean X1 y X2 dos variables aleatorias que cumplen las siguientes condiciones:

  • Su distribución es normal X1N(μ1,σ1) y X2N(μ2,σ2).
  • Sus medias μ1, μ2 y varianzas σ12, σ22 son desconocidas.

Contraste:

H0:σ1=σ2H1:σ1σ2

Estadístico del contraste: (n11)S^12σ12χ2(n11)(n21)S^22σ22χ2(n21)}F=(n11)S^12σ12n11(n21)S^22σ22n21=σ22σ12S^12S^22F(n11,n21).

Región de aceptación: Fα/2n11,n21<F<F1α/2n11,n21.
Región de rechazo: FFα/2n11,n21 y FF1α/2n11,n21.

Ejemplo. Siguiendo con el ejemplo de las puntuaciones en dos grupos:

X1:4687765253X2:895387868757

Si se desea comparar las varianzas, el contraste que se plantea es

H0:σ1=σ2H1:σ1σ2

Para realizar el contraste, se tiene

  • X¯1=4++310=5.3 puntos y X¯2=8++712=6.75 puntos.
  • S^12=(45.3)2++(35.3)29=3.5667 y S^22=(86.75)2++(36.75)211=2.9318 puntos2.

El estadístico del contraste vale

F=S^12S^22=3.56672.9318=1.2165,

y el p-valor del contraste es 2P(F(9,11)1.2165)=0.7468, por lo que se mantiene la hipótesis de igualdad de varianzas.

Contraste de comparación de proporciones de dos poblaciones

Sean p1 y p2 las respectivas proporciones de individuos que presentan una determinada característica en dos poblaciones.

Contraste:

H0:p1=p2H1:p1p2

Estadístico del contraste: Las variables que miden el número de individuos con la característica en dos muestras aleatorias de tamaños n1 y n2 respectivamente, siguen distribuciones binomiales X1B(n1,p1) y X2B(n2,p2). Si las muestras son grandes (nipi5 y ni(1pi)5), de acuerdo al teorema central del límite, X1N(np1,np1(1p1)) y X2N(np2,np2(1p2)), y se cumple

p^1=X1n1N(p1,p1(1p1)n1)p^2=X2n2N(p2,p2(1p2)n2)}Z=p^1p2^p1(1p1)n1+p2(1p2)n2N(0,1)

Región de aceptación: zα/2<Z<z1α/2.
Región de rechazo: zzα/2 y zz1α/2.

Ejemplo. Se quiere comparar los porcentajes de aprobados en dos grupos que han seguido metodologías distintas. En el primer grupo han aprobado 24 alumnos de un total de 40, mientras que en el segundo han aprobado 48 de 60.

El contraste que se plantea es

H0:p1=p2H1:p1p2

Para realizar el contraste, se tiene p^1=24/40=0.6 y p^2=48/60=0.8, de manera que se cumplen las condiciones n1p^1=400.6=245, n1(1p^1)=40(10.6)=265, n2p^2=600.8=485 y n2(1p^2)=60(10.8)=125, y el estadístico del contraste vale

Z=p^1p2^p1(1p1)n1+p2(1p2)n2=0.60.80.6(10.6)40+0.8(10.8)60=2.1483,

y el p-valor del contraste es 2P(Z2.1483)=0.0317, de manera que se rechaza la hipótesis nula para α=0.05 y se concluye que hay diferencias.

Realización de contrastes mediante intervalos de confianza

Una interesante alternativa a la realización de un contraste

H0:θ=θ0H1:θθ0

con un riesgo α, es calcular el intervalo de confianza para θ con un nivel de confianza 1α, ya que este intervalo se puede interpretar como el conjunto aceptable de hipótesis para θ, de manera que si θ0 está fuera del intervalo, la hipótesis nula es poco creíble y puede rechazarse, mientras que si está dentro la hipótesis es creíble y se acepta.

Cuando el contraste sea unilateral de menor, el contraste se realizaría comparando θ0 con el límite superior del intervalo de confianza para θ con un nivel de confianza 12α, mientras que si el contraste es unilateral de mayor, se comparará con el límite inferior del intervalo.

Contraste Intervalo de confianza Decisión
Bilateral [li,ls] con nivel de confianza 1α Rechazar H0 si θ0[li,ls]
Unilateral menor [,ls] con nivel de confianza 12α Rechazar H0 si θ0ls
Unilateral mayor [li,] con nivel de confianza 12α Rechazar H0 si θ0li

Ejemplo. Volviendo al contraste para comparar el rendimiento académico de dos grupos de alumnos que han obtenido las siguientes puntuaciones:

X1:4687765253X2:895387868757

El contraste que se planteaba era

H0:μ1=μ2H1:μ1μ2

Como se trata de un contraste bilateral, el intervalo de confianza para la diferencia de medias μ1μ2 con nivel de confianza 1α=0.95, suponiendo varianzas iguales, vale [3.0521,0.1521] puntos. Y como según la hipótesis nula μ1μ2=0, y el 0 cae dentro del intervalo, se acepta la hipótesis nula.

La ventaja del intervalo es que, además de permitirnos realizar el contraste, nos da una idea de la magnitud de la diferencia entre las medias de los grupos.

Anterior