Examen Diseños de Investigación y Análisis de Datos enero 2024
La única obligación del usuario es comprometerse a reportar cualquier error detectado durante el uso del servicio Si encuentras algún error gramatical, ortográfico, de contexto u otro tipo, y deseas ayudarnos a solucionarlo, puedes hacerlo mediante Telegram o enviando un email.
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
La hipótesis nula que ha de plantear el director de la academia es:
πUned-πOtras = 0,15
πUned-πOtras ≥ 0,15
πUned-πOtras = 0
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
El valor absoluto del estadístico de contraste obtenido al poner a prueba la hipótesis planteada en la pregunta anterior vale, aproximadamente:
Z = 3,13
Z = 1,27
Z = 2,45
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
La probabilidad de obtener un resultado igual o más extremo que el estadístico de contraste de la pregunta anterior vale, aproximadamente:
0,0009
0,1020
0,2040
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
Tras poner a prueba la veracidad de los datos que maneja, el director de la academia concluye que:
la proporción de aprobados entre los graduados por la UNED supera a la proporción de aprobados entre los graduados de otras universidades por tanta diferencia como se esperaba o más.
la proporción de aprobados entre los graduados por la UNED, no supera a la proporción de aprobados entre los graduados de otras universidades.
la proporción de aprobados entre los graduados por la UNED, supera en 0,15 puntos la proporción de aprobados entre los graduados de otras universidades.
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
Una vez realizadas las oposiciones, el director de la academia quiere comprobar la validez del examen que sus estudiantes realizaron con anterioridad en la academia, observando que 14 estudiantes que superaron el examen realizado en la academia suspendieron las oposiciones y que 11 estudiantes que suspendieron el examen realizado en la academia aprobaron las oposiciones. En definitiva, el director de la academia quiere comprobar si, en la población, la proporción de aprobados es la misma en el examen realizado en la academia y en las oposiciones. Tomando α = 0,01, conteste a las siguientes cuestiones. La hipótesis alternativa es:
H1: πExamen academia = πOposición
H1: πExamen academia ≠ πOposición
H0: πExamen academia = πOposición
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
El valor absoluto del estadístico de contraste y nivel crítico valen:
Z = 11,21; p < 0,004
Z = 0,6; p = 0,5486
Z = 1,72; p < 0,0854
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
Las curvas de potencia permiten localizar la potencia de un contraste en función de:
el valor puntual de H₁ y el tamaño de la muestra.
los valores de H₀ y H₁
la probabilidad de cometer errores de tipo I y de tipo II.
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
El director de la academia concluye que:
el examen realizado en la academia no es muy útil, dado que 25 estudiantes obtuvieron resultados distintos a los obtenidos en la oposición.
dado que los resultados no son significativos para α = 0,01, el examen de la academia le permite estimar adecuadamente cuál será la proporción de aprobados en las oposiciones.
dado que el resultado es significativo incluso para α = 0,01, la proporción de aprobados en el examen realizado en la academia es muy distinto de la proporción de aprobados en la oposición.
SITUACIÓN 1. Según los datos que maneja el director de una academia especializada en preparar unas determinadas oposiciones, aprueban más los graduados de la UNED. Sostiene, que la diferencia entre la proporción de aprobados de los graduados de la UNED respecto a los graduados de otras universidades es de 0,15 puntos. El director quiere comprobar que los datos que maneja son ciertos, para lo que dispone de dos muestras aleatorias de 60 opositores graduados por la UNED y de 100 opositores graduados en otras universidades. Tras preparar a ambas muestras, las somete a un examen con el mismo temario y formato que el examen al que se enfrentarán en las oposiciones, que es superado por 33 estudiantes de la UNED y 30 de otras universidades (α = 0,05).
En un contraste de hipótesis unilateral sobre una media, el valor de la media muestral coincide con la media poblacional propuesta por la hipótesis nula, por lo que podemos afirmar que:
el resultado no es significativo, siendo el nivel crítico igual a 0,5.
es necesario conocer el tamaño de la muestra y la varianza de la población o de la muestra para calcular el estadístico de contraste.
el resultado puede ser o no significativo dependiendo del tamaño de la muestra.
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación.
Por la naturaleza de las variables implicadas en este estudio, se trata de un diseño:
de dos factores (3x3) intrasujetos de efectos fijos.
equilibrado de dos factores (2x3) de efectos aleatorios.
de dos factores (3x3) uno de efectos fijos y otro de efectos aleatorios.
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación.
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación. SCGrupo= 84,90; SCIluminación= 298,07; SCError= 59,25; SCTotal= 445,03
¿Podemos poner a prueba de manera eficiente la hipótesis de comparación entre las tres medias: H0: μiluminación 1= μiluminación 2= μiluminación 3 ejecutando la prueba t de Student entre cada una de las posibles comparaciones dos a dos?
No, porque aumenta la probabilidad de rechazar la H₀ siendo verdadera.
No, porque el diseño es de efectos fijos.
No, porque aumenta la probabilidad de aceptar la H₀ siendo falsa.
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación.
El valor inicial de la MCError es aproximadamente:
3,29
0,70
45,45
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación.
El valor del estadístico de contraste para la interacción vale aproximadamente:
3,55
0,21
2,93
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación.
En un modelo con interacción el valor del estadístico de contraste para evaluar la influencia del factor Iluminación vale aproximadamente:
59,25
45,28
12,89
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación.
A partir de los resultados obtenidos en este análisis deberíamos continuar con los contrastes a posteriori comparando:
únicamente los distintos niveles del factor iluminación y el de fumar.
únicamente los distintos niveles del factor iluminación, pero no el de fumar.
tanto los distintos niveles de los dos factores y su interacción.
SITUACIÓN 2. En una investigación sobre el efecto que tiene el fumar sobre el rendimiento laboral en diferentes condiciones de iluminación en una gran empresa, se seleccionaron al azar 9 trabajadores de cada uno de los tres grupos: no fumadores, fumadores moderados y fumadores extremos. Tres sujetos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles de iluminación distintos (factor Iluminación con tres niveles). Se registró el tiempo en completar una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se muestran a continuación.
Si la interacción no resultase significativa, ¿Cómo se debe proceder con la SCInteracción obtenida para presentar los datos de la tabla resumen del ANOVA?
Se elimina de la tabla.
Se suma a la del factor que no resultase significativo para recalcular su valor de F.
Se suma a la SCError para recalcular nuevamente las F de cada factor.
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). La hipótesis alternativa que el investigador pone a prueba es:
H1: β1 = 0
H1: β1 ≠ 0
H1: β0 ≠ 0
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). Los valores muéstrales aproximados de B, y Bo valen respectivamente:
11,3692 y 31,7481
0,3391 y 0,5511
0,8288 y 0,910
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). El estadístico de
8,8025 y p> 1,005
11,1099 y p < 0,005
115,98 y p > 0,201
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). Utilizando un α = 0,01, el intervalo de confianza para B1 es {8,6287; 14,1097}. Esto implica que:
al 99 % de confianza, el verdadero valor poblacional de la pendiente se encuentra entre 8,63 y 14,11.
se puede aceptar la H0 ya que el intervalo de confianza de B1 no incluye el cero.
es necesario decrementar el tamaño muestral del estudio para mejorar la precisión en la estimación de B1.
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). El estadístico para poner a prueba la bondad de ajuste global de la recta de regresión de la situación del geiser es:
F( gl1 = gl2= 51) = 123,43
R² = 0,7076
Tg.l.=53 = 11,1099
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). Suponga que en un estudio se encuentra un coeficiente de correlación muestral entre X e Y vale 0,9103, entonces el cociente entre la Suma de Cuadrados de la regresión y la Suma de Cuadrados total valdrá:
la F con 1 y n grados de libertad cuya probabilidad sea 0,9103.
0,9103.
0,8288.
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). Si quisiera introducir en la ecuación de regresión otra variable predictiva de Y adicional a X (v.g., la altura promedio que alcanza la erupción X), tendría que realizar:
un análisis de regresión múltiple.
un Anova de dos factores independientes.
0,8288.
SITUACIÓN 3. (situación extraída del texto Linear Models in statistics - Wiley series in probability and statistics, pag. 148)
Un estudio de Weisberg (1985) investigó las erupciones del geiser Faithful de Yellowstone National Park durante el mes de agosto de 1978. En su trabajo midieron la duración de cada erupción (X1, en minutos) así como el intervalo que transcurría desde la finalización de esta erupción hasta que se producía la siguiente erupción (Y, también en minutos). El autor utilizó el siguiente modelo para ajustar los datos Yi= β0+ β1Xi + εi. La gráfica de los datos y los estadísticos descriptivos se muestran a continuación:
El investigador considera que el tiempo que dura una erupción (X, eje de abscisas) está relacionado linealmente con el intervalo transcurrido hasta el inicio de la siguiente erupción (Y, eje de ordenadas). En un estudio donde se utiliza la regresión lineal simple, un investigador ha planteado la siguiente hipótesis sobre la pendiente H0: B1 =1; H1: B1≠ 1. Este planteamiento es incorrecto porque:
si la hipótesis nula tiene el signo igual, entonces el contraste tiene que ser unilateral.
las hipótesis se han planteado en términos del estadístico en lugar del parámetro.
la hipótesis se ha planteado en términos de la pendiente en lugar del punto de corte de la pendiente con la ordenada.