antes | despues | diferencia |
---|---|---|
6 | 6 | 0 |
2 | 1 | -1 |
6 | 10 | 4 |
7 | 7 | 0 |
6 | 10 | 4 |
5 | 9 | 4 |
1 | 10 | 9 |
10 | 10 | 0 |
Muestras pareadas
2025-05-19
Test the T de Student para muestras pareadas
Alternativas no-paramétricas
Interpretación de resultados
Presentación de resultados con Quarto
«decoradores» #|
Intercalar código con texto
yaml
bibliografía
Revisión de las tares
Si las muestras son dependientes también hay un test de t de student.
Compara dos mediciones de la misma variable en dos tiempos distintos pero en el mismo sujeto
Ejemplos: antes/despues, con/sin medicación
La hipótesis nula siempre es que no hay diferencia entre la media de las dos muestras
Para usar el test de t es necesario que:
La variable sea de nivel de medición ratio
Las muestras tengan varianza parecida.
Las muestras tengan una distribución razonablemente similar a una normal1.
Note
SON LOS MISMOS
antes | despues | diferencia |
---|---|---|
6 | 6 | 0 |
2 | 1 | -1 |
6 | 10 | 4 |
7 | 7 | 0 |
6 | 10 | 4 |
5 | 9 | 4 |
1 | 10 | 9 |
10 | 10 | 0 |
Nuestra hipótesis nula es que no hay diferencia (\(\Delta = 0\))
Si la diferencia (\(\Delta\)) es distinta a cero (\(\Delta\neq0\)) podemos calcular la probabilidad de que eso ocurra al azar.
Quiero saber si el ingreso total familiar cambió significativamente entre el 4to trimestre del 22 al 4to trimestre del 23.
Conseguí en el sitio del indec los datos del 4to trimestre del 22 y del 23. Los procesé de la misma manera que antes y los guardé en archivos .rds en ./data
Vemos rápido:
Hay alguna discrepancia así que hay que limpiar un poco.
En ellas, cada registro tiene un número de identicación (CODUSU), que permite
relacionar una vivienda con los hogares...
Solo nos interesan los datos que sean comparables entre los dos conjuntos.
Verificamos:
¿por qué hay discrepancia?
Limpiemos un poco más. Como estamos mirando sólo el ITF, podemos eliminar los CODUSU duplicados
verificamos:
Ahora podemos hacer el test
Resultados:
Paired t-test
data: usu_hogar_T423$ITF and usu_hogar_T422$ITF
t = 48.956, df = 6998, p-value < 0.00000000000000022
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
179652.5 194639.9
sample estimates:
mean difference
187146.2
¿cómo lo interpretamos?
Si hay pocos datos
si no cumplen con los requisitos
Tenemos la alternativa con wilcox.test
, igual agregando el parametro paired = TRUE
Wilcoxon signed rank test with continuity correction
data: usu_hogar_T423$ITF and usu_hogar_T422$ITF
V = 17722081, p-value < 0.00000000000000022
alternative hypothesis: true location shift is not equal to 0
Nos da básicamente el mismo resultado, ¿qué diferencias hay?
T de Student:
Paired t-test
data: usu_hogar_T423$ITF and usu_hogar_T422$ITF
t = 48.956, df = 6998, p-value < 0.00000000000000022
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
179652.5 194639.9
sample estimates:
mean difference
187146.2
Wilcox:
Wilcoxon signed rank test with continuity correction
data: usu_hogar_T423$ITF and usu_hogar_T422$ITF
V = 17722081, p-value < 0.00000000000000022
alternative hypothesis: true location shift is not equal to 0
Lo hacemos en vivo. Vamos a cubrir:
«decoradores» #|
Intercalar código con texto
yaml
bibliografía