Notas de la clase 2025-04-21

Author

Aleksander Dietrichson

Published

April 21, 2025

Datos

Los datos son de indec, la muestra permanente de hogares.

Hipótesis

\(H_0\): No existe diferencia entre el salario de los hombres y el de las mujeres

\(H_A\): Los hombres ganan más que las mujeres.

Tabla con dplyr

my_data %>% 
  filter(salario > 0) %>% 
  group_by(sexo) %>% 
  summarize(
    salario_medio = mean(salario, na.rm = TRUE),
    salario_mediano = median(salario, na.rm = TRUE)
  )
# A tibble: 2 × 3
  sexo   salario_medio salario_mediano
  <chr>          <dbl>           <dbl>
1 Hombre       653772.          570000
2 Mujer        477354.          400000

Visualizar

my_data %>% 
  ggplot(aes(salario, color = sexo))+
  geom_density()+
  scale_x_log10()
Warning in scale_x_log10(): log-10 transformation introduced infinite values.
Warning: Removed 35373 rows containing non-finite outside the scale range
(`stat_density()`).

data_mujeres <- my_data %>% 
  filter( sexo == "Mujer") %>% 
  filter(salario > 0)

data_hombres <- my_data %>% 
  filter( sexo != "Mujer") %>% 
  filter(salario > 0)

Realizar test de t

t.test(data_hombres$salario, data_mujeres$salario)

    Welch Two Sample t-test

data:  data_hombres$salario and data_mujeres$salario
t = 20.889, df = 11797, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 159863.1 192972.7
sample estimates:
mean of x mean of y 
 653772.3  477354.3 

Basado en estos resultados rechazamos la hipótesis nula y nos quedamos con la alternativa que es que los hombres ganan más que las mujeres en Argentina.

Tarea

  • Usar los datos del indec

  • Eligir dos a cinco variables

  • Formular hipotesis (nula y una o dos alternativas)

    • Con notación formal o en prosa
  • Visualizar los datos

  • (Dejar pendiente test estadistico - lo vemos en la clase).

Lecturas

  • Capitulo 9: Test de Chi-Cuadrado