<- c("M","F","M","F")
sexo <- c("Jorge","Marìa","Jorge","Cecilia") nombre
El concepto de variable
en estadística (y otras disciplinas)
en lenguajes de programación
Centralización y Dispersión
Instalar y acceder al tidyverse
Aplicar conceptos a los datos del Indec
Nominal
Ordinal
Intervalo
Razón (Ratio o racional)
Se expresan con vectores de tipo character (eventualmente factor)
Se pueden armar tablas de frecuencias con table
Se pueden visualizar con p.ej. barplot
Se pueden expresar como vectores de characteres con niveles asignados.
Para saber qué es mejor/peor se arma una variable de tipo factor
con los niveles y ordered = TRUE
y visualizar
A veces se expresan con números (rating 1 a 5) lo cual puede resultar confuso. La clasificación es conceptual.
Se expresan generalmente con numeric
Y se pueden visualizar como histograma
Por qué el de intervalo?
Se expresan con numérico en R.
Y se visualizan con histograma
Contesta a la pregunta: ¿cuál es el valor más típico del conjunto?
Las principales son:
La media
La mediana
La moda
Contesta a la pregunta: ¿cuál es el valor más típico del conjunto?
Las principales son:
La media: Intervalo y ratio
La mediana: Intervalo y ratio
La moda: Nominales y ordinales
Contesta a la pregunta: ¿cuán típico es el valor más típico?
La desviación estándar
Desviación mediana absoluta (mad)
Rango
Rango intercuartílico
y muchos otros…
Es un conjunto de packetes que vamos a usar para análisis de datos
se instala con:
desde la consola.
Revisamos la tarea a ver qué variables vamos a analizar.
¿Como llamarlos?
¿Hay que transformar alguna?
¿Qué preguntas podemos hacer?