Análisis y Visualización de Datos con R
Lenguaje y entorno R/RStudio, lectura, importación y limpieza de datos, resumen de datos, gráficos.
Duración 8 semanas (32 hs.)
Inicio 14 de mayo
Modalidad Asincrónica Aula virtual con tutoría personalizada
Profesora Julieta Lenarduzzi y Florencia Gallinger
Destinado a estudiantes y docentes de grado y posgrado en ciencias sociales, investigadoras/os y grupos de investigación, técnicas/os y profesionales del ámbito público y privado.
Objetivos
-
Conocer y manejar el lenguaje de programación R.
-
Utilizar R para limpiar, explorar y visualizar datos.
-
Elegir las herramientas más adecuadas para responder nuestras preguntas con una correcta visualización de los datos.
Contenidos
Módulo 1: Lenguaje y entorno R
Clase 1: Introducción a R
-
Descarga e instalación de R
-
Instalación de R Studio
-
Operación
-
Paquetes
Clase 2: Lenguaje de programación
-
Usos de la consola: aritmética en R
-
Asignación de variables
-
Tipos de estructuras de datos: vectores, matrices, marcos de datos (data frames) y listas
-
Crear y nombrar vectores, seleccionar elementos y comparar vectores
-
Crear y modificar matrices. Realizar cálculos
-
Crear, subdividir y comparar factores
-
Crear marcos de datos, seleccionar partes y ordenarlos en función de variables
-
Crear, nombrar y subdividir listas.
Módulo 2: Obtener, limpiar y transformar datos
Clase 3: Obtener y limpiar datos
-
Datos crudos y procesados
-
Descargar archivos
-
Leer archivos locales
-
Excel, XML y JSON
-
Internet, APIs
-
Otras fuentes
-
Paquete tidyr
Clase 4: Transformar datos
-
Organizar y ordenar datos
-
Resumir datos
-
Crear nuevas variables
-
Modificar la forma de los datos
-
Gestionar data frames con dplyr
-
Fusionar datos
-
Variables de texto y etiquetas
-
Variables de fechas
Módulo 3: Visualizar datos I
Clase 5: Medidas y Gráficos para datos categóricos
-
Medidas resumen
-
Gráficos básicos con ggplot2
-
Gráfico de barras/columnas
-
Gráfico de torta
-
Gráfico de mosaico (Treemap)
-
Mapa de calor (Heatmap)
-
Nube de palabras
Clase 6: Gráficos para distribuciones y series de tiempo
-
Medidas resumen
-
Histograma
-
Gráfico de densidad
-
Representación de series de tiempo
-
Gráfico de línea
-
Gráfico de área
-
Gráficos de caja
-
Gráficos de violín
Módulo 4: Visualizar datos II
Clase 7: Gráficos de dos variables cuantitativas
-
Gráfico de dispersión
-
Agregado de tamaño y color de los puntos
-
Ejes
-
Líneas (regresión)
-
Intervalo de confianza
-
Etiquetas
-
Promedios
-
Líneas de conexión de puntos
-
Gráfico de alfombra (Rug plot)
-
Gráfico de densidad para dos dimensiones
-
Matriz de gráficos
Clase 8: Tableros (dashboards)
-
Paquete Shiny
-
Crear una App
-
Explorar los componentes
-
Desplegar la App
Metodología
Aula virtual Todos los jueves se publicará el contenido de la semana en el campus virtual. Se puede ingresar con usuario y contraseña durante el tiempo de duración del curso.
Modalidad asincrónica Cada estudiante puede ver las clases, realizar los ejercicios y comunicarse con la profesora en los días y horarios que prefiera.
Tutoría personalizada La profesora responderá consultas y dará devoluciones personalizadas de las actividades a lo largo del mes de duración del curso.
Diversidad de herramientas para el aprendizaje Cada semana la/el estudiante encontrará
-
un documento pdf con los contenidos de la clase;
-
uno o más videos explicativos y tutoriales;
-
ejercicios de autoevaluación;
-
un ejercicio por módulo con devolución personalizada;
-
bases de datos para poner en práctica los conocimientos adquiridos;
-
bibliografía optativa para apoyar el aprendizaje.
Certificación
Para aprobar el curso, cada estudiante deberá realizar al menos 3 de los 4 ejercicios y aprobar un examen final de 10 preguntas con calificación mínima de 6/10 puntos.
Los certificados son extendidos por TIBER Escuela de Estudios Políticos y Sociales.
Precio
moneda | monto |
---|---|
EUR | 200 |
USD | 215 |
MXN | 3700 |
BRL | 1100 |
ARS | 80000 |