Taller R - DGA

Tidyverse + ggplot2

Dra. Sara E. Acevedo

PUC - CEDEUS

Dra. Alejandra S. Vega

CEDEUS

2025-08-09

Acerca de nosotras 👩🏽‍💻

  • Sara Acevedo (🐈): Profesora Asistente Facultad de Agronomía de Sistemas Naturales - Física de suelos / Suelos urbanos / Ciencia Reproducible

  • Alejandra Vega (🐕): Investigadora CEDEUS - Geoquímica de suelos / Suelos urbanos / Calidad del Agua

Objetivos de la clase

  • Continuamos con tidyverse (más avanzado)
  • Join y Pivot
  • Introducción a ggplot2

Formato tidy

  • Cada variable forma su propia columna
  • Cada observación forma una fila
  • Y cada celda es un único valor

tidy data Más info en R4DS tidy data

Formatos long y wide

  • El formato wide es el formato típico tidy rectangular
  • El formato long se usa para agrupar
  • El formato long se usa para visualización de datos con ggplot2 y hacer estadística

Es común intercambiar entre formatos

  • pivot_longer() transforma a formato long
  • pivot_wider() transforma a formato wide
  • Acá más material dinámico por Garrick Aden-Buie

Uniones de datos: operaciones join

inner_join() fusiona variables de dos conjuntos de datos, pero conserva sólo las filas con un ID común

Uniones de datos: operaciones join

left_join() fusiona variables de dos conjuntos de datos, pero conserva sólo los ID común de la izquierda

Uniones de datos: operaciones join

right_join() fusiona variables de dos conjuntos de datos, pero conserva sólo los ID común de la derecha

Uniones de datos: operaciones join

full_join() retiene todas las filas de los dos conjuntos de datos de entrada e inserta NA cuando falta un ID

Clase lista! Veamos código 👩🏽‍💻