7 Estructura de Datos
7.1 Formatos Disponibles
Los datos del estudio EPSEP están disponibles en varios formatos:
Panel Wide
Formato donde cada fila representa un participante y las columnas contienen variables de todas las olas con sufijos:
- Archivo:
epsep_panel_wide_w0-w06.rds - Estructura: Una fila por participante (ticket)
- Variables:
variable_base_sufijo_ola(ej:age_w01,age_w02)
Panel Long
Formato donde cada fila representa una observación (participante-ola):
- Archivo:
epsep_panel_long.rds - Estructura: Múltiples filas por participante (una por ola)
- Variables:
variable_basecon columnawaveindicando la ola
Archivos por Ola
Datos individuales por ola:
epsep_w01.rds,epsep_w02.rds,epsep_w03.rds,epsep_w04.rds,epsep_w05.rds,epsep_w06.rds- Útiles para análisis transversales
7.2 Variables Clave
Identificación
- ticket: Identificador único del participante
- response_id: Identificador de la respuesta en cada ola
- sample: Muestra a la que pertenece (w0, r1, r2)
Sociodemográficas
- age: Edad
- sex: Sexo
- region: Región
- ses: Nivel socioeconómico
Variables de Percepción
- crime_fear: Miedo al delito
- efficacy_crime: Eficacia percibida frente al delito
- leg_moral1: Legitimidad moral
- Y muchas otras…
7.3 Convenciones de Nomenclatura
- Variables con sufijo
_rec: Valores de reclutamiento (baseline) - Variables con sufijo
_w01,_w02, etc.: Valores de cada ola - Variables sin sufijo: Valores actuales o de la última ola disponible
7.4 Carga de Datos
# Cargar panel wide
epsep_wide <- readRDS("../data/proc_data/epsep_panel_wide_w0-w06.rds")
# Cargar panel long
epsep_long <- readRDS("../data/proc_data/epsep_panel_long.rds")7.5 Transformación entre Formatos
Para convertir de wide a long:
library(tidyr)
epsep_long <- epsep_wide |>
pivot_longer(
cols = matches("_w0[1-6]$"),
names_to = c(".value", "wave"),
names_pattern = "^(.*)_(w0[1-6])$"
) |>
filter(!is.na(wave)) # Filtrar filas donde no se pudo extraer la ola