Técnicas multivariantes de investigación en marketing
  • Presentación
  • Sesiones
    • Parte 1
    • Parte 2
    • Parte 3
    • Parte 4
    • Parte 5
    • Parte 6
  • Otros
    • Citar en Quarto
    • Acerca de …

Contenidos

  • Parte 1
    • Introducción a las herramientas de trabajo
    • Instalación del entorno de trabajo
      • Instalar R
      • Instalar RStudio
        • Cuadrante Superior Izquierdo: El Editor de Código (Source)
        • Cuadrante Inferior Izquierdo: La Consola (Console)
        • Cuadrante Superior Derecho: El Entorno (Environment / History)
        • Cuadrante Inferior Derecho: El Cajón de Sastre (Files / Plots / Packages / Help)
      • Configuración inicial recomendada
      • ¿Cómo verificar que todo ha ido bien?
      • El botón de ayuda en R
    • Preguntas y respuestas
    • Instalar y cargar paquetes
      • Paquetes / funciones usadas en la asignatura
    • Practicando el scripting
      • Ejercicio: script 1: consola
      • Ejercicio: script 2: vectores y dataframes
      • Ejercicio: script 3: valores perdidos
      • Ejercicio: script 4: funciones generales
      • Ejercicio: script 5: carga de datos
      • Ejercicio: script 6: recuentos básicos
      • Ejercicio: script 7: uso de pipes
      • Ejercicio: script 8: personalización de tablas
      • Ejercicio: script 9: combinando estadísticos
      • Ejercicio: script 10: tipos de porcentajes
      • Ejercicio: script 11: gestión de etiquetas
    • ¿Qué se ha aprendido hasta ahora?
    • El contexto de la exploración de datos
    • El proceso de análisis en IM
      • Fases en la explotación de datos
      • Tarea inicial del investigador
      • Escalas de medida y tipos de variable
      • Relación instrumento de medida - cuestionario
        • Múltiple en binario frente a menciones
    • Exploración de los datos
      • Introducción
      • Herramientas básicas
        • Frecuencias
        • Histogramas: La importancia de la visualización
        • Resumen estadístico: de la visión general a la precisión
        • Medidas de tendencia central, ¿dónde está el “centro”?
        • Medidas de dispersión, ¿cómo son los datos de variados?
        • Identificando valores atípicos: diagrama de caja (Box-Whisker)
        • La curva / distribución normal, el concepto de normalidad y su relación con las muestras
        • ¿Por qué es importante en investigación de mercados?
    • Preocupaciones del analista de datos
      • Valores perdidos
        • ¿Por qué faltan los datos?
        • Depuración y cuantificación
        • Métodos de corrección
      • Valores atípicos (outliers)
        • Estrategia de detección
        • Procedimiento para la estandarización
    • Herramientas de exploración, comprobación de la normalidad y la homoscedasticidad
      • La lógica de la inferencia estadística
      • Contrastes de normalidad
        • Las herramientas de diagnóstico
        • La trampa de la muestra grande
        • Ejecución e interpretación de Kolmogorov-Smirnov (Lilliefors) y Shapiro-Wilk
        • La conclusión estadística estricta
        • ¿Qué hacer ahora?
        • Guía rápida para los informes
      • Otros diagnósticos visuales
        • Gráfico Q-Q estándar
        • Gráfico Q-Q “detrended”
      • El procedimiento de linealización
        • Transformaciones comunes en R
      • Homogeneidad de varianzas (homoscedasticidad)
        • Test de Levene
        • Ratio de varianzas

Parte 1

Introducción a las herramientas de trabajo

En esta primera sesión se acomete el trabajo básico de:

  1. instalar el software R;
  2. instalar el software RStudio;
  3. instalar los paquetes de trabajo;
  4. cargar los bancos de datos necesarios para comenzar el trabajo;
  5. acercarse al proceso de datos “real”, por medio de la tabulación.

Instalación del entorno de trabajo

Para comenzar la andadura en R son necesarias dos piezas fundamentales. R puede entenderse como el motor de un coche (realiza el trabajo duro: los cálculos y el análisis), mientras que RStudio es el panel de control o volante (la interfaz que permite conducir el coche de forma cómoda).

Instalar R

El lenguaje R es gratuito y de código abierto.

  1. Acceder a la página oficial: CRAN (Comprehensive R Archive Network).
  2. Seleccionar el sistema operativo correspondiente:
  • Download R for Windows: hacer clic en “base” y luego en el enlace “Download R X.X.X for Windows”.
  • Download R for macOS: descargar el archivo .pkg correspondiente a la versión de procesador (en un Mac con chip Apple Silicon M1/M2/M3, la versión arm64; en un Mac con procesador Intel, la versión x86_64).
  1. Ejecutar el instalador descargado y seguir los pasos por defecto (siguiente, siguiente, finalizar). No es necesario modificar ninguna configuración avanzada.

Instalar RStudio

RStudio es el entorno de desarrollo que facilita enormemente el trabajo diario.

  1. Acceder a la página oficial: Posit (anteriormente RStudio).
  2. Hacer clic en el botón Download RStudio Desktop correspondiente al sistema operativo.
  3. Ejecutar el archivo descargado e instalarlo.
  4. Importante: una vez instalado, abrir RStudio. Al ser la primera vez, el programa detectará automáticamente la versión de R instalada en el paso anterior.

Dar el salto a RStudio por primera vez puede parecer como sentarse en la cabina de un avión, sobre todo viniendo de la vista de datos tabular a la que acostumbra SPSS. Sin embargo, su diseño responde a una lógica clara y está pensado para facilitar el trabajo diario.

Al abrir RStudio y crear un nuevo script (mediante File > New File > R Script), la pantalla se divide en cuatro cuadrantes principales.

A continuación se describe cada uno de ellos:

Cuadrante Superior Izquierdo: El Editor de Código (Source)

Es la mesa de trabajo principal: el lugar donde se escriben, editan y guardan los scripts (los archivos .R o los documentos .qmd de Quarto utilizados en esta asignatura).

  • ¿Para qué sirve? Para escribir el código de forma estructurada antes de ejecutarlo. Permite guardar el trabajo paso a paso, asegurando que el análisis sea 100% reproducible.
  • Dato útil: también es el visor de datos. Al hacer clic en un dataframe cargado, se abre en esta ventana en formato de tabla (similar a la vista de datos de SPSS), aunque aquí es solo de lectura.

Cuadrante Inferior Izquierdo: La Consola (Console)

Es el “motor” interactivo de R: el lugar donde el código se ejecuta y cobra vida realmente.

  • ¿Para qué sirve? Al enviar una orden desde el Editor de Código (por ejemplo, calculando una media), el resultado de texto aparece aquí. También admite comandos rápidos escritos directamente en la consola, útiles para pruebas puntuales sin guardarlas en el script.
  • Dato útil: este cuadrante incluye pestañas adicionales como Terminal (para comandos del sistema operativo) y Background Jobs (para procesos largos), aunque en el día a día del análisis de mercados la pestaña Console es la más relevante.

Cuadrante Superior Derecho: El Entorno (Environment / History)

Es la “memoria RAM” visual de la sesión de trabajo. En SPSS los datos se mostraban en una sábana frontal; en R, los datos se almacenan en el entorno.

  • ¿Para qué sirve? La pestaña Environment muestra un listado de todo lo cargado o creado en la sesión: bases de datos (dataframes), vectores, valores aislados y modelos estadísticos.
  • Dato útil: desde aquí puede comprobarse rápidamente cuántas observaciones (filas) y variables (columnas) tiene cada base de datos. La pestaña History guarda un registro de los comandos ejecutados recientemente.

Cuadrante Inferior Derecho: El Cajón de Sastre (Files / Plots / Packages / Help)

Este cuadrante es multiusos y resulta clave para la navegación y la visualización. Incluye varias pestañas de uso constante:

  • Files: explorador de archivos integrado. Permite ver el contenido de la carpeta del proyecto, abrir scripts o localizar archivos de datos (.sav, .csv).
  • Plots: el escaparate visual. Cada histograma, mapa de posicionamiento o dendrograma generado aparece aquí, y puede exportarse directamente como imagen o PDF.
  • Packages: listado de todas las librerías instaladas (como ggplot2 o expss), con la posibilidad de activarlas o actualizarlas desde aquí.
  • Help: el salvavidas. Ante cualquier duda sobre el funcionamiento de un algoritmo o los parámetros de una prueba estadística, basta con escribir ?nombre_de_la_funcion en la consola para que la documentación oficial se abra en esta pestaña.

Configuración inicial recomendada

Para evitar problemas futuros con la codificación de caracteres (especialmente con las tildes y la letra ñ), conviene configurar RStudio de la siguiente manera:

  1. En el menú superior de RStudio, ir a Tools > Global Options.
  2. En la pestaña Code, hacer clic en Saving.
  3. Comprobar que en Default text encoding esté seleccionado UTF-8.
  4. Pulsar Apply y OK.

¿Cómo verificar que todo ha ido bien?

Para comprobar que todo se ha instalado correctamente, basta con abrir RStudio y localizar la Consola (la ventana de la izquierda o inferior izquierda), donde debería aparecer un texto de bienvenida con la versión de R.

Copiar y pegar la siguiente línea en la consola y pulsar Enter:

# Verify installation with a simple calculation
2 + 2
[1] 4

Si el resultado que aparece es [1] 4, el entorno de trabajo está listo para comenzar.

El botón de ayuda en R

Es completamente normal encontrarse, al principio, con funciones cuyos parámetros resulten desconocidos o generen dudas. R dispone de un “botón de auxilio” integrado: al escribir un signo de interrogación ? pegado al nombre de cualquier función en la consola y pulsar Enter, se abre automáticamente la pestaña Help en el cuadrante inferior derecho de RStudio, con la documentación oficial, ejemplos de uso y detalles de los argumentos.

Por ejemplo, puede ejecutarse esta línea en la consola para comprobar cómo funciona el sistema de asistencia:

# Open help documentation for the mean function
?mean

Preguntas y respuestas

Antes de comenzar …

¿Qué es R?

R es un entorno y lenguaje de programación con un enfoque al análisis estadístico. R nació como una reimplementación de software libre del lenguaje S, adicionado con soporte para ámbito estático. Se trata de uno de los pseudolenguajes de programación más utilizados en investigación científica, siendo además muy popular en los campos de aprendizaje automático (machine learning), minería de datos, investigación biomédica, bioinformática y matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con funcionalidades de cálculo y de realización de gráficos.

¿Qué es RStudio?

RStudio es un entorno de desarrollo integrado (IDE) para el lenguaje de programación R, dedicado a la computación estadística y gráficos. Incluye una consola, editor de sintaxis que apoya la ejecución de código, así como herramientas para el trazado, la depuración y la gestión del espacio de trabajo. RStudio está disponible para Windows, Mac y Linux o para navegadores conectados a RStudio Server o RStudio Server Pro (Debian / Ubuntu, RedHat / CentOS, y SUSE Linux). RStudio tiene la misión de proporcionar el entorno informático estadístico R. Permite un análisis y desarrollo para que cualquiera pueda analizar los datos con R.

¿Qué es un script de R base (.R)?

Los scripts son documentos de texto con la extensión de archivo .R, por ejemplo mi_script.R. Estos archivos son iguales a cualquier documento de texto, pero R los puede leer y ejecutar el código que contienen.

¿Qué es Markdown?

Markdown es un lenguaje de marcado ligero creado por John Gruber que trata de conseguir la máxima legibilidad y facilidad de publicación tanto en su forma de entrada como de salida, inspirándose en muchas convenciones existentes para marcar mensajes de correo electrónico usando texto plano. Markdown convierte el texto marcado en documentos XHTML utilizando html2text creado por Aaron Swartz. Para conocer los rudimentos del lenguaje puede consultarse el siguiente enlace.

¿Qué es un documento Quarto (.qmd) con scripting?

Quarto es una herramienta usada por RStudio que permite una fácil creación de documentos, presentaciones dinámicas e informes de R. Markdown es un formato de sintaxis simple en documento de texto para crear documentos en HTML, PDF, y Word.

¿Qué es un archivo HTML self-contained?

Los ficheros HTML self-contained son ficheros autónomos que residen en un solo archivo HTML. No puede incluir ningún otro archivo y deben funcionar sin una conexión de red. Un usuario debería poder guardar el archivo, abrirlo localmente y tener todo listo para trabajar.

¿Qué es un vector?

Los vectores en R son objetos de una única dimensión que puede contener datos numéricos, cadena de caracteres o datos lógicos, entre otros. Esencialmente son uno de los elementos básicos en la estructura de los datos en R. Se crean con la estructura c().

¿Qué es una matriz?

Una matriz en R es un conjunto de elementos del mismo tipo (numérico, carácter, lógico, etc.) organizado en filas y columnas. Las matrices en R se construyen con la función matrix(). Aunque con un ejemplo siempre es mucho más fácil comprender cómo funcionan las matrices.

¿Qué es un dataframe?

Un dataframe es lo que se conoce como un fichero de datos. Son estructuras para trabajar con datos de diferentes tipos (cadena, lógicos, aritméticos). Utiliza una estructura de datos tabular (como una matriz) pero que permite manipular distintos tipos de datos, de modo que una columna puede contener caracteres, otra números y otra variables lógicas. Son importantes para hacer tablas, cuadros, gráficas, análisis y modelos que tienen muchas variables estadísticas. Se crean con la estructura data.frame().

NoteAnalogía con la encuesta: vectores y matrices o dataframes

Dejando a un lado la abstracción informática, estos elementos pueden conectarse con la investigación de mercados tradicional. Un vector en R es el equivalente exacto a una columna entera de respuestas de un cuestionario (por ejemplo, las respuestas de todos los entrevistados a la pregunta de “edad”).

Por su parte, un dataframe no es más que la “sábana de datos” o el archivo de Excel/SPSS completo, donde todas esas columnas (variables) conviven alineadas fila por fila, representando cada fila a un individuo o consumidor diferente.

¿Qué es un paquete / librería?

Un paquete (package) es una colección de funciones, datos y código R que se almacenan en una carpeta conforme a una estructura bien definida, fácilmente accesible para R. En la web de R se puede consultar la lista de paquetes disponibles.

¿Qué es un objeto?

La información que se manipula en R se estructura en forma de objetos. Para trabajar con R resulta importante conocer los principales tipos de objetos y sus propiedades básicas. En general, cada tipo de objeto viene definido por una serie de atributos. Las funciones genéricas (como por ejemplo summary o plot) reconocen estos atributos y llevan a cabo distintos tipos de acciones en función del tipo de objeto.

¿Qué es un chunk?

Los trozos de código R que se insertan en archivos markdown se denominan chunk y permiten hacer análisis estadísticos y mostrar los resultados en el documento final. Los chunks tienen diversas opciones que permiten una mayor flexibilidad en cómo se muestra el código y los resultados en el documento final.

# This is a minimal chunk: just one line of R code
print('_aquí iría el código_')
[1] "_aquí iría el código_"

¿Qué es inline code?

A diferencia de los chunks, el inline code se inserta en el texto del archivo; de este modo se inserta aquí la fecha: 2026-06-16.

Donde ha aparecido la fecha, yo tengo escrito en el documento `r Sys.Date()`

Instalar y cargar paquetes

# This single call loads (and installs, if needed) every package used in this course
# See the 'global.R' file in the project root for the full list of packages
source('global.R')

Los paquetes necesarios han sido cargados con la instrucción anterior. Si alguno no estuviera instalado, el contenido del fichero global.R (no mostrado aquí) se encarga de instalarlo automáticamente mediante pacman, o bien de forma manual con install.packages(). El paquete fontawesome requiere una forma especial de instalación, por lo que se cita al final de forma específica.

Paquetes / funciones usadas en la asignatura

# BOOT SCRIPT AND ENVIRONMENT PREPARATION

# 1. Define the list of packages required for our project
required_packages <- c(
  "car", "psych", "Hmisc", "ca", "FactoMineR", "factoextra", "readr", "readxl",
  "tidyverse", "kableExtra", "sparkline", "fontawesome", "outliers", "nortest",
  "vcd", "corrplot", "gplots", "DT", "lmtest", "sjstats", "igraph", "smacof",
  "maditr", "expss", "NbClust", "effectsize", "GGally", "gtsummary", "mclust",
  "ggrepel", "lm.beta", "ppcor", "htmltools"
)

# 2. Avoid blocking interactive questions during installation
options(install.packages.compile.from.source = "never")

# 3. Check which of those packages are NOT installed on the computer
installed_packages <- rownames(installed.packages())
missing_packages <- required_packages[!(required_packages %in% installed_packages)]

# 4. If any are missing, download and install them automatically
if (length(missing_packages) > 0) {
  message("Downloading and installing required packages: ", paste(missing_packages, collapse = ", "))
  
  # Use type = "binary" for greater security and speed on Windows/Mac
  install.packages(missing_packages, repos ="https://cloud.r-project.org", type = "binary")
}

# 5. Load all packages into the session silently
suppressPackageStartupMessages({
  suppressWarnings({
    for (pkg in required_packages) {
      library(pkg, character.only = TRUE)
    }
  })
})

message("✅ Environment ready! All packages are installed and loaded.")

Los archivos están en formato SPSS (SAV) porque es un formato tradicional en los ficheros de investigación. Dado que esta asignatura se impartió con SPSS hasta el curso anterior, todos los ficheros de trabajo se mantienen en ese formato. Aunque podrían transformarse, se ha optado por mantener la dualidad, ya que en la práctica profesional del análisis de mercados es habitual encontrarse con archivos .sav. A lo largo de la asignatura se mostrará también cómo cargar ficheros en otros formatos habituales, como XLSX, CSV, TSV o el formato estándar de R, RDS.

Practicando el scripting

Ejercicio: script 1: consola

Aunque se puede trabajar en consola, es más habitual trabajar con ficheros de instrucciones o scripts.

Se proponen a continuación estas líneas para escribir en la consola, una a una; al completar cada línea, se pulsa la tecla INTRO (también llamada ENTER). El resultado de la operación aparece directamente en la consola.

Por ejemplo:

  • escribir mean(2,3,4,5) y pulsar INTRO.
  • escribir max(2,3,4,5) y pulsar INTRO.

¿Qué está pasando? R no va bien 🤦🏻‍♂️ fallos en la media y el máximo, ¿qué pasa aquí…? Igual la sintaxis no es la correcta.

Probar esto:

  • escribir mean(c(2,3,4,5)) y pulsar INTRO.
  • escribir max(c(2,3,4,5)) y pulsar INTRO.

Vaya, se recuperó 😁

¿Qué ha pasado? R en ocasiones necesita una serie de valores, y no un solo valor. Para identificar una serie de valores se utiliza la función c(), que separa por comas los valores a trabajar. Se continúa…

Ejercicio: script 2: vectores y dataframes

Un primer ejemplo más completo para iniciarse en R consiste en crear el siguiente script, donde:

  • se crean dos vectores
  • se publica su contenido
  • se unen esos dos vectores creando un dataframe
  • se publica el dataframe
  • se muestra la estructura del dataframe
  • se calcula la media aritmética del vector (ya se hizo anteriormente)
  • se calcula la media aritmética del campo correspondiente en el dataframe

El script se escribe ahora no en la consola, sino en un archivo nuevo: file > new file > R script

Se abre un lienzo en blanco.

Las siguientes líneas pueden copiarse con el icono copy situado en la esquina superior derecha, y pegarse en ese lienzo en blanco.

# Create two vectors
x <- c(1, 2, 3, 1, 3, 1, 3, 3, 3)
y <- c(2, 1, 3, 4, 1, 2, 4, 1, 1)

# Create a dataframe 
# where vector x will be called V1 and 
# vector y will be called V2
df1 <- data.frame(V1 = x, V2 = y)

# Display the dataframe
cat("Dataframe: \n")
print(df1)

# Inspect its structure
cat("\nDataframe structure: \n")
str(df1)

# Calculate means: of the vector and of the column 
# corresponding to vector x in the dataframe to see
# that the result is the same

cat("\nVector mean: ")
mean(x)

cat("\nMean of column V1 in the dataframe: ")
mean(df1$V1)
Dataframe: 
  V1 V2
1  1  2
2  2  1
3  3  3
4  1  4
5  3  1
6  1  2
7  3  4
8  3  1
9  3  1

Dataframe structure: 
'data.frame':   9 obs. of  2 variables:
 $ V1: num  1 2 3 1 3 1 3 3 3
 $ V2: num  2 1 3 4 1 2 4 1 1

Vector mean: [1] 2.222222

Mean of column V1 in the dataframe: [1] 2.222222

El botón Run, situado en la parte superior derecha, permite ejecutar las líneas del fichero una a una; seleccionándolas todas, la opción Run all encadena la ejecución de todas ellas, una tras otra.

A partir de ahora, los sucesivos scripts incluirán menos explicación paso a paso: bastará con copiar, pegar y analizar qué instrucciones se están ejecutando.

Ejercicio: script 3: valores perdidos

Este segundo caso permite analizar la influencia de los valores perdidos (missing values) y su efecto en el cálculo de estimaciones estadísticas. En concreto:

  • se crean de nuevo los vectores, añadiendo un valor perdido (NA)
  • se publica su contenido
  • se unen esos dos vectores creando un dataframe
  • se publica el dataframe
  • se repiten los cálculos estadísticos anteriores con una leve modificación
# --- Add a missing value (NA) to each vector ---
x <- c(x, NA)
y <- c(y, NA)

df1 <- data.frame(V1 = x, V2 = y)

# --- Mean calculation comparison ---
# By default, R cannot calculate a mean if any value is missing (NA):
# the result of any operation involving NA is NA, "contamination" by default
cat("Media de V1 con missing values:\n")
mean(df1$V1)                # Will return NA

cat("\n--- *** ---\n")

# 'na.rm = TRUE' tells R to remove (ignore) NA values before calculating
cat("Media de V1 ignorando los missing values (na.rm = TRUE):\n")
mean(df1$V1, na.rm = TRUE)  # Correct calculation
Media de V1 con missing values:
[1] NA

--- *** ---
Media de V1 ignorando los missing values (na.rm = TRUE):
[1] 2.222222

Ejercicio: script 4: funciones generales

Funciones de inspección (para conocer los datos)

Estas funciones evitan tener que abrir el dataframe a ciegas.

  • head(df1): Muestra las primeras 6 filas. Es el estándar para comprobar si los datos se han cargado bien.
  • tail(df1): Muestra las últimas 6 filas.
  • str(df1): (Estructura) Es, probablemente, la función más importante. Indica si una columna es numérica, texto (character) o categórica (factor).
  • glimpse(df1): (Del paquete tidyverse/dplyr) Es una versión más moderna y limpia de str(). Se recomienda encarecidamente para quienes empiezan, porque resulta mucho más fácil de leer.
  • summary(df1): Genera un resumen estadístico básico (media, mediana, mínimos y máximos) de cada columna. Es el sustituto rápido de los cuadros de estadísticos de SPSS.

Funciones de dimensiones y nombres

  • ncol(df1): Devuelve el número de columnas (útil cuando se combina con nrow() para saber el tamaño total).
  • dim(df1): Devuelve un vector con dos valores, nº filas / nº columnas.
  • names(df1): Es un alias de colnames(df1). Es muy común encontrarlo en la literatura de R.

Funciones de sistema/entorno

  • ls(): Lista todos los objetos cargados en la memoria actual del entorno; permite comprobar si hay basura acumulada.
  • rm(objeto): Para eliminar un objeto (limpiar la memoria).
  • getwd(): (get working directory) Fundamental. Indica en qué carpeta está trabajando R. Sin esa referencia no es posible importar ni guardar archivos correctamente. Más adelante se mostrará cómo crear un proyecto para abstraerse de la ruta absoluta.
# --- Exploratory functions ---

# System info
Sys.time()       # Current time
Sys.Date()       # Current date
getwd()          # Check your working directory
ls()             # List all objects currently in memory

# Dataframe dimensions
nrow(df1)        # Number of rows
ncol(df1)        # Number of columns
dim(df1)         # Dimensions (rows, columns)

# Dataframe content
colnames(df1)    # Variable names
summary(df1)     # Basic statistics for all variables
head(df1, 3)     # First 3 rows
tail(df1, 3)     # Last 3 rows
[1] "2026-06-16 16:56:47 CEST"
[1] "2026-06-16"
[1] "C:/Users/rober/Documents/R/rgs.tmim.sesiones"
[1] "citar" "df1"   "x"     "y"    
[1] 10
[1] 2
[1] 10  2
[1] "V1" "V2"
       V1              V2       
 Min.   :1.000   Min.   :1.000  
 1st Qu.:1.000   1st Qu.:1.000  
 Median :3.000   Median :2.000  
 Mean   :2.222   Mean   :2.111  
 3rd Qu.:3.000   3rd Qu.:3.000  
 Max.   :3.000   Max.   :4.000  
 NAs    :1       NAs    :1      
  V1 V2
1  1  2
2  2  1
3  3  3
   V1 V2
8   3  1
9   3  1
10 NA NA

A continuación se realiza un nuevo experimento. A diferencia de los archivos .R (que son puras instrucciones), el formato R Markdown (.Rmd) es el estándar para crear informes reproducibles. Este tipo de archivos combina texto explicativo (en formato Markdown) con trozos de código (chunks) que se ejecutan al generar el documento.

Conviene explorar las plantillas que RStudio ofrece:

  • File → New File → R Markdown → Document → HTML
  • File → New File → R Markdown → Presentation → ioslides

Consejo: conviene “tejer” (Knit) el documento resultante para ver cómo el código y el texto se convierten en un informe profesional.

Ejercicio: script 5: carga de datos

Aunque RStudio cuenta con menús visuales para importar datos, en el análisis profesional se prefiere cargar los datos mediante scripts, lo que garantiza que el proceso sea trazable y reproducible. Se utiliza readr para archivos de texto y expss para archivos .sav de SPSS.

Carga desde CSV

# Practice dataset hosted externally (Google Drive), used only for this exercise
# In later sessions we will load files from our local 'data/' project folder instead
# suppressMessages() hides the column-type detection message that read_csv prints by default
df <- suppressMessages(read_csv("https://drive.google.com/uc?export=download&id=1OStFMmg5fzIpfTZnzX9Ql8sefN7se5SW"))

df
# A tibble: 6 × 11
      x     y     z   low  high value name  color   from  to    weight
  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr> <chr>   <chr> <chr>  <dbl>
1     0   1.6 -34    -6     9.2     1 lemon #d35400 lemon olive      1
2     1  11   -23     6.7  15.3    10 nut   #2980b9 lemon guava      1
3     2  20.4   6.8   2.8  38      19 olive #2ecc71 lemon fig        1
4     3  22.1  32.3  19.4  24.8    21 guava #f1c40f nut   olive      1
5     4  15.4  27.7  12.1  18.7    14 fig   #2c3e50 olive pear       2
6     5   7.4   3.2 -11.8  26.6     6 pear  #7f8c8d guava pear       2

Carga desde ficheros SAV

# Same idea, but reading an SPSS (.sav) file directly from a URL
# read_spss() comes from the 'expss' package and preserves variable/value labels
data <- suppressMessages(read_spss("https://drive.google.com/uc?export=download&id=11q4pg2iWwWdV9mk5P44ejoAcj5CJEfJM"))

# Preview the first and last 5 rows
head(data, 5)
tail(data, 5)
  ESTU CUES CCAA PROV MUN TAMUNI CAPITAL DISTR SECCION ENTREV OLA P1 P2 P3 P401
1 3192    1   16    1  59      5       1     0       0      0   3  9  3  6    1
2 3192    2   16    1  59      5       1     0       0      0   3  2  2  7    1
3 3192    3   16    1  59      5       1     0       0      0   3  2  2  8    1
4 3192    4   16    1  59      5       1     0       0      0   3  9  2  8    1
5 3192    5   16    1  59      5       1     0       0      0   3  3  2  7    1
  P402 P403 P404 P501 P502 P503 P504 P6 P6A01 P6A02 P6B P6C P6D P7 P7A P801
1    1    1    1    7    7    8    8  1     2     0   1   2   3  3   1    1
2    1    1    1    7    7    7    7  1     1     0   0   2   3  1  NA    1
3    1    1    1    8    8    8    8  1     2     0   2   2   2  3   1    1
4    1    1    1    9    9    9    1  1     1     0   0   1   3  2  NA    1
5    1    1    1    9    5    8    8  1     2     0   1   2   3  4   1    1
  P802 P803 P8A01 P8A02 P8A03 P8B01 P8B02 P8B03 P901 P902 P903 P904 P905 P906
1    2    1     2     0     1    96    96     8    7    7    7    7    6    6
2    1    1     2     2     1    96    96     7    7    7    7    7    7    7
3    1    1     1     2     1    10    96    10    8    8    8    8    6    8
4    2    1     1     0     2     9    96    96   10   98   10   98    5    7
5    1    1     2     2     2    96    96    96    8    8    9    9    6    8
  P907 P908 P1001 P1002 P1003 P11 P11A01 P11A02 P11B P11C P11D P12 P12A01
1    6    7     3     2     3   2     96     96    0    0    0   2     96
2    7    1     3     2     3   2     96     96    0    0    0   1      2
3    8    2     2     3     3   2     96     96    0    0    0   1      1
4    7    3     2     3     2   2     96     96    0    0    0   1      1
5    8    4     2     3     2   2     96     96    0    0    0   1      1
  P12A02 P12B P12C P12D01 P12D02 P12D P1301 P1302 P1303 P1304 P1305 P14 P14A01
1     96    0    0     NA     NA   NA     6     7     7     6     3   2     96
2      0    2    3     97     97 9997     7     7     7     7     1   2     96
3      0    2    3     25      0   25     7     7     7     7     2   2     96
4      0    1    3      0      1   30     9     9    10    10     3   2     96
5      0    2    3      0      4  120     5     6     8     8     4   2     96
  P14A02 P14B P14C P1501 P1502 P1503 P1504 P1505 P1506 P16 P17 P18 P18A P18B
1     96    0    0     7     7     5     5     6     2   3   2   1    8    1
2     96    0    0     7     7     9     7     7     1   4   8   2    0    0
3     96    0    0     7     7     7     7     7     2   2   3   2    0    0
4     96    0    0     8    10     4     8     9     3   2   8   1   10    2
5     96    0    0     5    10     7     5    98     4   8   2   1   10    2
  P18C01 P18C02 P18C03 P18C04 P18C05 P18C06 P18C07 P18C08 P19 P20 P21 P21A01
1     NA     NA     NA      1     NA     NA     NA     NA   2   2   2      0
2      0      0      0      0      0      0      0      0   2   2   2      0
3      0      0      0      0      0      0      0      0   2   2   2      0
4      0      0      0      0      0      0      0      0   3   2   2      0
5      0      0      0      0      0      0      0      0   2   2   2      0
  P21A02 P21A03 P21A04 P21B P22 P23 P24 P2501 P2502 P2503 P2601 P2602 P2603
1      0      0      0    0   3   1   2    10    10     8     1     2     2
2      0      0      0    0   1   1   1    10     6     4     2     9     9
3      0      0      0    0   1   8   2    10    10    10     1     2     2
4      0      0      0    0   3   2   2    10    10    10     1     2     2
5      0      0      0    0   1   1   2    10     8    10     2     2     2
  P2604 P27 P28 P29 P30 P30A P30AR P31 P32 P33 P34 P35 P35A P36 P37 P38 P39 P40
1     1   2   3  99   1   99    99   2  51   1   1   3    5   2   1   1   2   1
2     2   1   3   2   1    3     3   1  37   1   1   3   13   1   2   1   1   1
3     1   1   2   4   1   99    99   2  60   1   2   3    7   2   2   4   3   2
4     1   1   1   2   1   98    98   1  53   1   1   3   11   1   1   4   1   1
5     1   2   3   1   1    3     3   2  69   3   2   3    4   2   2   4   1   2
  P41 P42 P42A P43 P44 P45 P46 P46A P46B P46C P46D P47 P47A P47B P48 P4901
1 561   2    1  87  99  99   1    1    0    0    0   1   16    0   1    NA
2 215   4    0  86   7   6   1    1    0    0    0   1   16    0   3    NA
3 351   1    3  35  10   7   1    1    0    0    0   1   16    0   1    NA
4 223   1    1  85   9   7   1    1    0    0    0   1   16    0   1    NA
5 921   1    3  81   5   5   1    1    0    0    0   1   14    0   1    NA
  P4902 P4903 P4904 P5001 P5002 P5003 P5004 P5005 P5101 P5102 P5103 P5104 P5105
1    NA    NA    NA     -     -     -     -     -     -     -     -     -     -
2    NA    NA    NA     -     -     -     -     -     -     -     -     -     -
3    NA    NA    NA     -     -     -     -     -     -     -     -     -     -
4    NA    NA    NA     -     -     -     -     -     -     -     -     -     -
5    NA    NA    NA     -     -     -     -     -     -     -     -     -     -
  P52 P53 P54 P55 I1 I2 I3 I4 I5 I6 I7 I8 I9 E101 E102 E103 E2 E3 E4 C1 C1A C2
1   2   2   2   2  7 NA 30  2  2 NA 12 NA  1   20   10   17  5 17  3  1   0  2
2   2   2   2   2  1 NA 11 NA  2  2  2 NA NA   20   10   17  5 17  1  1   0  1
3   2   2   1   1  2 NA 10 NA NA  1 NA NA NA   20   10   17  5 30  2  1   0  1
4   2   2   2   1  3 NA 31 NA  2  2 10  1 NA   20   10   17  5 18  2  1   0  1
5   2   2   2   2  4 NA 13 NA NA  1  9 NA NA   20   10   17  5 19  2  1   0  1
  C2A C2B C3 C4 RECUERDO ESTUDIOS OCUMAR11 RAMA09 CONDICION11 ESTATUS  PESO
1   1   0  1  0       99        5        5      4           7       2 0.925
2   0   0  1  0        3        6        2      4           1       1 0.925
3   0   0  1  0       99        5        3      2           8       2 0.925
4   0   0  1  0       98        6        2      4           2       1 0.925
5   0   0  1  0        3        3        9      4           8       5 0.925
     ESTU CUES CCAA PROV MUN TAMUNI CAPITAL DISTR SECCION ENTREV OLA P1 P2 P3
2553 3192 2596   19   52   1      4       1     0       0      0   3  3  2  6
2554 3192 2597   19   52   1      4       1     0       0      0   3  2  2  7
2555 3192 2598   19   52   1      4       1     0       0      0   3  2  4  3
2556 3192 2599   19   52   1      4       1     0       0      0   3  2  3  5
2557 3192 2600   19   52   1      4       1     0       0      0   3  7  2  7
     P401 P402 P403 P404 P501 P502 P503 P504 P6 P6A01 P6A02 P6B P6C P6D P7 P7A
2553    1    1    1    1    8    7    6    7  1    10     0   2   1   2  4   7
2554    3    2    1    2    6    9    5    6  2    96    96   0   0   0  0  NA
2555    2    2    2    2    5    3    7    7  1     0     2   0   0   0  0  NA
2556    2    2    2    2    4    6    2    3  2    96    96   0   0   0  0  NA
2557    2    2    2    2    3    4    3    6  1     0     2   0   0   0  0  NA
     P801 P802 P803 P8A01 P8A02 P8A03 P8B01 P8B02 P8B03 P901 P902 P903 P904
2553    1    2    2     1     0     0     4    96    96    7    7    8    8
2554    0    0    0     0     0     0    96    96    96    7    7    7    7
2555    0    0    0     0     0     0    96    96    96    5    5    5    5
2556    0    0    0     0     0     0    96    96    96    5    5    5    5
2557    0    0    0     0     0     0    96    96    96   98   98   98   98
     P905 P906 P907 P908 P1001 P1002 P1003 P11 P11A01 P11A02 P11B P11C P11D P12
2553    8    8    8    5     1     3     1   2     96     96    0    0    0   2
2554    1    7    7    1     2     8     2   2     96     96    0    0    0   2
2555    2    5    5    1     2     3     2   1      1      0    1    0    0   2
2556    2    5    5    6     3     3     3   2     96     96    0    0    0   2
2557    2   98   98    1     2     3     2   2     96     96    0    0    0   2
     P12A01 P12A02 P12B P12C P12D01 P12D02 P12D P1301 P1302 P1303 P1304 P1305
2553     96     96    0    0     NA     NA   NA     7     8     8     8     4
2554     96     96    0    0     NA     NA   NA     7    10     7    10     1
2555     96     96    0    0     NA     NA   NA     5     6     5     6     1
2556     96     96    0    0     NA     NA   NA     5     7     5     5     4
2557     96     96    0    0     NA     NA   NA     7     7     7     7     1
     P14 P14A01 P14A02 P14B P14C P1501 P1502 P1503 P1504 P1505 P1506 P16 P17
2553   2     96     96    0    0     7     7     7     6     7     4   3   8
2554   2     96     96    0    0     7     8     1     5     8     1   3   8
2555   2     96     96    0    0     4     6     1     1     3     1   3   8
2556   2     96     96    0    0     6     7     1     1     3     4   3   8
2557   2     96     96    0    0     5     7     6     4     7     1   3   1
     P18 P18A P18B P18C01 P18C02 P18C03 P18C04 P18C05 P18C06 P18C07 P18C08 P19
2553   1    4    1     NA     NA     NA     NA     NA      1     NA     NA   8
2554   2    0    0      0      0      0      0      0      0      0      0   8
2555   2    0    0      0      0      0      0      0      0      0      0   1
2556   2    0    0      0      0      0      0      0      0      0      0   2
2557   2    0    0      0      0      0      0      0      0      0      0   2
     P20 P21 P21A01 P21A02 P21A03 P21A04 P21B P22 P23 P24 P2501 P2502 P2503
2553   2   2      0      0      0      0    0   3   1   3    10     8     8
2554   3   2      0      0      0      0    0   3   8   1    10     1    98
2555   2   2      0      0      0      0    0   1   8   3    10     1     1
2556   3   2      0      0      0      0    0   1   1   3    10     1     1
2557   2   2      0      0      0      0    0   3   2   2    10     5    98
     P2601 P2602 P2603 P2604 P27 P28 P29 P30 P30A P30AR P31 P32 P33 P34 P35
2553     2     2     2     8   1   1   5   5    0     0   1  32   2   2   3
2554     2     2     2     2   1   3   7   1    1     1   1  19   2   2   3
2555     2     2     2     2   1   3   7   1    1     1   2  38   1   1   3
2556     1     1     1     1   2   4   5   5    0     0   2  20   2   2   3
2557     2     2     2     2   1   1   8   1    1     1   1  44   1   1   3
     P35A P36 P37 P38 P39 P40 P41 P42 P42A P43 P44 P45 P46 P46A P46B P46C P46D
2553   12   3   1   4   2   4 271   2    3  62  98   1   1    1    0    0    0
2554    6   2   2   4   2   6 592   1    1  84  98   1   1    1    0    0    0
2555    9   2   2   4   2   1 224   1    1  85  99  99   1    1    0    0    0
2556    6   1   2   4   2   6 740   1    3  45  98   1   1    1    0    0    0
2557    5   1   2   4   1   1   2   1    1  84  99   7   1    1    0    0    0
     P47 P47A P47B P48 P4901 P4902 P4903 P4904 P5001 P5002 P5003 P5004 P5005
2553   1   19    0   1     1    NA    NA    NA     -     -     -     -     -
2554   1   19    0   3     1    NA    NA    NA     -     -     -     -     -
2555   1    5    0   1     1    NA    NA    NA     -     -     -     -     -
2556   1   19    0   1    NA    NA    NA     1     -     -     -     -     -
2557   1   19    0   1    NA    NA    NA    NA     -     -     -     -     -
     P5101 P5102 P5103 P5104 P5105 P52 P53 P54 P55 I1 I2 I3 I4 I5 I6 I7 I8 I9
2553     -     -     -     -     -   2   3   2   2  5 NA NA NA NA NA  1 NA NA
2554     -     -     -     -     -   2   1   2   1  6 NA  5  2  1  1 14 NA NA
2555     -     -     -     -     -   2   1   1   1  7 NA  1 NA NA NA  3 NA NA
2556     -     -     -     -     -   2   1   2   1  3 NA  1 NA  1 NA  2 NA  1
2557     -     -     -     -     -   2   1   1   1  8 NA NA NA NA NA  1 NA NA
     E101 E102 E103 E2 E3 E4 C1 C1A C2 C2A C2B C3 C4 RECUERDO ESTUDIOS OCUMAR11
2553   22   10   17  7 17  2  1   0  1   0   0  1  0       97        6        2
2554   22   10   17  7 19  2  1   0  1   0   0  1  0        1        4        5
2555   22   10   17  7 17  2  1   0  1   0   0  1  0        1        6        2
2556   22   10   17  7 17  1  1   0  1   0   0  1  0       97        4        7
2557   22   10   17  7 17  2  2   1  1   0   0  1  0        1        5       10
     RAMA09 CONDICION11 ESTATUS  PESO
2553      4           9       1 0.049
2554      4          10       2 0.049
2555      4           2       1 0.049
2556      4          10       4 0.049
2557      4          12       2 0.049

Ejercicio: script 6: recuentos básicos

Existen dos formas de obtener frecuencias. La primera utiliza la sintaxis clásica de R; la segunda, más potente, se integra con el flujo de expss y muestra una función de este paquete pensada para la explotación de archivos de datos en investigación de mercados (tipo SPSS).

# Basic frequency table using standard R syntax
table(data$P31)

# Basic frequency table using standard `expss` syntax
fre(data$P31)

Hombre  Mujer 
  1256   1301 
Sexo de la persona entrevistada  Count   Valid percent   Percent   Responses, %   Cumulative responses, % 
 Hombre  1256 49.1 49.1 49.1 49.1
 Mujer  1301 50.9 50.9 50.9 100.0
 #Total  2557 100 100 100
 <NA>  0 0.0

Ejercicio: script 7: uso de pipes

Se utiliza el operador %>% (pipe), que puede imaginarse como una cinta transportadora: el conjunto de datos se pasa a la función de celdas, luego a la de estadísticos y, finalmente, se pivota.

# Calculate frequencies using pipes and expss
data %>%
  tab_cells(P31) %>%
  tab_stat_cases() %>%
  tab_pivot()
 #Total 
 Sexo de la persona entrevistada 
   Hombre  1256
   Mujer  1301
   #Total cases  2557

Ejercicio: script 8: personalización de tablas

La legibilidad de las tablas puede mejorarse añadiendo totales y etiquetas personalizadas.

# Frequency table with total row positioned above
data %>% 
  tab_cells(P31) %>% 
  tab_stat_cases(total_row_position = "above", label = "Total cases") %>%
  tab_pivot()

# Frequency table with column percentages
data %>% 
  tab_cells(P31) %>% 
  tab_stat_cpct(total_row_position = "above", label = "Percentage (%)") %>% 
  tab_pivot()
 #Total 
 Sexo de la persona entrevistada 
   #Total cases   Total cases  2557
   Hombre   Total cases  1256
   Mujer   Total cases  1301
 #Total 
 Sexo de la persona entrevistada 
   #Total cases   Percentage (%)  2557
   Hombre   Percentage (%)  49.1
   Mujer   Percentage (%)  50.9

Ejercicio: script 9: combinando estadísticos

A menudo resulta útil ver tanto los casos absolutos como los porcentajes en una misma tabla, para facilitar la interpretación.

# Combining counts and column percentages in one table
data %>% 
  tab_cells(P31) %>% 
  tab_stat_cases(total_row_position = "above", label = "Cases") %>%
  tab_stat_cpct(label = "Column %") %>%
  tab_pivot(stat_position = "inside_columns")
 #Total 
 Cases   Column % 
 Sexo de la persona entrevistada 
   #Total cases  2557 2557
   Hombre  1256 49.1
   Mujer  1301 50.9

Ejercicio: script 10: tipos de porcentajes

Se exploran a continuación las distintas formas de calcular porcentajes (columna, fila y tabla):

# Comparing different percentage calculations
data %>% 
  tab_cells(P31) %>% 
  tab_stat_cases() %>%
  tab_stat_cpct() %>% # Column percentage
  tab_stat_rpct() %>% # Row percentage
  tab_stat_tpct() %>% # Table percentage
  tab_pivot()
 #Total 
 Sexo de la persona entrevistada 
   Hombre  1256.0
   Mujer  1301.0
   #Total cases  2557
   Hombre  49.1
   Mujer  50.9
   #Total cases  2557
   Hombre  100.0
   Mujer  100.0
   #Total cases  2557
   Hombre  49.1
   Mujer  50.9
   #Total cases  2557

Ejercicio: script 11: gestión de etiquetas

Una parte vital del análisis de encuestas es la gestión de etiquetas. La instrucción var_lab() permite documentar qué significa la variable, y val_lab() permite asignar etiquetas a los valores numéricos (igual que en la vista de variables de SPSS).

# Assigning a variable label
var_lab(data$P31) <- 'Respondent gender'

# Assigning value labels to the numeric codes
val_lab(data$P31) <- c('Male' = 1, 'Female' = 2)

# Check the new labels
var_lab(data$P31)
val_lab(data$P31)
[1] "Respondent gender"
  Male Female 
     1      2 

¿Qué se ha aprendido hasta ahora?

Se cierra así esta primera sección, en la que se ha pasado de ejecutar comandos aislados en la consola a construir el primer script. Se ha visto también que R es sensible a los valores perdidos (NA).

Esta primera inmersión en el ecosistema de R y RStudio puede resultar exigente. Es completamente normal que, en este punto, la sintaxis, los scripts o el uso del pipe (%>%) resulten algo extraños. Aprender R es como aprender un nuevo idioma: al principio cuesta memorizar el vocabulario y la gramática, pero con un poco de práctica las instrucciones empiezan a fluir con naturalidad.

Conviene tener presente el objetivo principal de este máster: el propósito no es formar programadores informáticos, sino analistas de mercado estratégicos. RStudio es simplemente el vehículo más potente y profesional que existe en la actualidad para transformar encuestas, hojas de cálculo y bases de datos en información de negocio. En esta sesión se ha encendido el motor, se ha configurado el panel de mandos y se ha dado una vuelta de reconocimiento tabulando los primeros porcentajes. A partir de la próxima sesión empieza la conducción real.

Los aspectos puramente técnicos de la instalación quedan atrás para centrarse en el proceso de investigación y el análisis multivariante. El recorrido pasa de la observación descriptiva a la toma de decisiones basada en evidencia estadística:

  • El contexto y la exploración de datos: se aprenderá a organizar el trabajo con Proyectos de RStudio, a entender la relación vital entre el diseño de un cuestionario y la estructura de un dataframe, y a clasificar correctamente las variables para no cometer errores estadísticos.
  • Diagnóstico estadístico: se pasará de los recuentos básicos a la estadística de precisión, aprendiendo a visualizar datos con histogramas y diagramas de caja, a detectar valores atípicos (outliers) o perdidos, y a validar los supuestos de normalidad y homocedasticidad.
  • Inferencia estadística paramétrica y no paramétrica: se dará el salto definitivo, utilizando test de hipótesis (T de Student, ANOVA, Chi-cuadrado) para descubrir si las diferencias observadas entre clientes (por ejemplo, ¿compran más los hombres que las mujeres?) son reales o un simple efecto del azar.
  • Análisis de Correspondencias: se entra en el terreno del posicionamiento estratégico, aprendiendo a construir mapas perceptuales para visualizar gráficamente dónde se ubica una marca respecto a los competidores según los atributos valorados por los consumidores.
  • Análisis de Componentes Principales (ACP): se trabajará con cuestionarios complejos con decenas de preguntas, descubriendo cómo reducir esa “sábana” de datos a unas pocas dimensiones latentes (por ejemplo, resumiendo 20 preguntas en 3 factores clave: calidad, precio y servicio).
  • Análisis de Conglomerados (Cluster Analysis): la herramienta reina del marketing. Se utilizarán algoritmos jerárquicos y de K-medias para segmentar el mercado, agrupando a los clientes en nichos homogéneos con necesidades y comportamientos similares.
  • Cierre y Modelización: se consolidará todo el conocimiento adquirido, aplicando las variables y segmentos creados a lo largo del curso para responder a los objetivos finales de investigación que demanda un cliente real.

El recorrido no ha hecho más que empezar. Conviene guardar los scripts, revisar los conceptos básicos y prepararse para descubrir todo lo que los datos tienen que contar.

Con los rudimentos del trabajo en R ya cubiertos, comienzan los contenidos propios de la asignatura, dedicada en primer término a una introducción a los procedimientos básicos de trabajo con datos provenientes de recogidas estructuradas o de investigaciones de mercado, predominantemente de encuesta, también llamado EDA (exploratory data analysis). Conviene recordar que esta no es una asignatura de R, sino una asignatura que explota datos estadísticos y que utilizará técnicas univariantes, bivariantes y multivariantes para obtener esa información.

Los siguientes pasos permiten avanzar en los cálculos estadísticos y en la obtención de información significativa. Este documento pretende ser una guía ilustrativa y demostrativa de cómo se trabaja.

En esta parte se acomete el trabajo básico de exploración de datos:

  1. obtener el cálculo de frecuencias e histogramas
  2. obtener los descriptivos
  3. analizar la normalidad estadística
  4. analizar la homogeneidad de varianza

El contexto de la exploración de datos

Antes de explorar las posibilidades del software con el que se va a trabajar, conviene situar los datos en Mis Documentos y crear ahí el proyecto de trabajo. Un proyecto permite que la organización del trabajo sea más sencilla, por lo que la primera tarea consiste en:

  1. En RStudio, hacer clic en File → New project.
  2. Dar nombre al proyecto y elegir su ubicación. El asistente permite seleccionar la carpeta; lo recomendable es el equivalente a Mis Documentos en el equipo (PC o Mac), con un nombre sencillo, por ejemplo My first project.
  3. Hacer clic en Open in new session.

Se despliega una nueva ventana de RStudio con el proyecto vacío, que pasa a ser el punto de partida. Estar dentro de un proyecto significa que todo el trabajo se desarrolla dentro de él.

Se crea una carpeta con New folder llamada data, y dentro de ella se descomprimen todos los archivos de datos que se van a manejar. El fichero data.zip está disponible en el Aula Virtual.

Una vez hecho esto, los ficheros pueden cargarse con una ruta relativa data/..., ya que estarán todos allí. Puede comprobarse desde el panel de Files.

A continuación, un vídeo con el proceso descrito.

Tu navegador no soporta la reproducción de vídeo.

Comienza así el contenido específico de la asignatura.

El proceso de análisis en IM

Esta diapositiva representa la “hoja de ruta” del análisis de mercado. Antes de ejecutar cualquier comando en R, es fundamental entender que el análisis de datos no es solo técnica, sino un proceso de pensamiento.

Para realizar una investigación sólida es necesario dominar cinco pilares fundamentales:

  1. El contexto de la explotación de datos: ¿por qué se analiza? Los datos tienen vida y propósito; no son meros números, sino la voz de quien los proporciona.
  2. El proceso de análisis: se sigue un flujo lógico: desde la recolección y limpieza hasta la transformación y, finalmente, la interpretación estratégica.
  3. Escalas de medida: se aprende a distinguir entre variables nominales, ordinales y de razón. En R, saber clasificar correctamente una variable es el paso previo obligatorio para elegir la técnica de análisis adecuada.
  4. Relación entre instrumento y base de datos: se explora cómo el diseño de la encuesta (el instrumento) se traduce en la estructura del dataframe. Un buen diseño de cuestionario ahorra horas de trabajo en R.
  5. La exploración (EDA - Exploratory Data Analysis): esta es la etapa más crítica. Antes de construir modelos complejos, es necesario “mirar” los datos, identificar patrones, detectar valores perdidos y entender las distribuciones.

Conviene dejar de ver una hoja de cálculo como una tabla inerte y empezar a verla como un conjunto de información esperando ser interpretada. Se trata de aprender a hacerle las preguntas correctas a los datos utilizando R. Una buena exploración no busca probar hipótesis, busca descubrir qué dicen los datos antes de forzarlos a decir lo que se quiere.

Fases en la explotación de datos

La explotación de datos no comienza frente a la pantalla de R o RStudio, sino en la definición previa de la investigación. Este esquema refleja las etapas necesarias para garantizar que los datos obtenidos sean útiles para el análisis:

  1. Definición metodológica: El primer paso es determinar si el enfoque será cualitativo, para comprender fenómenos, o cuantitativo, para medir variables. Esta decisión condiciona toda la estrategia posterior.
  2. Selección de la técnica: La elección entre observación directa, encuestas o registros automáticos depende del objetivo de estudio y de la fuente de información disponible.
  3. Diseño del instrumento: Consiste en estructurar el soporte de recogida (cuestionarios, formularios o sistemas de registro). Un diseño preciso es fundamental para minimizar errores durante la captura de datos.
  4. Estrategia de análisis: Una vez obtenidos los datos, se aplica la metodología de tratamiento estadístico. El éxito de esta etapa final depende directamente de la coherencia con la que se hayan ejecutado los tres pasos anteriores.

La calidad de los resultados en R está intrínsecamente ligada al rigor aplicado en cada una de estas fases previas.

Tarea inicial del investigador

Una vez que los datos han sido recolectados y estructurados, el investigador debe iniciar una fase de análisis descriptivo que permita sintetizar la información. Las tareas fundamentales en esta etapa son:

  1. Exploración de datos: Consiste en el examen preliminar de las variables para detectar anomalías, valores perdidos o comportamientos inusuales antes de iniciar el análisis estadístico.
  2. Recuentos: Es la tarea básica de contabilización de frecuencias, esencial para entender el tamaño de cada categoría en la muestra.
  3. Tablas marginales: Permiten obtener una visión general de la distribución de una variable por sí misma, independientemente de las demás.
  4. Tablas cruzadas: Es el método principal para analizar la relación entre dos variables, permitiendo identificar patrones o asociaciones entre ellas.
  5. Inferencia sobre tablas de contingencia: Finalmente, se aplican pruebas estadísticas (como el test de Chi-cuadrado) para determinar si las asociaciones observadas en las tablas cruzadas son estadísticamente significativas o fruto del azar.

Este flujo de trabajo permite pasar de una base de datos bruta a un conocimiento consolidado, sirviendo como base necesaria para cualquier análisis de mayor complejidad.

La profundidad del proceso de análisis varía según la complejidad de la técnica seleccionada. Aunque todo proyecto parte de una definición clara del problema, el flujo operativo se expande a medida que aumenta la sofisticación de las herramientas utilizadas:

  • Técnicas univariantes: El proceso es directo. Tras la definición y el plan de análisis, se evalúa la aplicabilidad (comprobación de supuestos básicos) para proceder a la interpretación de los estadísticos descriptivos (medias, frecuencias, dispersión).
  • Técnicas bivariantes y multivariantes: Este flujo es más exigente. Además de las etapas iniciales, requiere una fase central de estimación y ajuste del modelo, donde se cuantifican las relaciones o estructuras subyacentes. Tras la interpretación, se añade un paso crítico: la validación del modelo, que garantiza que los resultados obtenidos son robustos, fiables y generalizables.

Mientras que en el análisis univariante se busca describir el comportamiento de una variable, en el análisis multivariante el objetivo es reducir la incertidumbre mediante la confirmación de modelos que expliquen la estructura de los datos con rigor estadístico.

Para operar con eficacia es necesario conectar los conceptos teóricos de la investigación con la arquitectura técnica de los bancos de datos. Esta fase se divide en dos ejes:

Consideraciones sobre las variables: el análisis estadístico comienza con la correcta definición de la variable. Es necesario comprender qué constituye un instrumento de medición, cómo se desglosa en preguntas y respuestas, y la distinción vital entre el valor (el dato numérico o texto) y su etiqueta (el significado que se le asigna). La codificación correcta es lo que permite que una variable pase de ser una respuesta en un cuestionario a un factor analizable en el software.

Consideraciones sobre los datos: aquí se aborda la naturaleza del archivo. No basta con disponer de información; es preciso entender cómo se estructura en filas (observaciones) y columnas (variables), qué formatos son óptimos para el intercambio entre plataformas y cómo gestionar los metadatos. La correcta diferenciación entre el dato bruto y el etiquetado de variables es lo que garantiza la transparencia y la calidad del informe final.

Dominar estos fundamentos permite evitar errores comunes en la importación y manipulación de datasets, asegurando que el análisis realizado en R sea preciso desde el primer momento.

Escalas de medida y tipos de variable

El primer paso para analizar un dato es definir su naturaleza. El software necesita saber qué tipo de información está procesando para aplicar la prueba estadística correcta. Las variables se clasifican bajo dos criterios:

  • 1. Según el tipo de métrica (Nivel de medición):
    • Cualitativas (No métricas): Se centran en atributos.
      • Las variables nominales actúan como etiquetas de clasificación (ej. género).
      • Las variables ordinales incorporan además un sentido de jerarquía u orden (ej. nivel de satisfacción).
    • Cuantitativas (Métricas): Permiten operaciones matemáticas precisas. Las variables de intervalo poseen un orden y una magnitud de diferencia constante (ej. temperatura en grados Celsius), mientras que las de razón incluyen un cero absoluto que permite cuantificar proporciones (ej. ingresos o edad).
  • 2. Según la continuidad de valores:
    • Discretas: Representan valores contables que no admiten decimales intermedios (ej. número de hijos).
    • Continuas: Pueden asumir cualquier valor dentro de un rango determinado, lo que permite una medición de alta precisión (ej. tiempo de respuesta o peso).

La identificación correcta de estas escalas es el paso crítico que determina la capacidad de ejecutar modelos estadísticos. En R, esta clasificación es la que guía la elección entre utilizar un gráfico de barras, un histograma, un test no paramétrico o una regresión lineal.

Relación instrumento de medida - cuestionario

La traducción de un cuestionario a una base de datos no siempre es lineal. La estructura final del dataframe depende directamente del diseño de la pregunta.

  1. Preguntas simples (P1, P2): Son las más directas. Una pregunta se traduce habitualmente en una sola columna con el valor registrado (ej. el código de respuesta o el número de años).
  2. Preguntas de respuesta múltiple (P3): Estas preguntas (como la de “averías sufridas”) requieren una atención especial. Aunque en el cuestionario aparecen bajo un mismo enunciado, en la base de datos se transforman en tantas columnas como opciones de respuesta existan (P3_1, P3_2, etc.). Cada columna funciona como una variable binaria (0/1 o Sí/No), lo que permite al encuestado seleccionar varias opciones simultáneamente.
  3. Baterías o escalas (P4): Aunque visualmente ocupan varias columnas (P4_1, P4_2…), su naturaleza es distinta a la multirespuesta. Aquí, cada columna representa el mismo concepto medido bajo la misma escala (ej. escala Likert). A diferencia de la multirespuesta, estas columnas son intrínsecamente comparables entre sí y suelen analizarse conjuntamente como una unidad de medida.

Entender esta distinción es vital para el analista: mientras que en una escala (P4) el objetivo es analizar la consistencia interna entre los ítems, en una multirespuesta (P3) el objetivo es contabilizar la incidencia de cada una de las opciones por separado. Dominar este paso es lo que separa a quien simplemente “tiene datos” de quien sabe estructurarlos para su explotación.

Múltiple en binario frente a menciones

La forma en que se registran los datos no es neutral; determina qué se puede —y qué no se puede— analizar después. Las dos tablas de la diapositiva muestran la diferencia crítica al tratar una pregunta de respuesta múltiple (P3):

  1. La tabla superior (Variables binarias): Es la forma estándar de codificar “presencia o ausencia”. Cada opción de respuesta se convierte en una columna (0 = no marcado, 1 = marcado). Es ideal para contabilizar cuántos encuestados eligieron cada elemento, pero se pierde el orden en el que fueron seleccionados.
  2. La tabla inferior (Sistema de menciones): Aquí, el valor registrado corresponde al orden de elección (1ª mención, 2ª mención, etc.). Esta estructura es mucho más rica y potente:
    • Conserva la jerarquía: Permite identificar qué avería fue la más crítica o la que primero vino a la mente del usuario.
    • Análisis de Top of Mind (TOM): Es la única forma de aislar la primera respuesta para medir el recuerdo espontáneo o la prioridad máxima del consumidor.

Conclusión: mientras que el sistema de binarias es excelente para realizar recuentos globales de valores, el sistema de menciones es la herramienta que permite “leer la mente” del encuestado al capturar su orden de preferencias. Elegir entre una u otra estructura no es un tema técnico, sino una decisión estratégica: ¿interesa saber cuánto ha ocurrido algo, o qué ha sido lo más relevante para el mercado?

NoteEjercicio práctico

Para operar con datos, la teoría debe transformarse en una acción inmediata: clasificar. A continuación se analiza un banco de datos de hábitos digitales. El objetivo es identificar la escala de medida real de cada variable, superando la apariencia superficial de los datos.

  • Age (Edad en años): Escala de razón. Tiene un cero absoluto y permite medir cuántas veces es mayor una edad que otra.
  • Educ (Años de estudios): Escala de razón o intervalo (según el contexto), pero en investigación de mercados suele tratarse como métrica para promedios.
  • Usecomp, usenet, usemail (Binarias 1/0): Escala nominal. Aunque los valores sean numéricos (0 o 1), estos números son meras etiquetas que indican presencia o ausencia.
  • Emailhrs, webhrs, nethrs (Horas): Escala de razón. Son variables continuas que permiten realizar cálculos aritméticos directos.
  • Netcat (Categorizada 1-4): Escala ordinal. Aunque derivan de una variable continua, al agruparlas en rangos, se pierde la precisión exacta y solo se conserva el orden o jerarquía.
  • Region (A=1, B=2…): Escala nominal. Los números asignados a las regiones no representan cantidad ni orden; solo sirven para diferenciar grupos.

El reto del analista: la presencia de números puede engañar. En R, si una escala nominal (como region) se clasifica erróneamente como de razón (numérica), el software intentará calcular una “media de regiones”, lo cual carece de sentido lógico. Clasificar correctamente es el primer paso hacia un análisis válido.

Exploración de los datos

Introducción

Para realizar una inferencia válida es necesario dominar primero la descripción básica de los datos; en R, este proceso se traslada a la consola mediante funciones específicas. El objetivo de este bloque es pasar de la exploración visual a la cuantificación estadística:

  1. La exploración del archivo: antes de calcular nada, se realiza un diagnóstico de la estructura (filas, columnas, tipos de variables) y un análisis exploratorio inicial para detectar anomalías.
  2. La descripción estadística: se toma la variable age como modelo para aprender a extraer los estadísticos fundamentales:
    • Para variables categóricas (Nominales/Ordinales): se utilizan tablas de frecuencias, que permiten conocer cuántos individuos responden a cada categoría y qué porcentaje representan sobre el total.
    • Para variables continuas (Intervalo/Razón): se utilizan estadísticos descriptivos: la media, mediana, desviación típica, mínimos, máximos y la MAD, que permiten resumir la distribución de la variable en unos pocos indicadores numéricos.

El cambio de paradigma: mientras que en otros software el análisis se limita a “clicar” opciones, en R el análisis es reproducible. Cada tabla de frecuencias o estadístico obtenido queda guardado en el script, lo que permite que el informe completo se genere de manera automática y sin errores de manipulación manual. Esta es una de las grandes ventajas de trabajar con R y RStudio.

Herramientas básicas

Frecuencias

Este es el siguiente paso: el primer script de trabajo del proyecto. Conviene explorar siempre el banco de datos cargado con la instrucción glimpse del paquete dplyr.

# Load the SPSS dataset into the 'gssnet1' object
# We use the 'expss' package because it perfectly retains variable and value labels from SPSS
gssnet1 <- expss::read_spss('data/gssnet1.sav')

# Get a quick, clean overview of the data structure (variables, data types, and first few values)
dplyr::glimpse(gssnet1)
Rows: 984
Columns: 11
$ age      <labelled> 30, 39, 72, 41, 24, 23, 27, 34, 45, 51, 46, 56, 46, 23, …
$ educ     <labelled> 11, 9, 10, 13, 12, 12, 12, 10, 11, 12, 12, 6, 10, 10, 11…
$ usecomp  <labelled> 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0,…
$ usenet   <labelled> 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0,…
$ usemail  <labelled> 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0,…
$ emailhrs <labelled> -1.00000000, -1.00000000, -1.00000000, -1.00000000, 1.00…
$ webhrs   <labelled> -1.0, -1.0, -1.0, -1.0, 2.0, -9.0, 0.5, -1.0, -1.0, -1.0…
$ nethrs   <labelled> -1.000000, -1.000000, -1.000000, -1.000000, 3.000000, -9…
$ netcat   <labelled> -1, -1, -1, -1, 1, -9, 1, -1, -1, -1, -1, -1, -1, -1, 1,…
$ region   <labelled> 5, 7, 3, 3, 6, 5, 7, 4, 3, 5, 6, 7, 7, 7, 7, 2, 3, 3, 3,…
$ Zage     <labelled> -0.97196706, -0.43378202, 1.53956312, -0.31418535, -1.33…
# Display the dataframe in the console to inspect its actual content
print(gssnet1)
    age educ usecomp usenet usemail    emailhrs      webhrs       nethrs netcat
1    30   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
2    39    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
3    72   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
4    41   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
5    24   12       1      1       1  1.00000000  2.00000000   3.00000000      1
6    23   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
7    27   12       1      1       1  1.00000000  0.50000000   1.50000000      1
8    34   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
9    45   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
10   51   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
11   46   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
12   56    6       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
13   46   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
14   23   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
15   54   11       1      1       1  1.00000000  1.00000000   2.00000000      1
16   70   12       1      1       1  1.00000000  2.00000000   3.00000000      1
17   22   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
18   38   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
19   74   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
20   58   14       1      1       1 10.00000000  5.00000000  15.00000000      3
21   63   12       1      1       1  5.00000000  2.00000000   7.00000000      2
22   28   14       1      1       1  2.00000000 15.00000000  17.00000000      4
23   67   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
24   54   17       1      1       1  5.00000000 30.00000000  35.00000000      4
25   58    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
26   43   14       1      1       1  0.01666667  4.00000000   4.01666667      2
27   26   14       1      1       1 30.00000000 60.00000000  90.00000000      4
28   58   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
29   48   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
30   39    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
31   38   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
32   29   11       1      1       1  1.00000000  5.00000000   6.00000000      2
33   67   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
34   35   13       1      1       1  2.00000000  3.00000000   5.00000000      2
35   73   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
36   68   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
37   58   16       1      1       1 20.00000000  8.00000000  28.00000000      4
38   55   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
39   33   18       1      1       1  5.00000000  3.00000000   8.00000000      2
40   26   13       1      1       1  0.01666667  2.00000000   2.01666667      1
41   49   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
42   23   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
43   55   16       1      1       1  0.50000000  0.50000000   1.00000000      1
44   40   16       1      1       1  0.25000000  5.00000000   5.25000000      2
45   48   18       1      1       1  4.00000000  1.00000000   5.00000000      2
46   57   18       1      1       1 10.00000000  3.00000000  13.00000000      3
47   41   16       1      1       1 50.00000000 20.00000000  70.00000000      4
48   57   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
49   30   17       1      1       1  3.00000000  3.00000000   6.00000000      2
50   48   16       1      1       1  5.00000000 10.00000000  15.00000000      3
51   33   15       1      1       1 20.00000000 10.00000000  30.00000000      4
52   69   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
53   31   15       1      1       1  1.00000000  5.00000000   6.00000000      2
54   31   14       1      1       1 30.00000000 10.00000000  40.00000000      4
55   79   12       1      1       1 10.00000000  0.00000000  10.00000000      3
56   18   12       1      1       1  5.00000000  5.00000000  10.00000000      3
57   63   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
58   33   14       1      1       1  7.00000000  7.00000000  14.00000000      3
59   50   17       1      1       1  5.00000000  5.00000000  10.00000000      3
60   57   15       1      1       1  2.00000000  0.00000000   2.00000000      1
61   60    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
62   74   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
63   34   18       1      1       1  3.00000000  2.00000000   5.00000000      2
64   62   12       1      1       1  3.00000000  5.00000000   8.00000000      2
65   61   15       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
66   56    6       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
67   55   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
68   32   18       1      1       1  3.00000000  1.00000000   4.00000000      1
69   50   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
70   24   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
71   50   12       1      1       1  0.50000000  4.00000000   4.50000000      2
72   49   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
73   35   12       1      1       1 20.00000000  5.00000000  25.00000000      4
74   58   12       1      1       1  4.00000000  2.00000000   6.00000000      2
75   58   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
76   33   16       1      1       1 15.00000000  3.00000000  18.00000000      4
77   99   16       1      1       1 -9.00000000 -9.00000000  -9.00000000     -9
78   31   16       1      1       1 30.00000000  5.00000000  35.00000000      4
79   74   18       1      1       1  0.50000000  5.00000000   5.50000000      2
80   69   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
81   35    6       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
82   59   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
83   76   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
84   99   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
85   47   15       1      1       1 48.00000000 48.00000000  96.00000000      4
86   30   12       1      1       1  5.00000000  7.00000000  12.00000000      3
87   38   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
88   49   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
89   28   14       1      1       1  0.25000000 65.00000000  65.25000000      4
90   24   11       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
91   24   15       1      1       1 30.00000000 10.00000000  40.00000000      4
92   51    6       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
93   30   14       1      1       1  8.00000000  0.08333333   8.08333333      3
94   44   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
95   55   16       1      1       1  1.00000000  2.00000000   3.00000000      1
96   23   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
97   33   13       1      1       1  5.00000000  5.00000000  10.00000000      3
98   64   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
99   26   14       1      1       1 10.00000000  6.00000000  16.00000000      3
100  41   13       1      1       1  1.00000000  5.00000000   6.00000000      2
101  70   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
102  40   18       1      1       1  1.00000000  5.00000000   6.00000000      2
103  59   18       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
104  49   17       1      1       1  7.00000000  7.00000000  14.00000000      3
105  44   14       1      1       1 48.00000000 70.00000000 118.00000000      4
106  50   12       1      1       1  4.00000000 10.00000000  14.00000000      3
107  44   20       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
108  28   17       1      1       1 -9.00000000 -9.00000000  -9.00000000     -9
109  24   17       1      1       1  2.00000000  5.00000000   7.00000000      2
110  24   11       1      1       1  5.00000000 10.00000000  15.00000000      3
111  49   20       1      1       1 10.00000000 15.00000000  25.00000000      4
112  25   15       1      1       1  0.50000000  2.00000000   2.50000000      1
113  18   12       1      1       1  1.75000000  2.00000000   3.75000000      1
114  19   13       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
115  46   16       1      1       1  1.00000000  3.00000000   4.00000000      1
116  35   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
117  50   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
118  49   14       1      1       1  1.00000000 14.00000000  15.00000000      3
119  46   16       1      1       1  6.00000000  2.00000000   8.00000000      2
120  39   16       1      1       1  1.00000000  4.00000000   5.00000000      2
121  22   14       1      1       1  5.00000000  0.50000000   5.50000000      2
122  18   11       1      1       1  2.00000000  4.00000000   6.00000000      2
123  48   12       1      1       1  7.00000000 20.00000000  27.00000000      4
124  37   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
125  54   15       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
126  24   13       1      1       1 20.00000000 20.00000000  40.00000000      4
127  41   17       1      1       1  4.00000000 12.00000000  16.00000000      3
128  82   16       1      1       1  0.50000000  0.41666667   0.91666667      1
129  44   20       1      1       1 20.00000000 20.00000000  40.00000000      4
130  33   14       1      1       1 35.00000000  1.00000000  36.00000000      4
131  40   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
132  41   14       1      1       1  1.00000000  5.00000000   6.00000000      2
133  58   16       1      1       1  2.00000000  6.00000000   8.00000000      2
134  67   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
135  46   14       1      1       1  0.16666667  1.00000000   1.16666667      1
136  35   12       1      1       1  0.08333333  0.25000000   0.33333333      1
137  81   12       1      1       1 14.00000000  7.00000000  21.00000000      4
138  42   12       1      1       1  1.00000000  0.00000000   1.00000000      1
139  51   18       1      1       1 10.00000000 15.00000000  25.00000000      4
140  89   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
141  66   13       1      1       1  5.00000000  8.00000000  13.00000000      3
142  68   18       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
143  32   19       1      1       1  0.50000000  0.50000000   1.00000000      1
144  44   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
145  38   16       1      1       1  5.00000000  5.00000000  10.00000000      3
146  40   16       1      1       1 12.00000000 14.00000000  26.00000000      4
147  37   18       1      1       1  7.00000000 10.00000000  17.00000000      4
148  29   10       1      1       1  0.08333333  1.00000000   1.08333333      1
149  50   20       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
150  29   20       1      1       1  1.00000000  2.00000000   3.00000000      1
151  48   12       1      1       1  5.00000000 40.00000000  45.00000000      4
152  48   13       1      1       1  1.00000000 10.00000000  11.00000000      3
153  62   14       1      1       1  4.00000000  5.00000000   9.00000000      3
154  43   14       1      1       1  1.00000000  0.00000000   1.00000000      1
155  56   16       1      1       1  2.00000000  0.50000000   2.50000000      1
156  38   16       1      1       1  0.25000000  1.00000000   1.25000000      1
157  59   20       1      1       1 50.00000000  5.00000000  55.00000000      4
158  84   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
159  24   18       1      1       1 15.00000000  5.00000000  20.00000000      4
160  29    5       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
161  34   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
162  42   16       1      1       1  0.08333333 10.00000000  10.08333333      3
163  28   17       1      1       1  1.00000000  3.00000000   4.00000000      1
164  38   18       1      1       1 12.00000000  5.00000000  17.00000000      4
165  88   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
166  66   17       1      1       1  2.00000000  2.00000000   4.00000000      1
167  46   14       1      1       1  1.00000000  1.00000000   2.00000000      1
168  25   12       1      1       1  1.00000000  3.00000000   4.00000000      1
169  18   11       1      1       1  0.16666667  1.00000000   1.16666667      1
170  38   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
171  66   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
172  33    3       1      1       1  0.33333333  1.00000000   1.33333333      1
173  36   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
174  61   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
175  73   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
176  30   14       1      1       1  1.00000000  2.00000000   3.00000000      1
177  56   14       1      1       1  2.00000000  1.00000000   3.00000000      1
178  80   13       1      1       1  5.00000000  3.00000000   8.00000000      2
179  19   12       1      1       1  1.00000000  1.00000000   2.00000000      1
180  40   12       1      1       1  0.50000000  0.50000000   1.00000000      1
181  34   15       1      1       1  5.00000000  1.00000000   6.00000000      2
182  56   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
183  45   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
184  33   13       1      1       1  1.00000000  2.00000000   3.00000000      1
185  69    7       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
186  33   16       9      9       9 -9.00000000 -9.00000000  -3.00000000     -3
187  19   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
188  33   14       1      1       1  0.75000000  3.00000000   3.75000000      1
189  76    8       1      1       1  0.50000000  0.50000000   1.00000000      1
190  33   16       1      1       1 10.00000000  5.00000000  15.00000000      3
191  24   15       1      1       1 25.00000000 30.00000000  55.00000000      4
192  47   18       1      1       1  3.00000000  3.00000000   6.00000000      2
193  47   18       1      1       1  1.00000000  2.00000000   3.00000000      1
194  99   18       1      1       1  8.00000000  8.00000000  16.00000000      3
195  34   16       1      1       1 10.00000000 20.00000000  30.00000000      4
196  38   13       1      1       1 15.00000000  2.00000000  17.00000000      4
197  47   16       1      1       1 -9.00000000 -9.00000000  -9.00000000     -9
198  31   12       1      1       1 20.00000000  2.00000000  22.00000000      4
199  34   16       1      1       1 25.00000000 25.00000000  50.00000000      4
200  31   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
201  45   14       1      1       1  0.25000000  0.25000000   0.50000000      1
202  30   15       1      1       1  0.50000000  2.00000000   2.50000000      1
203  19   13       1      1       1  0.50000000  1.00000000   1.50000000      1
204  31   12       1      1       1 25.00000000 10.00000000  35.00000000      4
205  30   16       1      1       1  2.00000000  3.00000000   5.00000000      2
206  50   20       1      1       1 10.00000000  5.00000000  15.00000000      3
207  24   16       1      1       1  2.00000000  0.50000000   2.50000000      1
208  44   14       1      1       1 28.00000000  6.00000000  34.00000000      4
209  33    7       1      1       1  0.08333333  0.00000000   0.08333333      1
210  27    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
211  45   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
212  44   12       1      1       1  3.00000000  5.00000000   8.00000000      2
213  50   12       1      1       1  4.00000000  4.00000000   8.00000000      2
214  24   16       1      1       1  8.00000000  2.00000000  10.00000000      3
215  64    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
216  59   16       1      1       1  9.00000000  5.00000000  14.00000000      3
217  42   16       1      1       1  5.00000000 20.00000000  25.00000000      4
218  41   16       1      1       1  2.00000000  2.00000000   4.00000000      1
219  48   12       1      1       1  0.50000000  1.00000000   1.50000000      1
220  35   13       1      1       1 20.00000000 10.00000000  30.00000000      4
221  38   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
222  45   16       1      1       1  2.00000000  4.00000000   6.00000000      2
223  43   18       1      1       1  0.50000000  0.00000000   0.50000000      1
224  45   16       1      1       1  2.00000000  3.00000000   5.00000000      2
225  40   18       1      1       1 36.00000000 20.00000000  56.00000000      4
226  57   19       1      1       1  8.00000000 24.00000000  32.00000000      4
227  48   12       9      9       9 -9.00000000 -9.00000000  -3.00000000     -3
228  49   10       9      9       9 -9.00000000 -9.00000000  -3.00000000     -3
229  53   10       1      1       1  6.00000000  4.00000000  10.00000000      3
230  56   15       1      1       1 20.00000000  0.00000000  20.00000000      4
231  40   16       1      1       1 -9.00000000 -9.00000000  -9.00000000     -9
232  61   12       1      1       1  5.00000000  2.00000000   7.00000000      2
233  29   12       1      1       9 -9.00000000 -9.00000000  -9.00000000     -9
234  52   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
235  24   18       1      1       1  4.00000000  2.00000000   6.00000000      2
236  38   16       1      1       1  0.20000000 10.00000000  10.20000000      3
237  50   18       1      1       1  7.00000000  5.00000000  12.00000000      3
238  24   17       1      1       1 10.00000000 10.00000000  20.00000000      4
239  48   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
240  46   12       1      1       1  0.16666667  1.00000000   1.16666667      1
241  63   15       1      1       1  7.00000000  4.00000000  11.00000000      3
242  47   15       1      1       1  1.00000000 15.00000000  16.00000000      3
243  26   15       1      1       1 10.00000000 15.00000000  25.00000000      4
244  26   16       1      1       1  6.00000000  4.00000000  10.00000000      3
245  57   16       1      1       1  7.00000000  5.00000000  12.00000000      3
246  54   15       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
247  30   12       1      1       1  0.50000000  3.00000000   3.50000000      1
248  29   14       1      1       1  0.25000000  4.00000000   4.25000000      2
249  20   12       1      1       1  3.00000000  1.00000000   4.00000000      1
250  22   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
251  65   12       1      1       1  5.00000000  2.00000000   7.00000000      2
252  47    9       1      1       1  1.00000000  0.00000000   1.00000000      1
253  26   16       1      1       1  7.00000000  1.00000000   8.00000000      2
254  39   18       1      1       1  7.00000000 10.00000000  17.00000000      4
255  52   12       1      1       1  1.00000000  4.00000000   5.00000000      2
256  65   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
257  50   10       1      1       1  1.00000000  5.00000000   6.00000000      2
258  57   16       1      1       1 15.00000000  0.50000000  15.50000000      3
259  19   14       1      1       1  2.00000000  5.00000000   7.00000000      2
260  57   14       1      1       1  1.00000000 20.00000000  21.00000000      4
261  45   13       1      1       1  3.00000000  2.00000000   5.00000000      2
262  68   16       1      1       1  2.00000000  5.00000000   7.00000000      2
263  35   13       1      1       1 50.00000000  6.00000000  56.00000000      4
264  60   14       1      1       1  5.00000000  1.00000000   6.00000000      2
265  30   12       1      1       1 35.00000000  6.00000000  41.00000000      4
266  62   12       1      1       1  1.00000000 12.00000000  13.00000000      3
267  33   16       1      1       1 10.00000000  5.00000000  15.00000000      3
268  45   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
269  23   16       1      1       1  7.00000000 14.00000000  21.00000000      4
270  34   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
271  41   16       1      1       1 50.00000000 25.00000000  75.00000000      4
272  55   14       1      1       1  0.16666667  6.00000000   6.16666667      2
273  32   16       1      1       1 30.00000000  3.00000000  33.00000000      4
274  42   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
275  46   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
276  52   18       1      1       1  1.00000000  0.00000000   1.00000000      1
277  29   17       1      1       1  3.00000000  5.00000000   8.00000000      2
278  40   20       1      1       1  5.00000000  5.00000000  10.00000000      3
279  57   16       1      1       1  4.00000000 20.00000000  24.00000000      4
280  28   12       1      1       1  0.16666667  0.00000000   0.16666667      1
281  48   17       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
282  78   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
283  66   15       1      1       1  1.00000000  3.00000000   4.00000000      1
284  36   18       1      1       1 10.00000000  5.00000000  15.00000000      3
285  60   17       1      1       1  5.00000000  2.00000000   7.00000000      2
286  44   14       1      1       1  0.50000000  1.00000000   1.50000000      1
287  51   16       1      1       1  2.00000000  8.00000000  10.00000000      3
288  47   17       1      1       1 25.00000000  2.00000000  27.00000000      4
289  37   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
290  25   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
291  55   16       1      1       1  3.00000000  1.00000000   4.00000000      1
292  32   16       1      1       1 10.00000000  5.00000000  15.00000000      3
293  23   15       1      1       1  1.00000000  2.00000000   3.00000000      1
294  62   17       1      1       1  4.00000000  1.66666667   5.66666667      2
295  26   15       1      1       1 10.00000000 15.00000000  25.00000000      4
296  62   14       1      1       1 18.00000000 20.00000000  38.00000000      4
297  64   14       1      1       1  3.00000000 20.00000000  23.00000000      4
298  50   16       1      1       1  0.25000000  1.00000000   1.25000000      1
299  72   16       1      1       1  4.00000000  2.00000000   6.00000000      2
300  63   16       1      1       1 10.00000000  2.00000000  12.00000000      3
301  46   16       1      1       1 20.00000000 10.00000000  30.00000000      4
302  64    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
303  35   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
304  60   14       1      1       1 28.00000000  7.00000000  35.00000000      4
305  38   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
306  41   18       1      1       1  1.00000000  5.00000000   6.00000000      2
307  69   12       1      1       1  2.00000000  2.00000000   4.00000000      1
308  52   18       1      1       1  1.00000000  4.00000000   5.00000000      2
309  86   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
310  79   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
311  68   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
312  66   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
313  25   14       1      1       9 -9.00000000 -9.00000000  -9.00000000     -9
314  29   12       1      1       1  0.25000000  0.50000000   0.75000000      1
315  44   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
316  28   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
317  78   12       1      1       1  7.00000000  0.00000000   7.00000000      2
318  69   18       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
319  49   16       1      1       1  3.00000000  3.00000000   6.00000000      2
320  22   16       1      1       1  2.00000000  1.00000000   3.00000000      1
321  28   14       1      1       1 43.00000000  0.00000000  43.00000000      4
322  64   18       1      1       1  1.00000000 30.00000000  31.00000000      4
323  63   13       1      1       1  4.00000000  5.00000000   9.00000000      3
324  36   16       1      1       1 10.00000000 30.00000000  40.00000000      4
325  23   15       1      1       1  1.00000000  4.00000000   5.00000000      2
326  51   15       1      1       1  2.00000000 10.00000000  12.00000000      3
327  56   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
328  40   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
329  50   12       1      1       1  1.00000000  2.00000000   3.00000000      1
330  48   14       1      1       1  2.00000000 10.00000000  12.00000000      3
331  47   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
332  44   18       1      1       1 25.00000000  0.00000000  25.00000000      4
333  73   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
334  27   17       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
335  25   16       1      1       1  4.00000000  0.00000000   4.00000000      1
336  25   16       1      1       1  1.00000000  3.00000000   4.00000000      1
337  23   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
338  70   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
339  26   16       1      1       1  5.00000000 15.00000000  20.00000000      4
340  52   17       1      1       1  2.00000000  1.00000000   3.00000000      1
341  73   14       1      1       1  8.00000000 10.00000000  18.00000000      4
342  34   18       1      1       1 12.00000000  5.00000000  17.00000000      4
343  32   14       1      1       1  1.00000000  2.00000000   3.00000000      1
344  25   12       1      1       1  5.00000000 28.00000000  33.00000000      4
345  32   14       1      1       1  5.00000000  6.00000000  11.00000000      3
346  19   11       1      1       1  0.16666667  3.00000000   3.16666667      1
347  36   19       1      1       1  7.00000000  5.00000000  12.00000000      3
348  56   20       1      1       1  0.50000000  4.00000000   4.50000000      2
349  85    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
350  78   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
351  20   13       1      1       1 10.00000000 20.00000000  30.00000000      4
352  34   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
353  23   16       1      1       1  2.00000000  7.00000000   9.00000000      3
354  52   16       1      1       1 15.00000000 15.00000000  30.00000000      4
355  69   20       1      1       1  2.00000000  3.00000000   5.00000000      2
356  32   18       1      1       1 10.00000000 10.00000000  20.00000000      4
357  77   19       1      1       1  0.50000000  0.00000000   0.50000000      1
358  44   13       1      1       1  0.33333333  0.00000000   0.33333333      1
359  41   15       1      1       1  1.00000000  1.00000000   2.00000000      1
360  38   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
361  34   14       1      1       1  1.00000000  2.00000000   3.00000000      1
362  38   16       1      1       1 21.00000000  7.00000000  28.00000000      4
363  60   16       1      1       1  0.50000000  0.50000000   1.00000000      1
364  83   12       1      1       1  7.00000000  0.00000000   7.00000000      2
365  49   14       1      1       1  1.00000000  4.00000000   5.00000000      2
366  52   14       1      1       1  2.00000000  1.00000000   3.00000000      1
367  62   17       1      1       1  3.00000000  5.00000000   8.00000000      2
368  42   14       1      1       1  2.00000000  1.00000000   3.00000000      1
369  27   18       1      1       1  0.16666667  0.16666667   0.33333333      1
370  41   16       1      1       1  4.00000000 20.00000000  24.00000000      4
371  89   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
372  40   16       1      1       1  6.00000000  3.00000000   9.00000000      3
373  52   17       1      1       1  0.41666667  1.00000000   1.41666667      1
374  37   12       1      1       1  1.00000000  2.00000000   3.00000000      1
375  56   12       1      1       1  1.00000000  0.50000000   1.50000000      1
376  44   14       1      1       1 12.00000000  1.00000000  13.00000000      3
377  44   16       1      1       1  1.00000000  2.00000000   3.00000000      1
378  49   13       1      1       1  5.00000000  0.00000000   5.00000000      2
379  55   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
380  33   13       1      1       1  5.00000000  7.00000000  12.00000000      3
381  55   14       1      1       1  0.50000000  0.00000000   0.50000000      1
382  46    9       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
383  56   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
384  48   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
385  57   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
386  43   12       1      1       1  5.00000000  6.00000000  11.00000000      3
387  31   14       1      1       1  2.00000000  3.00000000   5.00000000      2
388  54   13       1      1       1  1.00000000  3.00000000   4.00000000      1
389  72   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
390  67   17       1      1       1 21.00000000 35.00000000  56.00000000      4
391  21   14       1      1       1  7.00000000  4.00000000  11.00000000      3
392  27   17       1      1       1  2.00000000  2.00000000   4.00000000      1
393  35   16       1      1       1 15.00000000 25.00000000  40.00000000      4
394  81   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
395  80   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
396  53   18       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
397  27   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
398  22   16       1      1       1  1.00000000  3.00000000   4.00000000      1
399  74   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
400  47   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
401  74   12       1      1       1  2.00000000 10.00000000  12.00000000      3
402  51   15       1      1       1  0.50000000  1.00000000   1.50000000      1
403  28   11       1      1       1  0.50000000 10.00000000  10.50000000      3
404  73   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
405  60   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
406  57   12       1      1       1  1.00000000  1.00000000   2.00000000      1
407  63   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
408  46   12       1      1       1  0.25000000  0.16666667   0.41666667      1
409  18   12       1      1       1  2.00000000 10.00000000  12.00000000      3
410  62   12       1      1       1  0.50000000  2.00000000   2.50000000      1
411  58   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
412  24   16       1      1       1  5.00000000 10.00000000  15.00000000      3
413  36   14       1      1       1  0.16666667  2.00000000   2.16666667      1
414  32   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
415  27   17       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
416  59   12       1      1       1  0.50000000  3.00000000   3.50000000      1
417  44   16       1      1       1  2.00000000  5.00000000   7.00000000      2
418  20   13       1      1       1  0.50000000  0.50000000   1.00000000      1
419  78    2       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
420  48   12       1      1       1  5.00000000  3.00000000   8.00000000      2
421  46   16       1      1       1 10.00000000  2.00000000  12.00000000      3
422  22   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
423  46   14       1      1       1  0.50000000  0.50000000   1.00000000      1
424  31   15       1      1       1 10.00000000  2.00000000  12.00000000      3
425  78   17       1      1       1  2.00000000  4.00000000   6.00000000      2
426  62   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
427  38   12       1      1       1 25.00000000 10.00000000  35.00000000      4
428  38   13       1      1       1  4.00000000 15.00000000  19.00000000      4
429  43   12       1      1       1 30.00000000  0.00000000  30.00000000      4
430  38   12       1      1       1  0.50000000  5.00000000   5.50000000      2
431  52   12       1      1       1  5.00000000  6.00000000  11.00000000      3
432  40   19       1      1       1  4.00000000  3.00000000   7.00000000      2
433  25   14       1      1       1  3.00000000  1.00000000   4.00000000      1
434  43   16       1      1       1  1.00000000 12.00000000  13.00000000      3
435  42   17       1      1       1  0.25000000  2.00000000   2.25000000      1
436  45   16       1      1       1  0.50000000  1.00000000   1.50000000      1
437  70   14       1      1       1  1.00000000  2.00000000   3.00000000      1
438  32   14       1      1       1  0.50000000  3.00000000   3.50000000      1
439  79   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
440  62   11       1      1       1  7.00000000  4.00000000  11.00000000      3
441  23   11       1      1       1  0.50000000  0.00000000   0.50000000      1
442  65   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
443  42   12       1      1       1  3.00000000  4.00000000   7.00000000      2
444  35   20       1      1       1 24.00000000 60.00000000  84.00000000      4
445  20    9       1      1       1  3.00000000  5.00000000   8.00000000      2
446  47   13       1      1       1  1.50000000 15.00000000  16.50000000      4
447  72   12       1      1       1  5.00000000  1.00000000   6.00000000      2
448  62   16       1      1       1  1.00000000  3.00000000   4.00000000      1
449  51   12       1      1       1  1.00000000  1.00000000   2.00000000      1
450  35   20       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
451  51   13       1      1       1  1.00000000 30.00000000  31.00000000      4
452  41   16       1      1       1  5.00000000  5.00000000  10.00000000      3
453  18   11       1      1       1  0.50000000 14.00000000  14.50000000      3
454  19   13       1      1       1  1.00000000  2.00000000   3.00000000      1
455  27   20       1      1       1  1.00000000  2.00000000   3.00000000      1
456  42   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
457  67   12       1      1       1  4.00000000  3.00000000   7.00000000      2
458  67    8       1      1       1  1.00000000  2.00000000   3.00000000      1
459  38   16       1      1       1  1.00000000  0.50000000   1.50000000      1
460  24   16       1      1       1  5.00000000  1.00000000   6.00000000      2
461  54   12       1      1       1 40.00000000 20.00000000  60.00000000      4
462  33   16       1      1       1 20.00000000 70.00000000  90.00000000      4
463  70   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
464  29   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
465  24   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
466  54   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
467  40   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
468  45   19       1      1       1 10.00000000  0.00000000  10.00000000      3
469  75   12       1      1       1  5.00000000  3.00000000   8.00000000      2
470  31   16       1      1       1  5.00000000  8.00000000  13.00000000      3
471  66   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
472  30   16       1      1       1 40.00000000  5.00000000  45.00000000      4
473  60   12       1      1       1  1.00000000  4.00000000   5.00000000      2
474  34    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
475  55   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
476  63   15       1      1       1  2.00000000  0.00000000   2.00000000      1
477  50   20       1      1       1  0.50000000 15.00000000  15.50000000      3
478  35   12       1      1       1  3.00000000 10.00000000  13.00000000      3
479  70   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
480  43   12       1      1       1  1.00000000  0.00000000   1.00000000      1
481  65   11       1      1       1  0.50000000  0.00000000   0.50000000      1
482  52   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
483  81   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
484  28   11       1      1       1  0.50000000  0.00000000   0.50000000      1
485  28   12       1      1       1  2.00000000  2.00000000   4.00000000      1
486  23   16       1      1       1  2.00000000 15.00000000  17.00000000      4
487  24   16       1      1       1  7.00000000 14.00000000  21.00000000      4
488  72   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
489  61   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
490  32   17       1      1       1  2.00000000 12.00000000  14.00000000      3
491  54   17       1      1       1  1.00000000  1.00000000   2.00000000      1
492  25   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
493  23   16       1      1       1 10.00000000  2.00000000  12.00000000      3
494  74   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
495  39    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
496  46   14       1      1       1  0.16666667  3.00000000   3.16666667      1
497  57   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
498  34   15       1      1       1  1.00000000  5.00000000   6.00000000      2
499  60   12       1      1       1  5.00000000 49.00000000  54.00000000      4
500  40   16       1      1       1  2.00000000  6.00000000   8.00000000      2
501  70   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
502  79   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
503  21   12       1      1       1  5.00000000  5.00000000  10.00000000      3
504  21   12       1      1       1  0.50000000  3.00000000   3.50000000      1
505  89    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
506  55   13       1      1       1  0.16666667  1.00000000   1.16666667      1
507  36   12       1      1       1 10.00000000 20.00000000  30.00000000      4
508  87   14       1      1       1  2.00000000  0.25000000   2.25000000      1
509  71   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
510  57   14       1      1       1  1.00000000  0.01666667   1.01666667      1
511  21   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
512  25   14       1      1       1 20.00000000  5.00000000  25.00000000      4
513  44    9       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
514  59   14       1      1       1  1.00000000  2.00000000   3.00000000      1
515  52   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
516  86   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
517  43    9       1      1       1  2.00000000  2.00000000   4.00000000      1
518  30   16       1      1       1  0.50000000  0.00000000   0.50000000      1
519  36   14       1      1       1 10.00000000 10.00000000  20.00000000      4
520  26   13       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
521  34   16       1      1       1  0.03333333  0.25000000   0.28333333      1
522  50   14       1      1       1  1.00000000  1.00000000   2.00000000      1
523  26   12       1      1       1  2.00000000  6.00000000   8.00000000      2
524  64   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
525  81   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
526  83   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
527  25   12       1      1       1  1.00000000  1.00000000   2.00000000      1
528  45   14       1      1       1  1.00000000  2.00000000   3.00000000      1
529  48   14       1      1       1  1.00000000 25.00000000  26.00000000      4
530  71   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
531  50   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
532  67   16       1      1       1  4.00000000  0.50000000   4.50000000      2
533  77   16       1      1       1 15.00000000  8.00000000  23.00000000      4
534  62   19       1      1       1  2.00000000  1.00000000   3.00000000      1
535  49    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
536  53   12       1      1       1  2.00000000  5.00000000   7.00000000      2
537  78   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
538  45   20       1      1       1  1.00000000  4.00000000   5.00000000      2
539  43   20       1      1       1  5.00000000  2.00000000   7.00000000      2
540  40   15       1      1       1  0.50000000 20.00000000  20.50000000      4
541  21   13       1      1       1  1.00000000  3.00000000   4.00000000      1
542  28   18       1      1       1  5.00000000  3.00000000   8.00000000      2
543  40   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
544  28   15       1      1       1  4.00000000  4.00000000   8.00000000      2
545  51   16       1      1       1  2.00000000 20.00000000  22.00000000      4
546  27   15       1      1       1  2.00000000  0.75000000   2.75000000      1
547  39   14       1      1       1  5.00000000  5.00000000  10.00000000      3
548  50   16       1      1       1 20.00000000  4.00000000  24.00000000      4
549  49   20       1      1       1  2.00000000  2.00000000   4.00000000      1
550  23   16       1      1       1  1.00000000 20.00000000  21.00000000      4
551  30   16       1      1       1  1.00000000  1.00000000   2.00000000      1
552  55   14       1      1       1  1.00000000  8.00000000   9.00000000      3
553  40   10       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
554  49   15       1      1       1  5.00000000  5.00000000  10.00000000      3
555  38   16       1      1       1  1.00000000  1.00000000   2.00000000      1
556  60   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
557  33   12       1      1       1  1.00000000  6.00000000   7.00000000      2
558  48   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
559  36   15       1      1       1 21.00000000 10.00000000  31.00000000      4
560  36   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
561  27   11       1      1       1 15.00000000  5.00000000  20.00000000      4
562  62    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
563  52   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
564  35   14       1      1       1 28.00000000 20.00000000  48.00000000      4
565  57   17       1      1       1  5.00000000  5.00000000  10.00000000      3
566  23   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
567  68   14       1      1       1  2.00000000  5.00000000   7.00000000      2
568  43   11       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
569  74   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
570  59    5       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
571  56   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
572  51   12       1      1       1  2.00000000  7.00000000   9.00000000      3
573  46   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
574  59   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
575  36   14       1      1       1  5.00000000 45.00000000  50.00000000      4
576  27   15       1      1       1  5.00000000 10.00000000  15.00000000      3
577  34   18       1      1       1  5.00000000 10.00000000  15.00000000      3
578  30   16       1      1       1  8.00000000  8.00000000  16.00000000      3
579  50    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
580  57   16       1      1       1  2.00000000  7.00000000   9.00000000      3
581  37   16       1      1       1 20.00000000  5.00000000  25.00000000      4
582  79   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
583  63   13       1      1       1  7.00000000 14.00000000  21.00000000      4
584  23   17       1      1       1  2.00000000  5.00000000   7.00000000      2
585  42   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
586  47   12       1      1       1  7.00000000 15.00000000  22.00000000      4
587  56   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
588  53   14       1      1       1  5.00000000  3.00000000   8.00000000      2
589  66   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
590  48   12       1      1       1  2.00000000  3.00000000   5.00000000      2
591  72   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
592  21   15       1      1       1  3.00000000 20.00000000  23.00000000      4
593  57   12       1      1       1  2.00000000  2.00000000   4.00000000      1
594  64   18       1      1       1  4.00000000  1.00000000   5.00000000      2
595  61   12       1      1       1  0.25000000  0.00000000   0.25000000      1
596  29   20       1      1       1 10.00000000 10.00000000  20.00000000      4
597  30   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
598  63   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
599  75   16       1      1       1 10.00000000  6.00000000  16.00000000      3
600  47   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
601  44   12       1      1       1  3.00000000  8.00000000  11.00000000      3
602  32   14       1      1       1  0.50000000  2.00000000   2.50000000      1
603  48   20       1      1       1 10.00000000  3.00000000  13.00000000      3
604  26   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
605  49   13       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
606  71   12       1      1       1  1.00000000  1.00000000   2.00000000      1
607  28   16       1      1       1 15.00000000  3.00000000  18.00000000      4
608  45   14       1      1       1  2.00000000  8.00000000  10.00000000      3
609  30   13       1      1       1  1.00000000  0.00000000   1.00000000      1
610  71   15       1      1       1  7.00000000  2.00000000   9.00000000      3
611  44   20       1      1       1  5.00000000 10.00000000  15.00000000      3
612  82   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
613  49   18       1      1       1 10.00000000  7.00000000  17.00000000      4
614  46   16       1      1       1  0.16666667  0.01666667   0.18333333      1
615  24   18       1      1       1  4.00000000 21.00000000  25.00000000      4
616  58   20       1      1       1 14.00000000  1.00000000  15.00000000      3
617  64   14       1      1       1  0.16666667  0.50000000   0.66666667      1
618  61   14       1      1       1  2.00000000  0.75000000   2.75000000      1
619  49   20       1      1       1  8.00000000  3.00000000  11.00000000      3
620  29   16       1      1       1  5.00000000  1.50000000   6.50000000      2
621  39   12       1      1       1  1.00000000  2.00000000   3.00000000      1
622  28   15       1      1       1  0.50000000  1.00000000   1.50000000      1
623  67   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
624  39   12       1      1       1  1.00000000  4.00000000   5.00000000      2
625  46   13       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
626  26   13       1      1       1  0.50000000  1.00000000   1.50000000      1
627  75   18       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
628  66   13       1      1       1 15.00000000  4.00000000  19.00000000      4
629  85   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
630  21   13       1      1       1  3.00000000  3.00000000   6.00000000      2
631  76   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
632  70   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
633  34   13       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
634  76   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
635  45   18       1      1       1  2.00000000  5.00000000   7.00000000      2
636  51   16       1      1       1  6.00000000  8.00000000  14.00000000      3
637  56    0       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
638  54   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
639  83   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
640  43   13       1      1       1 10.00000000 12.00000000  22.00000000      4
641  26   12       1      1       1  0.25000000  1.00000000   1.25000000      1
642  42   17       1      1       1  0.25000000  1.00000000   1.25000000      1
643  47   19       1      1       1 10.00000000  1.00000000  11.00000000      3
644  58   20       1      1       1  1.00000000 12.00000000  13.00000000      3
645  46   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
646  54   12       1      1       1  5.00000000  7.00000000  12.00000000      3
647  28   18       1      1       1  0.50000000 10.00000000  10.50000000      3
648  25   15       1      1       1  0.25000000  0.16666667   0.41666667      1
649  26   13       1      1       1  2.00000000  2.00000000   4.00000000      1
650  75   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
651  33   20       1      1       1  2.00000000  3.00000000   5.00000000      2
652  26   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
653  26   15       1      1       1  0.50000000  3.00000000   3.50000000      1
654  47   14       1      1       1  6.00000000  7.00000000  13.00000000      3
655  65   20       1      1       1 12.00000000 10.00000000  22.00000000      4
656  40   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
657  50   11       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
658  68   15       1      1       1  5.00000000  3.00000000   8.00000000      2
659  52    6       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
660  42   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
661  27   16       1      1       1  3.00000000  1.00000000   4.00000000      1
662  45   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
663  41   14       1      1       1  1.50000000 14.00000000  15.50000000      3
664  46   15       1      1       1  1.00000000  8.00000000   9.00000000      3
665  49   12       1      1       9 -9.00000000 -9.00000000  -9.00000000     -9
666  46   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
667  35   16       1      1       1  8.00000000  6.00000000  14.00000000      3
668  89    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
669  85    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
670  34   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
671  56   12       1      1       1  6.00000000  1.00000000   7.00000000      2
672  53   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
673  45   12       1      1       1  0.01666667  2.00000000   2.01666667      1
674  59   13       1      1       1  1.00000000  5.00000000   6.00000000      2
675  61   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
676  62   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
677  49   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
678  82   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
679  22   11       1      1       1  1.00000000  2.00000000   3.00000000      1
680  50   14       1      1       1  0.25000000  5.00000000   5.25000000      2
681  67   12       1      1       1 10.00000000  1.00000000  11.00000000      3
682  36   12       1      1       1  1.00000000 48.00000000  49.00000000      4
683  79    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
684  84   13       1      1       1  0.50000000  1.00000000   1.50000000      1
685  55   15       1      1       1  4.00000000  1.00000000   5.00000000      2
686  78    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
687  38   16       1      1       1  0.50000000  2.00000000   2.50000000      1
688  59   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
689  24   12       1      1       1  1.00000000 15.00000000  16.00000000      3
690  31   12       1      1       1  0.16666667  0.25000000   0.41666667      1
691  52   12       1      1       1  0.50000000  3.00000000   3.50000000      1
692  54   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
693  35    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
694  35   16       1      1       1  0.25000000  0.25000000   0.50000000      1
695  70   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
696  70    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
697  83   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
698  54   11       1      1       1  7.00000000  1.00000000   8.00000000      2
699  25   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
700  59   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
701  43    6       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
702  62   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
703  18   12       1      1       1  0.16666667  2.00000000   2.16666667      1
704  54   12       1      1       1  5.00000000  4.00000000   9.00000000      3
705  30   12       1      1       1  0.33333333  4.00000000   4.33333333      2
706  62   12       1      1       1  7.00000000  1.00000000   8.00000000      2
707  52   15       1      1       1 40.00000000 10.00000000  50.00000000      4
708  71    4       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
709  61    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
710  44   15       1      1       1  2.00000000  5.00000000   7.00000000      2
711  37   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
712  48   12       1      1       1  5.00000000  5.00000000  10.00000000      3
713  47   18       1      1       1 10.00000000  1.00000000  11.00000000      3
714  32   12       1      1       1 38.00000000  5.00000000  43.00000000      4
715  19   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
716  66   12       1      1       1  0.50000000  0.00000000   0.50000000      1
717  40   12       1      1       1  1.00000000  8.00000000   9.00000000      3
718  37   20       1      1       1  7.00000000  7.00000000  14.00000000      3
719  75    2       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
720  35   17       1      1       1  5.00000000  2.00000000   7.00000000      2
721  53   16       1      1       1  2.00000000  1.00000000   3.00000000      1
722  45    9       1      1       1  2.00000000  3.00000000   5.00000000      2
723  25   13       1      1       1  0.03333333  9.00000000   9.03333333      3
724  73    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
725  41   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
726  61   14       1      1       1 10.00000000 10.00000000  20.00000000      4
727  47   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
728  44   14       1      1       1  2.00000000  0.50000000   2.50000000      1
729  51   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
730  48   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
731  60   12       1      1       1  2.00000000  1.00000000   3.00000000      1
732  33   11       1      1       1  0.08333333  0.08333333   0.16666667      1
733  18   11       1      1       1  1.00000000  3.00000000   4.00000000      1
734  54    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
735  38    7       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
736  71   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
737  30   16       1      1       1 35.00000000 20.00000000  55.00000000      4
738  43   16       1      1       1  7.00000000 18.00000000  25.00000000      4
739  40   15       1      1       1  6.00000000  3.00000000   9.00000000      3
740  48   14       1      1       1  4.00000000  2.00000000   6.00000000      2
741  28   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
742  74   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
743  86   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
744  25   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
745  56   13       1      1       1  8.00000000  0.50000000   8.50000000      3
746  60   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
747  40   16       1      1       1  1.00000000  4.00000000   5.00000000      2
748  41    8       1      1       1  2.00000000  2.00000000   4.00000000      1
749  42   13       1      1       1  0.50000000  3.00000000   3.50000000      1
750  32   12       1      1       1  2.00000000  1.00000000   3.00000000      1
751  22   14       1      1       1  5.00000000  0.00000000   5.00000000      2
752  54   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
753  60   15       1      1       1  5.00000000  0.11666667   5.11666667      2
754  49   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
755  46   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
756  56    6       1      1       1 -9.00000000 -9.00000000  -9.00000000     -9
757  28   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
758  35   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
759  48   13       1      1       9 -9.00000000 -9.00000000  -9.00000000     -9
760  65   18       1      1       9 -9.00000000 -9.00000000  -9.00000000     -9
761  56   16       1      1       1  2.00000000 10.00000000  12.00000000      3
762  33   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
763  50   20       1      1       1  3.00000000  0.00000000   3.00000000      1
764  64   14       1      1       1 12.00000000 30.00000000  42.00000000      4
765  26   14       1      1       1  4.00000000  2.00000000   6.00000000      2
766  18    8       9      9       9 -9.00000000 -9.00000000  -3.00000000     -3
767  64   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
768  50   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
769  37   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
770  24   12       1      1       1  0.50000000  5.00000000   5.50000000      2
771  39   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
772  71    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
773  37   14       1      1       1 30.00000000 20.00000000  50.00000000      4
774  69   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
775  65   12       1      1       1  1.00000000  2.00000000   3.00000000      1
776  21   11       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
777  84   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
778  55   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
779  46   16       1      1       1  2.00000000  2.00000000   4.00000000      1
780  43    9       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
781  25   12       1      1       1 20.00000000 15.00000000  35.00000000      4
782  25   13       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
783  31   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
784  75    6       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
785  27   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
786  37   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
787  53   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
788  51   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
789  56   14       1      1       1  6.00000000 20.00000000  26.00000000      4
790  40   12       1      1       1  0.16666667  1.00000000   1.16666667      1
791  75   12       1      1       1  2.00000000  0.00000000   2.00000000      1
792  49   16       1      1       1 10.00000000 30.00000000  40.00000000      4
793  73   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
794  72   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
795  76   18       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
796  53   18       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
797  69    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
798  74    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
799  72   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
800  79   16       1      1       1  1.00000000  0.16666667   1.16666667      1
801  37   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
802  39   14       1      1       1  0.50000000  7.00000000   7.50000000      2
803  21    9       1      1       1 25.00000000 23.00000000  48.00000000      4
804  35   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
805  28   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
806  49   14       1      1       1 28.00000000  3.00000000  31.00000000      4
807  49   14       1      1       1  8.00000000  3.00000000  11.00000000      3
808  24   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
809  40   13       1      1       1  2.00000000  1.00000000   3.00000000      1
810  40   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
811  67   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
812  48   14       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
813  56   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
814  42   12       1      1       1  7.00000000  1.00000000   8.00000000      2
815  62   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
816  42   17       1      1       1  0.33333333  2.00000000   2.33333333      1
817  46   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
818  51   12       1      1       1  1.00000000  1.00000000   2.00000000      1
819  39   16       1      1       1  0.50000000  1.00000000   1.50000000      1
820  52   12       1      1       1 12.00000000  2.00000000  14.00000000      3
821  31   11       1      1       1  1.00000000  0.50000000   1.50000000      1
822  41   15       1      1       1  1.00000000  4.00000000   5.00000000      2
823  52   13       1      1       1  0.50000000  1.00000000   1.50000000      1
824  49   16       1      1       1 10.00000000  1.00000000  11.00000000      3
825  26   12       1      1       1  2.00000000  3.00000000   5.00000000      2
826  88    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
827  70   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
828  50   17       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
829  50   15       1      1       1  2.00000000 30.00000000  32.00000000      4
830  34    9       1      1       1  2.00000000  3.00000000   5.00000000      2
831  23   12       1      1       1  1.00000000  3.00000000   4.00000000      1
832  51   16       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
833  62   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
834  68   15       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
835  51   14       1      1       1  2.00000000  4.00000000   6.00000000      2
836  40   19       1      1       1  0.16666667 16.66666667  16.83333333      4
837  60   16       1      1       1  2.00000000  3.00000000   5.00000000      2
838  50   14       1      1       1  1.16666667  1.50000000   2.66666667      1
839  51    1       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
840  82   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
841  36   18       1      1       1  1.00000000  7.00000000   8.00000000      2
842  46   16       1      1       1  0.16666667  2.00000000   2.16666667      1
843  34   16       1      1       1 50.00000000  3.00000000  53.00000000      4
844  41   18       1      1       1 20.00000000 15.00000000  35.00000000      4
845  48   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
846  53   13       1      1       1 30.00000000 40.00000000  70.00000000      4
847  46   18       1      1       1  9.00000000 40.00000000  49.00000000      4
848  50   12       1      1       1  0.01666667  1.00000000   1.01666667      1
849  57   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
850  47   12       1      1       1  2.00000000  4.00000000   6.00000000      2
851  53   20       1      1       1  2.00000000  2.00000000   4.00000000      1
852  78   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
853  67   17       1      1       1  2.00000000  3.00000000   5.00000000      2
854  99   15       1      1       1  1.00000000  4.00000000   5.00000000      2
855  55   16       1      1       1  2.00000000  3.00000000   5.00000000      2
856  35   12       1      1       1  1.00000000 12.00000000  13.00000000      3
857  47   13       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
858  61   15       1      1       1  8.00000000  8.00000000  16.00000000      3
859  45   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
860  34   12       1      1       1  2.00000000 10.00000000  12.00000000      3
861  74   16       1      1       1  9.00000000  9.00000000  18.00000000      4
862  24   17       1      1       1  5.00000000  4.00000000   9.00000000      3
863  85   16       1      1       1  1.16666667  7.00000000   8.16666667      3
864  55   16       1      1       1 10.00000000 10.00000000  20.00000000      4
865  66   14       1      1       1  6.00000000  4.00000000  10.00000000      3
866  27   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
867  28   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
868  43   15       1      1       1  2.00000000  2.00000000   4.00000000      1
869  35   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
870  21   16       1      1       1  5.00000000  5.00000000  10.00000000      3
871  89   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
872  39   16       1      1       1 14.00000000 14.00000000  28.00000000      4
873  33   14       1      1       1  2.00000000 10.00000000  12.00000000      3
874  61   19       1      1       1  5.00000000  4.00000000   9.00000000      3
875  31   15       1      1       1  0.25000000 10.00000000  10.25000000      3
876  62   16       1      1       1  3.00000000  5.00000000   8.00000000      2
877  74   12       1      1       1  1.00000000  0.00000000   1.00000000      1
878  59   18       1      1       1  1.00000000  1.00000000   2.00000000      1
879  60   20       1      1       1  0.75000000  4.00000000   4.75000000      2
880  60   16       1      1       1  3.00000000  2.00000000   5.00000000      2
881  32   16       1      1       1  0.50000000 10.00000000  10.50000000      3
882  57   16       1      1       1 20.00000000 20.00000000  40.00000000      4
883  46   13       1      1       1 40.00000000 30.00000000  70.00000000      4
884  47   14       1      1       1  0.25000000  0.00000000   0.25000000      1
885  60   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
886  58   16       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
887  49   16       1      1       1  4.00000000  4.00000000   8.00000000      2
888  50   11       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
889  31    9       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
890  30   20       1      1       1  1.00000000  8.00000000   9.00000000      3
891  54   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
892  42   16       1      1       1 10.00000000 40.00000000  50.00000000      4
893  32   14       1      1       1  2.00000000  2.00000000   4.00000000      1
894  33   12       1      1       1 10.00000000 30.00000000  40.00000000      4
895  49   10       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
896  54   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
897  61   18       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
898  33   12       1      1       1  3.00000000  2.00000000   5.00000000      2
899  62   18       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
900  52   14       1      1       1  0.16666667  0.20000000   0.36666667      1
901  34   17       1      1       1  2.00000000 15.00000000  17.00000000      4
902  37   12       1      1       1  6.00000000  4.00000000  10.00000000      3
903  35   16       1      1       1  6.00000000  6.00000000  12.00000000      3
904  35   20       1      1       1 15.00000000 13.00000000  28.00000000      4
905  25   11       1      1       1 35.00000000 10.00000000  45.00000000      4
906  26   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
907  20   14       1      1       1  2.00000000  5.00000000   7.00000000      2
908  27   16       1      1       1  1.00000000  1.00000000   2.00000000      1
909  39   18       1      1       1 45.00000000 15.00000000  60.00000000      4
910  25   16       1      1       1 30.00000000 20.00000000  50.00000000      4
911  56   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
912  43   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
913  24   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
914  24   16       1      1       1  1.00000000  0.00000000   1.00000000      1
915  48   15       1      1       1 15.00000000  2.00000000  17.00000000      4
916  23   16       1      1       1  2.00000000 10.00000000  12.00000000      3
917  35   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
918  28   19       1      1       1  3.00000000  7.00000000  10.00000000      3
919  59   20       1      1       1  1.00000000 10.00000000  11.00000000      3
920  19   15       1      1       1  4.00000000 10.00000000  14.00000000      3
921  21   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
922  43   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
923  28   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
924  26   16       1      1       1  3.00000000  0.00000000   3.00000000      1
925  37   16       1      1       1 20.00000000 10.00000000  30.00000000      4
926  38   14       1      1       9 -9.00000000 -9.00000000  -9.00000000     -9
927  40   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
928  43   13       1      1       1  1.00000000  6.00000000   7.00000000      2
929  56   17       1      1       1  8.00000000 10.00000000  18.00000000      4
930  58   14       1      1       1 10.00000000  0.00000000  10.00000000      3
931  59    6       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
932  57   13       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
933  32   13       1      1       1 10.00000000  5.00000000  15.00000000      3
934  19   12       1      1       1  1.00000000  2.00000000   3.00000000      1
935  32   16       1      1       1  1.00000000 10.00000000  11.00000000      3
936  24   16       1      1       1  2.00000000  1.00000000   3.00000000      1
937  58   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
938  22   11       1      1       1  1.00000000 40.00000000  41.00000000      4
939  29   14       1      1       1  1.00000000  1.00000000   2.00000000      1
940  31   15       1      1       1  5.00000000 35.00000000  40.00000000      4
941  18   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
942  44   14       1      1       1  5.00000000  2.00000000   7.00000000      2
943  27   12       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
944  24    7       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
945  42   16       1      1       1  1.00000000 10.00000000  11.00000000      3
946  30   17       1      1       1  1.00000000  4.00000000   5.00000000      2
947  27    6       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
948  44   15       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
949  44   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
950  32   14       1      1       1  4.00000000 15.00000000  19.00000000      4
951  44   19       1      1       1  2.00000000  2.00000000   4.00000000      1
952  23   16       1      1       1  5.00000000 10.00000000  15.00000000      3
953  21   15       1      1       1  5.00000000  8.00000000  13.00000000      3
954  43   14       1      1       1  2.00000000  1.00000000   3.00000000      1
955  21   10       1      1       1  1.00000000  4.00000000   5.00000000      2
956  38   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
957  31   13       1      1       1  2.00000000  2.00000000   4.00000000      1
958  25   16       1      1       1  1.00000000  5.00000000   6.00000000      2
959  20   12       1      1       1  1.00000000  1.00000000   2.00000000      1
960  41   16       1      1       1  0.50000000  1.00000000   1.50000000      1
961  34   20       1      1       1  2.00000000  6.00000000   8.00000000      2
962  33   13       1      1       1  3.00000000  1.00000000   4.00000000      1
963  51   15       1      1       1  1.00000000  1.00000000   2.00000000      1
964  34   12       1      1       1  0.33333333  0.50000000   0.83333333      1
965  47   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
966  44   15       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
967  61   12       1      1       1  1.00000000  5.00000000   6.00000000      2
968  25   14       1      1       1  0.50000000  2.00000000   2.50000000      1
969  28   16       1      1       1  0.75000000  1.00000000   1.75000000      1
970  60   15       1      1       1  1.00000000  4.00000000   5.00000000      2
971  34   19       1      1       1  6.00000000  8.00000000  14.00000000      3
972  32   17       1      1       1  1.00000000  1.00000000   2.00000000      1
973  66   16       1      1       1  1.00000000  4.00000000   5.00000000      2
974  47   12       1      1       1  3.00000000  0.00000000   3.00000000      1
975  61   20       1      1       1  2.00000000  4.00000000   6.00000000      2
976  45   15       9      9       9 -9.00000000 -9.00000000  -3.00000000     -3
977  40   18       9      9       9 -9.00000000 -9.00000000  -3.00000000     -3
978  42   19       1      1       1 20.00000000  2.00000000  22.00000000      4
979  40   12       1      1       1  0.33333333 10.00000000  10.33333333      3
980  67    8       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
981  49   14       1      1       1  1.00000000  0.03333333   1.03333333      1
982  31   13       1      1       1  1.00000000  1.00000000   2.00000000      1
983  71   12       0      0       0 -1.00000000 -1.00000000  -1.00000000     -1
984  34   14       1      1       0 -1.00000000 -9.00000000  -9.00000000     -9
    region        Zage
1        5 -0.97196706
2        7 -0.43378202
3        3  1.53956312
4        3 -0.31418535
5        6 -1.33075709
6        5 -1.39055543
7        7 -1.15136208
8        4 -0.73277371
9        3 -0.07499200
10       5  0.28379803
11       6 -0.01519366
12       7  0.58278972
13       7 -0.01519366
14       7 -1.39055543
15       7  0.46319304
16       2  1.41996644
17       3 -1.45035376
18       3 -0.49358036
19       3  1.65915980
20       6  0.70238639
21       4  1.00137808
22       5 -1.09156374
23       5  1.24057143
24       7  0.46319304
25       7  0.70238639
26       2 -0.19458867
27       2 -1.21116041
28       2  0.70238639
29       2  0.10440302
30       2 -0.43378202
31       2 -0.49358036
32       2 -1.03176540
33       2  1.24057143
34       2 -0.67297537
35       2  1.59936146
36       2  1.30036977
37       2  0.70238639
38       2  0.52299138
39       2 -0.79257205
40       2 -1.21116041
41       1  0.16420135
42       1 -1.39055543
43       1  0.52299138
44       1 -0.37398369
45       2  0.10440302
46       2  0.64258806
47       2 -0.31418535
48       2  0.64258806
49       2 -0.97196706
50       2  0.10440302
51       2 -0.79257205
52       2  1.36016811
53       2 -0.91216872
54       2 -0.91216872
55       2  1.95815148
56       2 -1.68954711
57       2  1.00137808
58       2 -0.79257205
59       2  0.22399969
60       2  0.64258806
61       2  0.82198307
62       2  1.65915980
63       2 -0.73277371
64       2  0.94157974
65       2  0.88178141
66       2  0.58278972
67       2  0.52299138
68       2 -0.85237039
69       2  0.22399969
70       2 -1.33075709
71       2  0.22399969
72       2  0.16420135
73       2 -0.67297537
74       2  0.70238639
75       2  0.70238639
76       9 -0.79257205
77       9          NA
78       9 -0.91216872
79       9  1.65915980
80       9  1.36016811
81       9 -0.67297537
82       9  0.76218473
83       9  1.77875647
84       9          NA
85       9  0.04460468
86       9 -0.97196706
87       9 -0.49358036
88       9  0.16420135
89       9 -1.09156374
90       9 -1.33075709
91       9 -1.33075709
92       9  0.28379803
93       9 -0.97196706
94       9 -0.13479033
95       9  0.52299138
96       9 -1.39055543
97       9 -0.79257205
98       9  1.06117642
99       9 -1.21116041
100      9 -0.31418535
101      9  1.41996644
102      9 -0.37398369
103      9  0.76218473
104      9  0.16420135
105      9 -0.13479033
106      9  0.22399969
107      9 -0.13479033
108      9 -1.09156374
109      3 -1.33075709
110      3 -1.33075709
111      3  0.16420135
112      3 -1.27095875
113      3 -1.68954711
114      3 -1.62974878
115      3 -0.01519366
116      3 -0.67297537
117      3  0.22399969
118      3  0.16420135
119      3 -0.01519366
120      3 -0.43378202
121      3 -1.45035376
122      3 -1.68954711
123      3  0.10440302
124      3 -0.55337870
125      3  0.46319304
126      3 -1.33075709
127      9 -0.31418535
128      9  2.13754650
129      9 -0.13479033
130      9 -0.79257205
131      9 -0.37398369
132      9 -0.31418535
133      9  0.70238639
134      9  1.24057143
135      9 -0.01519366
136      9 -0.67297537
137      9  2.07774816
138      9 -0.25438701
139      9  0.28379803
140      9  2.55613486
141      9  1.18077309
142      9  1.30036977
143      9 -0.85237039
144      9 -0.13479033
145      9 -0.49358036
146      9 -0.37398369
147      9 -0.55337870
148      9 -1.03176540
149      9  0.22399969
150      9 -1.03176540
151      9  0.10440302
152      9  0.10440302
153      9  0.94157974
154      9 -0.19458867
155      9  0.58278972
156      9 -0.49358036
157      2  0.76218473
158      2  2.25714317
159      2 -1.33075709
160      2 -1.03176540
161      2 -0.73277371
162      2 -0.25438701
163      2 -1.09156374
164      2 -0.49358036
165      2  2.49633652
166      2  1.18077309
167      2 -0.01519366
168      2 -1.27095875
169      2 -1.68954711
170      5 -0.49358036
171      5  1.18077309
172      5 -0.79257205
173      5 -0.61317704
174      5  0.88178141
175      5  1.59936146
176      5 -0.97196706
177      5  0.58278972
178      5  2.01794982
179      5 -1.62974878
180      5 -0.37398369
181      5 -0.73277371
182      5  0.58278972
183      5 -0.07499200
184      5 -0.79257205
185      5  1.36016811
186      3 -0.79257205
187      3 -1.62974878
188      3 -0.79257205
189      3  1.77875647
190      3 -0.79257205
191      3 -1.33075709
192      3  0.04460468
193      3  0.04460468
194      3          NA
195      7 -0.73277371
196      7 -0.49358036
197      7  0.04460468
198      7 -0.91216872
199      7 -0.73277371
200      7 -0.91216872
201      7 -0.07499200
202      7 -0.97196706
203      7 -1.62974878
204      7 -0.91216872
205      7 -0.97196706
206      7  0.22399969
207      7 -1.33075709
208      7 -0.13479033
209      7 -0.79257205
210      7 -1.15136208
211      7 -0.07499200
212      7 -0.13479033
213      7  0.22399969
214      5 -1.33075709
215      5  1.06117642
216      5  0.76218473
217      5 -0.25438701
218      5 -0.31418535
219      7  0.10440302
220      7 -0.67297537
221      7 -0.49358036
222      7 -0.07499200
223      7 -0.19458867
224      7 -0.07499200
225      7 -0.37398369
226      7  0.64258806
227      7  0.10440302
228      7  0.16420135
229      7  0.40339470
230      7  0.58278972
231      7 -0.37398369
232      7  0.88178141
233      7 -1.03176540
234      7  0.34359637
235      7 -1.33075709
236      7 -0.49358036
237      7  0.22399969
238      1 -1.33075709
239      1  0.10440302
240      1 -0.01519366
241      1  1.00137808
242      1  0.04460468
243      1 -1.21116041
244      1 -1.21116041
245      1  0.64258806
246      1  0.46319304
247      5 -0.97196706
248      5 -1.03176540
249      5 -1.56995044
250      5 -1.45035376
251      5  1.12097476
252      5  0.04460468
253      5 -1.21116041
254      5 -0.43378202
255      5  0.34359637
256      5  1.12097476
257      5  0.22399969
258      5  0.64258806
259      8 -1.62974878
260      8  0.64258806
261      8 -0.07499200
262      8  1.30036977
263      8 -0.67297537
264      8  0.82198307
265      5 -0.97196706
266      5  0.94157974
267      5 -0.79257205
268      5 -0.07499200
269      5 -1.39055543
270      4 -0.73277371
271      4 -0.31418535
272      4  0.52299138
273      4 -0.85237039
274      4 -0.25438701
275      4 -0.01519366
276      4  0.34359637
277      4 -1.03176540
278      4 -0.37398369
279      4  0.64258806
280      4 -1.09156374
281      4  0.10440302
282      4  1.89835315
283      4  1.18077309
284      4 -0.61317704
285      5  0.82198307
286      5 -0.13479033
287      5  0.28379803
288      5  0.04460468
289      5 -0.55337870
290      5 -1.27095875
291      5  0.52299138
292      5 -0.85237039
293      4 -1.39055543
294      4  0.94157974
295      4 -1.21116041
296      4  0.94157974
297      7  1.06117642
298      7  0.22399969
299      7  1.53956312
300      7  1.00137808
301      7 -0.01519366
302      7  1.06117642
303      7 -0.67297537
304      7  0.82198307
305      7 -0.49358036
306      5 -0.31418535
307      5  1.36016811
308      5  0.34359637
309      5  2.37673985
310      5  1.95815148
311      5  1.30036977
312      5  1.18077309
313      5 -1.27095875
314      9 -1.03176540
315      9 -0.13479033
316      9 -1.09156374
317      9  1.89835315
318      9  1.36016811
319      9  0.16420135
320      9 -1.45035376
321      9 -1.09156374
322      9  1.06117642
323      9  1.00137808
324      9 -0.61317704
325      9 -1.39055543
326      9  0.28379803
327      9  0.58278972
328      9 -0.37398369
329      9  0.22399969
330      9  0.10440302
331      9  0.04460468
332      2 -0.13479033
333      2  1.59936146
334      2 -1.15136208
335      2 -1.27095875
336      2 -1.27095875
337      2 -1.39055543
338      2  1.41996644
339      8 -1.21116041
340      8  0.34359637
341      8  1.59936146
342      8 -0.73277371
343      3 -0.85237039
344      3 -1.27095875
345      3 -0.85237039
346      3 -1.62974878
347      3 -0.61317704
348      1  0.58278972
349      1  2.31694151
350      1  1.89835315
351      1 -1.56995044
352      1 -0.73277371
353      1 -1.39055543
354      2  0.34359637
355      2  1.36016811
356      2 -0.85237039
357      2  1.83855481
358      2 -0.13479033
359      2 -0.31418535
360      2 -0.49358036
361      2 -0.73277371
362      2 -0.49358036
363      2  0.82198307
364      2  2.19734483
365      2  0.16420135
366      2  0.34359637
367      2  0.94157974
368      2 -0.25438701
369      2 -1.15136208
370      2 -0.31418535
371      2  2.55613486
372      2 -0.37398369
373      2  0.34359637
374      2 -0.55337870
375      2  0.58278972
376      2 -0.13479033
377      2 -0.13479033
378      2  0.16420135
379      2  0.52299138
380      2 -0.79257205
381      2  0.52299138
382      2 -0.01519366
383      2  0.58278972
384      2  0.10440302
385      2  0.64258806
386      2 -0.19458867
387      2 -0.91216872
388      2  0.46319304
389      3  1.53956312
390      3  1.24057143
391      3 -1.51015210
392      3 -1.15136208
393      3 -0.67297537
394      3  2.07774816
395      3  2.01794982
396      3  0.40339470
397      3 -1.15136208
398      3 -1.45035376
399      3  1.65915980
400      3  0.04460468
401      3  1.65915980
402      3  0.28379803
403      3 -1.09156374
404      3  1.59936146
405      3  0.82198307
406      3  0.64258806
407      3  1.00137808
408      3 -0.01519366
409      3 -1.68954711
410      3  0.94157974
411      3  0.70238639
412      3 -1.33075709
413      3 -0.61317704
414      3 -0.85237039
415      3 -1.15136208
416      3  0.76218473
417      3 -0.13479033
418      3 -1.56995044
419      3  1.89835315
420      3  0.10440302
421      3 -0.01519366
422      3 -1.45035376
423      3 -0.01519366
424      3 -0.91216872
425      3  1.89835315
426      3  0.94157974
427      3 -0.49358036
428      3 -0.49358036
429      3 -0.19458867
430      3 -0.49358036
431      3  0.34359637
432      3 -0.37398369
433      3 -1.27095875
434      3 -0.19458867
435      3 -0.25438701
436      3 -0.07499200
437      3  1.41996644
438      3 -0.85237039
439      3  1.95815148
440      3  0.94157974
441      3 -1.39055543
442      3  1.12097476
443      3 -0.25438701
444      3 -0.67297537
445      3 -1.56995044
446      3  0.04460468
447      3  1.53956312
448      3  0.94157974
449      3  0.28379803
450      3 -0.67297537
451      3  0.28379803
452      3 -0.31418535
453      3 -1.68954711
454      3 -1.62974878
455      3 -1.15136208
456      3 -0.25438701
457      3  1.24057143
458      3  1.24057143
459      6 -0.49358036
460      6 -1.33075709
461      3  0.46319304
462      3 -0.79257205
463      4  1.41996644
464      4 -1.03176540
465      4 -1.33075709
466      4  0.46319304
467      4 -0.37398369
468      4 -0.07499200
469      4  1.71895813
470      4 -0.91216872
471      4  1.18077309
472      4 -0.97196706
473      3  0.82198307
474      3 -0.73277371
475      3  0.52299138
476      3  1.00137808
477      3  0.22399969
478      3 -0.67297537
479      3  1.41996644
480      3 -0.19458867
481      3  1.12097476
482      3  0.34359637
483      3  2.07774816
484      3 -1.09156374
485      3 -1.09156374
486      6 -1.39055543
487      6 -1.33075709
488      6  1.53956312
489      6  0.88178141
490      6 -0.85237039
491      6  0.46319304
492      6 -1.27095875
493      6 -1.39055543
494      6  1.65915980
495      6 -0.43378202
496      6 -0.01519366
497      6  0.64258806
498      6 -0.73277371
499      5  0.82198307
500      5 -0.37398369
501      5  1.41996644
502      5  1.95815148
503      5 -1.51015210
504      5 -1.51015210
505      5  2.55613486
506      5  0.52299138
507      5 -0.61317704
508      5  2.43653819
509      5  1.47976478
510      5  0.64258806
511      5 -1.51015210
512      5 -1.27095875
513      5 -0.13479033
514      5  0.76218473
515      5  0.34359637
516      5  2.37673985
517      5 -0.19458867
518      5 -0.97196706
519      5 -0.61317704
520      5 -1.21116041
521      5 -0.73277371
522      5  0.22399969
523      5 -1.21116041
524      5  1.06117642
525      5  2.07774816
526      5  2.19734483
527      7 -1.27095875
528      7 -0.07499200
529      7  0.10440302
530      7  1.47976478
531      7  0.22399969
532      5  1.24057143
533      5  1.83855481
534      5  0.94157974
535      5  0.16420135
536      5  0.40339470
537      5  1.89835315
538      5 -0.07499200
539      5 -0.19458867
540      5 -0.37398369
541      5 -1.51015210
542      5 -1.09156374
543      5 -0.37398369
544      5 -1.09156374
545      5  0.28379803
546      6 -1.15136208
547      6 -0.43378202
548      6  0.22399969
549      6  0.16420135
550      6 -1.39055543
551      6 -0.97196706
552      6  0.52299138
553      6 -0.37398369
554      6  0.16420135
555      6 -0.49358036
556      6  0.82198307
557      6 -0.79257205
558      6  0.10440302
559      7 -0.61317704
560      7 -0.61317704
561      7 -1.15136208
562      7  0.94157974
563      7  0.34359637
564      7 -0.67297537
565      5  0.64258806
566      5 -1.39055543
567      5  1.30036977
568      5 -0.19458867
569      5  1.65915980
570      5  0.76218473
571      5  0.58278972
572      5  0.28379803
573      5 -0.01519366
574      5  0.76218473
575      5 -0.61317704
576      5 -1.15136208
577      5 -0.73277371
578      5 -0.97196706
579      5  0.22399969
580      5  0.64258806
581      5 -0.55337870
582      5  1.95815148
583      5  1.00137808
584      5 -1.39055543
585      5 -0.25438701
586      5  0.04460468
587      5  0.58278972
588      8  0.40339470
589      8  1.18077309
590      8  0.10440302
591      8  1.53956312
592      8 -1.51015210
593      8  0.64258806
594      8  1.06117642
595      8  0.88178141
596      8 -1.03176540
597      8 -0.97196706
598      8  1.00137808
599      8  1.71895813
600      9  0.04460468
601      9 -0.13479033
602      9 -0.85237039
603      9  0.10440302
604      9 -1.21116041
605      9  0.16420135
606      9  1.47976478
607      9 -1.09156374
608      9 -0.07499200
609      9 -0.97196706
610      9  1.47976478
611      9 -0.13479033
612      9  2.13754650
613      9  0.16420135
614      9 -0.01519366
615      9 -1.33075709
616      9  0.70238639
617      9  1.06117642
618      8  0.88178141
619      8  0.16420135
620      8 -1.03176540
621      8 -0.43378202
622      8 -1.09156374
623      8  1.24057143
624      8 -0.43378202
625      9 -0.01519366
626      9 -1.21116041
627      9  1.71895813
628      9  1.18077309
629      9  2.31694151
630      9 -1.51015210
631      9  1.77875647
632      9  1.41996644
633      9 -0.73277371
634      9  1.77875647
635      9 -0.07499200
636      9  0.28379803
637      2  0.58278972
638      2  0.46319304
639      2  2.19734483
640      2 -0.19458867
641      1 -1.21116041
642      1 -0.25438701
643      1  0.04460468
644      2  0.70238639
645      2 -0.01519366
646      2  0.46319304
647      4 -1.09156374
648      4 -1.27095875
649      4 -1.21116041
650      4  1.71895813
651      4 -0.79257205
652      4 -1.21116041
653      4 -1.21116041
654      4  0.04460468
655      4  1.12097476
656      4 -0.37398369
657      8  0.22399969
658      8  1.30036977
659      8  0.34359637
660      8 -0.25438701
661      8 -1.15136208
662      8 -0.07499200
663      8 -0.31418535
664      8 -0.01519366
665      8  0.16420135
666      8 -0.01519366
667      8 -0.67297537
668      4  2.55613486
669      4  2.31694151
670      4 -0.73277371
671      4  0.58278972
672      4  0.40339470
673      3 -0.07499200
674      3  0.76218473
675      3  0.88178141
676      3  0.94157974
677      4  0.16420135
678      4  2.13754650
679      4 -1.45035376
680      4  0.22399969
681      4  1.24057143
682      4 -0.61317704
683      4  1.95815148
684      4  2.25714317
685      4  0.52299138
686      4  1.89835315
687      4 -0.49358036
688      4  0.76218473
689      4 -1.33075709
690      3 -0.91216872
691      3  0.34359637
692      3  0.46319304
693      3 -0.67297537
694      3 -0.67297537
695      3  1.41996644
696      3  1.41996644
697      3  2.19734483
698      3  0.46319304
699      3 -1.27095875
700      3  0.76218473
701      3 -0.19458867
702      3  0.94157974
703      3 -1.68954711
704      3  0.46319304
705      3 -0.97196706
706      3  0.94157974
707      3  0.34359637
708      5  1.47976478
709      5  0.88178141
710      5 -0.13479033
711      5 -0.55337870
712      5  0.10440302
713      5  0.04460468
714      5 -0.85237039
715      5 -1.62974878
716      5  1.18077309
717      5 -0.37398369
718      5 -0.55337870
719      5  1.71895813
720      5 -0.67297537
721      5  0.40339470
722      5 -0.07499200
723      5 -1.27095875
724      5  1.59936146
725      6 -0.31418535
726      6  0.88178141
727      6  0.04460468
728      6 -0.13479033
729      6  0.28379803
730      6  0.10440302
731      6  0.82198307
732      6 -0.79257205
733      6 -1.68954711
734      6  0.46319304
735      5 -0.49358036
736      5  1.47976478
737      5 -0.97196706
738      5 -0.19458867
739      5 -0.37398369
740      5  0.10440302
741      7 -1.09156374
742      7  1.65915980
743      7  2.37673985
744      7 -1.27095875
745      7  0.58278972
746      7  0.82198307
747      5 -0.37398369
748      5 -0.31418535
749      5 -0.25438701
750      5 -0.85237039
751      5 -1.45035376
752      5  0.46319304
753      5  0.82198307
754      7  0.16420135
755      7 -0.01519366
756      7  0.58278972
757      7 -1.09156374
758      7 -0.67297537
759      7  0.10440302
760      7  1.12097476
761      7  0.58278972
762      7 -0.79257205
763      7  0.22399969
764      7  1.06117642
765      5 -1.21116041
766      5 -1.68954711
767      5  1.06117642
768      5  0.22399969
769      5 -0.55337870
770      5 -1.33075709
771      5 -0.43378202
772      5  1.47976478
773      5 -0.55337870
774      5  1.36016811
775      5  1.12097476
776      7 -1.51015210
777      7  2.25714317
778      7  0.52299138
779      7 -0.01519366
780      7 -0.19458867
781      7 -1.27095875
782      7 -1.27095875
783      7 -0.91216872
784      6  1.71895813
785      6 -1.15136208
786      6 -0.55337870
787      6  0.40339470
788      6  0.28379803
789      6  0.58278972
790      6 -0.37398369
791      7  1.71895813
792      7  0.16420135
793      7  1.59936146
794      7  1.53956312
795      7  1.77875647
796      7  0.40339470
797      7  1.36016811
798      7  1.65915980
799      5  1.53956312
800      5  1.95815148
801      5 -0.55337870
802      5 -0.43378202
803      5 -1.51015210
804      5 -0.67297537
805      5 -1.09156374
806      5  0.16420135
807      5  0.16420135
808      5 -1.33075709
809      5 -0.37398369
810      5 -0.37398369
811      5  1.24057143
812      8  0.10440302
813      8  0.58278972
814      8 -0.25438701
815      8  0.94157974
816      8 -0.25438701
817      8 -0.01519366
818      8  0.28379803
819      8 -0.43378202
820      8  0.34359637
821      8 -0.91216872
822      8 -0.31418535
823      8  0.34359637
824      8  0.16420135
825      9 -1.21116041
826      9  2.49633652
827      9  1.41996644
828      9  0.22399969
829      9  0.22399969
830      9 -0.73277371
831      9 -1.39055543
832      2  0.28379803
833      9  0.94157974
834      9  1.30036977
835      9  0.28379803
836      9 -0.37398369
837      9  0.82198307
838      3  0.22399969
839      9  0.28379803
840      9  2.13754650
841      3 -0.61317704
842      7 -0.01519366
843      7 -0.73277371
844      7 -0.31418535
845      7  0.10440302
846      7  0.40339470
847      1 -0.01519366
848      5  0.22399969
849      8  0.64258806
850      5  0.04460468
851      4  0.40339470
852      5  1.89835315
853      5  1.24057143
854      9          NA
855      8  0.52299138
856      1 -0.67297537
857      2  0.04460468
858      3  0.88178141
859      3 -0.07499200
860      3 -0.73277371
861      3  1.65915980
862      3 -1.33075709
863      4  2.31694151
864      6  0.52299138
865      5  1.18077309
866      5 -1.15136208
867      5 -1.09156374
868      5 -0.19458867
869      7 -0.67297537
870      5 -1.51015210
871      6  2.55613486
872      7 -0.43378202
873      8 -0.79257205
874      9  0.88178141
875      8 -0.91216872
876      8  0.94157974
877      2  1.65915980
878      2  0.76218473
879      2  0.82198307
880      3  0.82198307
881      9 -0.85237039
882      2  0.64258806
883      5 -0.01519366
884      3  0.04460468
885      3  0.82198307
886      4  0.70238639
887      6  0.16420135
888      5  0.22399969
889      7 -0.91216872
890      5 -0.97196706
891      4  0.46319304
892      6 -0.25438701
893      5 -0.85237039
894      6 -0.79257205
895      5  0.16420135
896      5  0.46319304
897      8  0.88178141
898      4 -0.79257205
899      7  0.94157974
900      2  0.34359637
901      2 -0.73277371
902      2 -0.55337870
903      2 -0.67297537
904      2 -0.67297537
905      9 -1.27095875
906      9 -1.21116041
907      3 -1.56995044
908      3 -1.15136208
909      3 -0.43378202
910      3 -1.27095875
911      3  0.58278972
912      3 -0.19458867
913      3 -1.33075709
914      9 -1.33075709
915      9  0.10440302
916      2 -1.39055543
917      2 -0.67297537
918      5 -1.09156374
919      5  0.76218473
920      5 -1.62974878
921      5 -1.51015210
922      3 -0.19458867
923      7 -1.09156374
924      5 -1.21116041
925      5 -0.55337870
926      5 -0.49358036
927      5 -0.37398369
928      5 -0.19458867
929      5  0.58278972
930      9  0.70238639
931      3  0.76218473
932      1  0.64258806
933      1 -0.85237039
934      1 -1.62974878
935      2 -0.85237039
936      2 -1.33075709
937      2  0.70238639
938      2 -1.45035376
939      3 -1.03176540
940      3 -0.91216872
941      3 -1.68954711
942      3 -0.13479033
943      3 -1.15136208
944      3 -1.33075709
945      3 -0.25438701
946      3 -0.97196706
947      4 -1.15136208
948      4 -0.13479033
949      5 -0.13479033
950      5 -0.85237039
951      5 -0.13479033
952      6 -1.39055543
953      5 -1.51015210
954      5 -0.19458867
955      5 -1.51015210
956      8 -0.49358036
957      9 -0.91216872
958      9 -1.27095875
959      8 -1.56995044
960      8 -0.31418535
961      8 -0.73277371
962      9 -0.79257205
963      3  0.28379803
964      5 -0.73277371
965      7  0.04460468
966      6 -0.13479033
967      6  0.88178141
968      6 -1.27095875
969      7 -1.09156374
970      8  0.82198307
971      8 -0.73277371
972      8 -0.85237039
973      3  1.18077309
974      7  0.04460468
975      8  0.88178141
976      2 -0.07499200
977      9 -0.37398369
978      3 -0.25438701
979      3 -0.37398369
980      3  1.24057143
981      3  0.16420135
982      3 -0.91216872
983      3  1.47976478
984      5 -0.73277371

Se calculan ahora las frecuencias de la variable age. Las frecuencias son la base de trabajo del investigador: cuántas veces sucede un evento. El resultado muestra diferentes columnas con el valor absoluto y el relativo, tomando como base todos los casos del banco de datos o solo los casos válidos.

Se utiliza el paquete expss para obtener todos los cálculos relacionados con la estadística básica paramétrica y con los cálculos de frecuencia.

# Generate a detailed frequency table for the 'age' variable
# The 'fre' function from the 'expss' package perfectly mimics SPSS frequency outputs,
# providing counts, percentages, valid percentages, and cumulative percentages
expss::fre(gssnet1$age)
Age of respondent  Count   Valid percent   Percent   Responses, %   Cumulative responses, % 
 18  10 1.0 1.0 1.0 1.0
 19  10 1.0 1.0 1.0 2.0
 20  6 0.6 0.6 0.6 2.6
 21  13 1.3 1.3 1.3 4.0
 22  9 0.9 0.9 0.9 4.9
 23  18 1.8 1.8 1.8 6.7
 24  26 2.6 2.6 2.6 9.3
 25  21 2.1 2.1 2.1 11.5
 26  20 2.0 2.0 2.0 13.5
 27  17 1.7 1.7 1.7 15.2
 28  22 2.2 2.2 2.2 17.5
 29  12 1.2 1.2 1.2 18.7
 30  19 1.9 1.9 1.9 20.6
 31  17 1.7 1.7 1.7 22.4
 32  19 1.9 1.9 1.9 24.3
 33  23 2.3 2.3 2.3 26.6
 34  24 2.4 2.4 2.4 29.1
 35  24 2.4 2.4 2.4 31.5
 36  12 1.2 1.2 1.2 32.7
 37  13 1.3 1.3 1.3 34.0
 38  22 2.2 2.2 2.2 36.3
 39  13 1.3 1.3 1.3 37.6
 40  27 2.7 2.7 2.7 40.3
 41  17 1.7 1.7 1.7 42.1
 42  17 1.7 1.7 1.7 43.8
 43  19 1.9 1.9 1.9 45.7
 44  24 2.4 2.4 2.4 48.2
 45  19 1.9 1.9 1.9 50.1
 46  26 2.6 2.6 2.6 52.7
 47  21 2.1 2.1 2.1 54.9
 48  24 2.4 2.4 2.4 57.3
 49  26 2.6 2.6 2.6 60.0
 50  26 2.6 2.6 2.6 62.6
 51  18 1.8 1.8 1.8 64.4
 52  18 1.8 1.8 1.8 66.3
 53  10 1.0 1.0 1.0 67.3
 54  17 1.7 1.7 1.7 69.0
 55  15 1.5 1.5 1.5 70.5
 56  21 2.1 2.1 2.1 72.7
 57  18 1.8 1.8 1.8 74.5
 58  13 1.3 1.3 1.3 75.8
 59  14 1.4 1.4 1.4 77.2
 60  17 1.7 1.7 1.7 79.0
 61  14 1.4 1.4 1.4 80.4
 62  19 1.9 1.9 1.9 82.3
 63  9 0.9 0.9 0.9 83.2
 64  10 1.0 1.0 1.0 84.2
 65  7 0.7 0.7 0.7 85.0
 66  11 1.1 1.1 1.1 86.1
 67  12 1.2 1.2 1.2 87.3
 68  7 0.7 0.7 0.7 88.0
 69  8 0.8 0.8 0.8 88.8
 70  11 1.1 1.1 1.1 89.9
 71  8 0.8 0.8 0.8 90.8
 72  8 0.8 0.8 0.8 91.6
 73  7 0.7 0.7 0.7 92.3
 74  11 1.1 1.1 1.1 93.4
 75  7 0.7 0.7 0.7 94.1
 76  5 0.5 0.5 0.5 94.6
 77  2 0.2 0.2 0.2 94.8
 78  8 0.8 0.8 0.8 95.6
 79  7 0.7 0.7 0.7 96.3
 80  2 0.2 0.2 0.2 96.5
 81  4 0.4 0.4 0.4 97.0
 82  4 0.4 0.4 0.4 97.4
 83  4 0.4 0.4 0.4 97.8
 84  3 0.3 0.3 0.3 98.1
 85  4 0.4 0.4 0.4 98.5
 86  3 0.3 0.3 0.3 98.8
 87  1 0.1 0.1 0.1 98.9
 88  2 0.2 0.2 0.2 99.1
 89  5 0.5 0.5 0.5 99.6
 NA  4 0.4 0.4 0.4 100.0
 #Total  984 100 100 100
 <NA>  0 0.0
# Display only the first few rows (the head) of the frequency table
head(fre(gssnet1$age))
Age of respondent  Count   Valid percent   Percent   Responses, %   Cumulative responses, % 
 18  10 1.0 1.0 1.0 1.0
 19  10 1.0 1.0 1.0 2.0
 20  6 0.6 0.6 0.6 2.6
 21  13 1.3 1.3 1.3 4.0
 22  9 0.9 0.9 0.9 4.9
 23  18 1.8 1.8 1.8 6.7
# Print a visual separator (...) in the console for better readability
cat(' ')
cat ('...')
...
cat(' ')
# Display only the last few rows (the tail) of the frequency table
tail(fre(gssnet1$age))
Age of respondent  Count   Valid percent   Percent   Responses, %   Cumulative responses, % 
 87  1 0.1 0.1 0.1 98.9
 88  2 0.2 0.2 0.2 99.1
 89  5 0.5 0.5 0.5 99.6
 NA  4 0.4 0.4 0.4 100.0
 #Total  984 100 100 100
 <NA>  0 0.0

¿Los números (frecuencias) cuentan toda la historia?

No; a menudo las tablas de frecuencias ofrecen una visión “atomizada” de los datos: fila a fila, grupo a grupo. El histograma, en cambio, ofrece una visión de conjunto que ninguna tabla puede replicar, por tres razones clave:

  1. Detección de patrones visuales: En una tabla de frecuencias, es difícil ver si los datos tienen forma de campana (normal), si están sesgados hacia la derecha, o si tienen “picos” inesperados (como una edad donde hay muchísima gente y en la siguiente casi nadie). El histograma revela la forma de la distribución de un vistazo.
  2. Identificación de valores atípicos (Outliers): A veces, un error de carga de datos (alguien que puso edad 200 en lugar de 20) pasa desapercibido en una tabla larga, pero en un histograma es un punto solitario que “salta a la vista” lejos de la masa principal de datos.
  3. Validación de supuestos: Muchos modelos estadísticos (como las regresiones que se verán más adelante) asumen que los datos siguen una distribución normal. El histograma es la primera prueba de fuego: si el gráfico no se parece a una campana, el modelo podría no ser adecuado.

Las tablas de frecuencias indican cuántos casos hay, y el histograma muestra cómo se comportan y qué forma tienen los datos.

No conviene confiar en una media o una mediana sin haber visualizado antes el histograma. La media es una simplificación extrema; el histograma muestra la realidad de cómo se distribuye el mercado.

Histogramas: La importancia de la visualización

Al trabajar con variables numéricas (como la edad), las tablas de frecuencias suelen ser demasiado extensas para interpretarlas directamente. En estos casos, el histograma es la herramienta principal, ya que agrupa los datos en intervalos para revelar la forma de su distribución.

Por defecto, R calcula automáticamente el número de intervalos (llamados bins) para ofrecer una visión equilibrada. Sin embargo, es el investigador quien debe decidir el nivel de detalle necesario.

# Standard histogram: R chooses the number of breaks (bins) automatically
hist(gssnet1$age)

Si se necesita mayor precisión, el número de intervalos puede controlarse mediante el argumento breaks.

Al fijar un número de breaks muy elevado (como en el ejemplo siguiente), R intenta mostrar cada valor individual. Esto puede ser útil para ver la granularidad de los datos, aunque conviene tener cuidado: demasiados intervalos pueden “fragmentar” en exceso la información y dificultar la detección de tendencias.

# Customizing bins: Increasing detail with 'breaks'
hist(gssnet1$age,breaks = 50)

¿Por qué superponer una curva normal?

Hasta ahora, el histograma muestra cómo se distribuyen realmente los datos de la muestra. Pero en investigación de mercados, a menudo es necesario saber si ese comportamiento es “normal” o si, por el contrario, presenta anomalías o sesgos que deben tenerse en cuenta antes de aplicar pruebas estadísticas avanzadas.

Superponer una curva normal (o Campana de Gauss) sirve para tres propósitos críticos:

  1. Validación de supuestos: muchos de los modelos que se utilizarán después (como las regresiones o los tests t de Student) asumen que los datos siguen una distribución normal. Si al dibujar la curva los datos se alejan mucho de ella, conviene ser cauto con los resultados.
  2. Detección de sesgos: si la curva normal es simétrica pero el histograma tiene una “cola” muy larga hacia un lado, los datos no están equilibrados y esa variable debe tratarse con técnicas específicas (por ejemplo, transformaciones logarítmicas).
  3. Referencia teórica: la curva normal es el “estándar de oro”. Permite ver de forma intuitiva si la muestra es homogénea o si presenta valores extremos (datos que caen fuera de la campana) que podrían estar distorsionando la media.

No es preocupante que el histograma no encaje perfectamente con la curva roja. En la vida real, los datos de mercado raramente son “perfectos”. Lo importante no es la perfección, sino identificar si la divergencia es pequeña o si la distribución está totalmente distorsionada.

# 1. Calculate the mean and standard deviation of the variable
# We need these two parameters to build a theoretical normal curve that matches our data.
# 'na.rm = TRUE' ensures that missing values do not cause the calculation to fail.
mu    <- mean(gssnet1$age, na.rm = TRUE)
sigma <- sd(gssnet1$age, na.rm = TRUE)

# 2. Create the histogram in probability density mode
# Setting 'probability = TRUE' is mandatory here; it scales the Y-axis to show density 
# instead of raw frequencies. This is required so the normal curve fits over the bars.
# The 'breaks' argument customizes the number of bins based on the variable's range.
hist(
    gssnet1$age,
    breaks = max(gssnet1$age, na.rm = TRUE) - min(gssnet1$age, na.rm = TRUE),
    probability = TRUE
)

# 3. Overlay the theoretical normal distribution curve
# We use 'dnorm' to draw the ideal bell curve based on our specific 'mu' and 'sigma'.
# 'add = TRUE' tells R to draw this curve directly on top of the existing histogram.
curve(dnorm(x, mean = mu, sd = sigma),
      add = TRUE,
      col = "red",
      lwd = 2) # Added line width (lwd = 2) to make the curve stand out better

Resumen estadístico: de la visión general a la precisión

Hasta ahora se ha explorado la forma de los datos (histogramas). A continuación se obtiene la “foto fija” numérica de las variables. En R existen varias formas de obtener estos estadísticos; se empieza con la opción nativa (summary) y después se presentan herramientas más avanzadas.

Opción estándar: summary()

Es la forma más rápida de obtener un diagnóstico de una columna o de todo el dataframe.

# Generate a basic statistical summary (min, 1st quartile, median, mean, 3rd quartile, max) 
# for a single variable ('age')
summary(gssnet1$age)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  18.00   33.00   45.00   46.47   58.00   99.00 
# Generate a summary for every variable in the entire dataframe
# This is a great way to get a quick, global overview of all your data at once
summary(gssnet1)
      age             educ          usecomp           usenet      
 Min.   :18.00   Min.   : 0.00   Min.   :0.0000   Min.   :0.0000  
 1st Qu.:33.00   1st Qu.:12.00   1st Qu.:0.0000   1st Qu.:0.0000  
 Median :45.00   Median :14.00   Median :1.0000   Median :1.0000  
 Mean   :46.47   Mean   :13.74   Mean   :0.7896   Mean   :0.7896  
 3rd Qu.:58.00   3rd Qu.:16.00   3rd Qu.:1.0000   3rd Qu.:1.0000  
 Max.   :99.00   Max.   :20.00   Max.   :9.0000   Max.   :9.0000  
                                                                  
    usemail          emailhrs         webhrs           nethrs       
 Min.   :0.0000   Min.   :-9.00   Min.   :-9.000   Min.   : -9.000  
 1st Qu.:0.0000   1st Qu.:-1.00   1st Qu.:-1.000   1st Qu.: -1.000  
 Median :1.0000   Median : 1.00   Median : 1.000   Median :  3.000  
 Mean   :0.7419   Mean   : 3.31   Mean   : 2.937   Mean   :  6.795  
 3rd Qu.:1.0000   3rd Qu.: 4.00   3rd Qu.: 5.000   3rd Qu.: 10.000  
 Max.   :9.0000   Max.   :50.00   Max.   :70.000   Max.   :118.000  
                                                                    
     netcat            region           Zage         
 Min.   :-9.0000   Min.   :1.000   Min.   :-1.68955  
 1st Qu.:-1.0000   1st Qu.:3.000   1st Qu.:-0.79257  
 Median : 1.0000   Median :5.000   Median :-0.07499  
 Mean   : 0.2337   Mean   :5.117   Mean   : 0.00000  
 3rd Qu.: 3.0000   3rd Qu.:7.000   3rd Qu.: 0.70239  
 Max.   : 4.0000   Max.   :9.000   Max.   : 2.55613  
                                   NAs    :4         

Opción avanzada: describe()

Si se necesita una precisión técnica mayor (para investigación de mercados avanzada), el paquete psych ofrece una tabla completa con medidas robustas.

# Advanced descriptive statistics
psych::describe(gssnet1$age)
   vars   n  mean    sd median trimmed   mad min max range skew kurtosis   se
X1    1 984 46.47 17.02     45   45.49 17.79  18  99    81 0.45    -0.42 0.54

Para tomar decisiones no basta con calcular: hay que saber qué medir. Estos indicadores se clasifican en dos familias:

Medidas de tendencia central, ¿dónde está el “centro”?

Ayudan a entender el valor típico de la muestra.

  • Media: El promedio aritmético. Es el “centro de gravedad”, aunque conviene tener cuidado: si existen pocos casos con valores muy altos (como ingresos millonarios), la media se verá distorsionada.
  • Mediana: El valor que deja al 50% de la muestra por debajo y al 50% por encima. Es robusta: no se deja engañar por valores extremos.
  • MAD (Median Absolute Deviation): La compañera de la mediana. Mide la dispersión real ignorando el ruido de los casos extremos. Es una herramienta clave para detectar la variabilidad real.
  • Error estándar de la media: Indica la precisión de la media muestral respecto a la población real.

Medidas de dispersión, ¿cómo son los datos de variados?

Indican si los datos están muy concentrados en torno a la media o si hay mucha variabilidad.

  • Desviación Estándar: La medida más clásica. En una distribución normal, permite predecir dónde se encuentra la mayoría de los datos.
  • Varianza: La desviación al cuadrado. Técnicamente crucial, aunque menos intuitiva para interpretar en marketing.
  • Rango e Intervalos (Min, Max, Quartiles): Indican dónde empiezan y terminan los datos. El Rango Intercuartílico (IQR) es especialmente útil porque ofrece el rango del “50% central” de los datos, eliminando los extremos.

Identificando valores atípicos: diagrama de caja (Box-Whisker)

El diagrama de caja es una representación visual que resume una variable a través de sus cuartiles. Mientras que el histograma muestra la “forma” de toda la distribución, el boxplot es más “quirúrgico”: está diseñado específicamente para detectar valores atípicos (outliers).

Componentes clave del gráfico:

  • La Caja: Representa el 50% central de los datos. El borde inferior es el primer cuartil (Q1) y el superior es el tercero (Q3). La línea central es la mediana.
  • Los Bigotes (Whiskers): Marcan el límite hasta donde consideramos que los datos son “normales”.
  • Los Puntos (Outliers): Cualquier dato que caiga fuera de los límites calculados (Q3 + 1.5RIC o Q1 - 1.5RIC) aparece como un punto aislado.

R permite generar esta radiografía de los datos con una única función:

# Create a standard box-and-whisker plot for the 'age' variable
# This visualization is crucial for understanding the data spread and quickly 
# identifying outliers
boxplot(gssnet1$age)

Un punto fuera de los bigotes no debe eliminarse sin más. ¿Es un error de registro (por ejemplo, una edad imposible)? ¿O es un cliente real con un comportamiento extremo? Los outliers a menudo contienen las historias más interesantes de los datos de mercado.

La curva / distribución normal, el concepto de normalidad y su relación con las muestras

Se introduce ahora un concepto muy importante: la distribución normal y su relevancia en la investigación de mercados y en el trabajo con muestras.

La distribución normal, o Campana de Gauss, no es solo un gráfico teórico: es la herramienta que permite a los investigadores de mercados realizar inferencias, pasando de “lo que dice la muestra” a “lo que probablemente ocurre en todo el mercado”.

¿Por qué es tan relevante en la investigación?

  1. La ley de los errores: En una muestra aleatoria, la mayoría de las observaciones se agrupan en torno al centro (el valor real o la media). Los errores de medición se distribuyen de forma simétrica: es tan probable que una estimación sea un poco mayor como un poco menor que el valor real.
  2. El poder de las desviaciones (\(\sigma\)): La imagen muestra cómo se distribuye la probabilidad en función de la desviación estándar (\(\sigma\)):
    • Dentro de \(\pm 1\sigma\): Se encuentra aproximadamente el 68% de los datos. Es la “zona central” o lo más común.
    • Dentro de \(\pm 2\sigma\): Se encuentra el 95% de los casos. En investigación de mercados, este es el estándar de confianza habitual.
    • Más allá de \(\pm 3\sigma\): Solo queda el 0.2% de los datos (la suma de las colas extremas). Un dato que cae aquí es una anomalía estadística muy improbable.

Esta curva permite cuantificar la incertidumbre. Al reportar una media de satisfacción o intención de compra, gracias a la distribución normal puede añadirse un margen de error y afirmar con confianza: “existe un 95% de seguridad de que el valor real del mercado se encuentra en este intervalo”.

Sin este modelo, se estarían dando números aislados sin saber qué tan fiables son. La curva normal es lo que transforma una simple medición en un dato científicamente robusto y generalizable.

Una vez visualizado el histograma, es necesario cuantificar qué tan lejos está la distribución de la forma ideal (la curva normal). Para ello se utilizan dos indicadores:

Asimetría (Skewness)

La asimetría indica si la distribución es equilibrada o si está “estirada” hacia uno de los lados.

  • Simétrica (valor 0): Media, mediana y moda coinciden. Es la forma perfecta de la curva normal.
  • Asimetría positiva: La cola se extiende hacia la derecha (valores altos). Es muy común en datos de ingresos o tiempo de navegación: la mayoría está en valores bajos, pero hay unos pocos casos extremos que elevan la media.
  • Asimetría negativa: La cola se extiende hacia la izquierda (valores bajos). Indica que la mayoría de los casos se concentran en la parte alta.

Curtosis (Kurtosis)

La curtosis no mide hacia dónde se inclina la curva, sino qué tan “puntiaguda” es y, sobre todo, cuánta importancia tienen los valores extremos (outliers).

  • Mesocúrtica (valor 0): Tiene la forma de la distribución normal estándar.
  • Leptocúrtica (Curtosis positiva): La curva es más estrecha y puntiaguda. Indica una mayor concentración de datos cerca del centro, pero también una mayor presencia de valores extremos en las colas.
  • Platicúrtica (Curtosis negativa): La curva es más “achatada”. Indica una mayor dispersión de los datos; no hay una concentración tan clara en el centro.

¿Por qué es importante en investigación de mercados?

Muchos de los tests estadísticos utilizados en el máster (como las pruebas de medias) asumen que los datos son simétricos y con una curtosis moderada. Si al calcular la asimetría o la curtosis se obtienen valores muy elevados, esto indica que: 1. la muestra puede tener anomalías (outliers) que conviene investigar; 2. quizás sea necesario aplicar una transformación matemática a la variable o utilizar tests no paramétricos más robustos.

En R, el diagnóstico es inmediato: al ejecutar la función describe() del paquete psych o get_summary_stats(), aparecen estos valores. Un valor de asimetría o curtosis que supere el doble de su error estándar es una señal de alerta clara: la variable no se comporta de forma “normal”.

# Generate detailed descriptive statistics for the 'age' variable
# The 'describe' function from the 'psych' package is an excellent alternative to SPSS,
# providing a comprehensive summary that includes mean, standard deviation, median, 
# as well as skewness and kurtosis (essential for assessing normality)
psych::describe(gssnet1$age)
   vars   n  mean    sd median trimmed   mad min max range skew kurtosis   se
X1    1 984 46.47 17.02     45   45.49 17.79  18  99    81 0.45    -0.42 0.54

  • La asimetría indica hacia dónde se desplaza el sesgo, mientras que la curtosis indica la peligrosidad de los extremos.
  • Resulta útil aplicar la regla empírica: no se busca el cero perfecto, sino la ausencia de sesgos significativos que invaliden el análisis.

Preocupaciones del analista de datos

Valores perdidos

En investigación, es casi imposible trabajar con bases de datos perfectas. Los valores perdidos (Missing Values) son una realidad cotidiana. Sin embargo, no todos los vacíos tienen la misma naturaleza, y la forma de tratarlos determina la validez de las conclusiones.

¿Por qué faltan los datos?

Antes de actuar, conviene investigar. Lo más importante no es cuántos datos faltan, sino el patrón de esa ausencia:

  • Aleatoriedad: ¿faltan los datos al azar? En ese caso, el impacto suele ser mínimo.
  • Patrones sistemáticos: ¿faltan datos en una variable específica según el perfil del encuestado? Aquí reside el peligro: si un segmento ignora sistemáticamente una pregunta, los resultados presentarán un sesgo importante que debe corregirse.

Depuración y cuantificación

El primer paso es siempre limpiar: eliminar errores de registro y detectar valores fuera de rango. A continuación se cuantifica el impacto. Herramientas como las tablas cruzadas (crosstabs) permiten ver si existe una correlación entre tener datos perdidos en una variable y el comportamiento en otras variables.

Métodos de corrección

Si el volumen de pérdida es significativo, es necesario aplicar un método de imputación para “rellenar” los huecos:

  • Eliminación: La forma más drástica. Consiste en eliminar casos o variables incompletas (con la consecuencia de reducir la muestra).
  • Imputación simple: Sustituir por la media o valores aleatorios. Útil, pero puede reducir la variabilidad real de los datos.
  • Imputación avanzada: Métodos basados en regresión o imputación múltiple, que estiman el valor perdido a partir de la información disponible del mismo encuestado.

La imputación no es magia: es una estimación. Conviene comparar siempre los resultados antes y después de la imputación. Si la diferencia es drástica, significa que los datos perdidos ocultaban un comportamiento del mercado que merece ser analizado por sí solo.

Valores atípicos (outliers)

Un outlier es un caso con un valor tan extremo que se aleja del comportamiento global de la muestra. Su detección es vital porque, aunque sean pocos, pueden distorsionar drásticamente el cálculo de medias y la precisión de los modelos.

Antes de tomar cualquier decisión, conviene clasificar el outlier:

  • Errores: Datos mal registrados o inconsistencias durante la carga.
  • Sesgos intencionados: Respuestas deliberadamente falsas o poco serias en encuestas.
  • Errores de muestreo: Individuos que no pertenecen realmente al perfil de mercado que estamos estudiando.
  • Outliers legítimos: Casos reales, aunque extremos. Son los “clientes de alto valor” o “usuarios intensivos” que, lejos de ser eliminados, suelen ser los más interesantes para el negocio.

Estrategia de detección

  • Univariante: Se detectan valores extremos en una sola variable (por ejemplo, alguien que gasta mucho más que el resto).
  • Bivariante y multivariante: Se detectan anomalías en la combinación de variables (por ejemplo, alguien con una edad muy baja pero unos ingresos muy altos).

El outlier plantea una pregunta, no una solución automática. Eliminar un dato es una medida irreversible que requiere una justificación clara: ¿este dato extremo es una mentira del sistema o una verdad incómoda del mercado?

Procedimiento para la estandarización

Para decidir qué es un valor extremo, los datos se estandarizan (transformándolos a una distribución con media 0 y desviación 1). Como regla general, un caso que se aleja más de 3 desviaciones típicas del centro es estadísticamente sospechoso.

¿Cómo podría, por ejemplo, estandarizarse la variable age de gssnet1 (aunque no es necesario, pero a título ilustrativo)?

# --- Step 1: Get the mean and standard deviation of 'age' ---
mu = mean(gssnet1$age, na.rm = TRUE)
sigma = sd(gssnet1$age, na.rm = TRUE)

# --- Step 2: Apply the Z-score formula: Z = (x - mean) / sd ---
# Each value tells us how many standard deviations a respondent's age
# is above (positive) or below (negative) the sample mean
gssnet1$valor_z <- (gssnet1$age - mu) / sigma

# --- Step 3: Inspect the new standardized variable ---
glimpse(gssnet1$valor_z)
Class 'labelled' num [1:984] -0.967 -0.439 1.5 -0.321 -1.32 ...
   .. .. LABEL: Age of respondent 
   .. .. VALUE LABELS [1:2]: 98=DK, 99=NA 
# Note: fre() works best with categorical/discrete variables.
# On a continuous variable like 'valor_z' it will list one row per unique
# value, so the table will be long — useful only to spot-check extreme values
fre(gssnet1$valor_z)
Age of respondent  Count   Valid percent   Percent   Responses, %   Cumulative responses, % 
 -1.67232898673902  10 1.0 1.0 1.0 1.0
 -1.61358584166526  10 1.0 1.0 1.0 2.0
 -1.5548426965915  6 0.6 0.6 0.6 2.6
 -1.49609955151774  13 1.3 1.3 1.3 4.0
 -1.43735640644398  9 0.9 0.9 0.9 4.9
 -1.37861326137022  18 1.8 1.8 1.8 6.7
 -1.31987011629647  26 2.6 2.6 2.6 9.3
 -1.26112697122271  21 2.1 2.1 2.1 11.5
 -1.20238382614895  20 2.0 2.0 2.0 13.5
 -1.14364068107519  17 1.7 1.7 1.7 15.2
 -1.08489753600143  22 2.2 2.2 2.2 17.5
 -1.02615439092767  12 1.2 1.2 1.2 18.7
 -0.967411245853916  19 1.9 1.9 1.9 20.6
 -0.908668100780158  17 1.7 1.7 1.7 22.4
 -0.8499249557064  19 1.9 1.9 1.9 24.3
 -0.791181810632641  23 2.3 2.3 2.3 26.6
 -0.732438665558883  24 2.4 2.4 2.4 29.1
 -0.673695520485125  24 2.4 2.4 2.4 31.5
 -0.614952375411366  12 1.2 1.2 1.2 32.7
 -0.556209230337608  13 1.3 1.3 1.3 34.0
 -0.49746608526385  22 2.2 2.2 2.2 36.3
 -0.438722940190091  13 1.3 1.3 1.3 37.6
 -0.379979795116333  27 2.7 2.7 2.7 40.3
 -0.321236650042575  17 1.7 1.7 1.7 42.1
 -0.262493504968816  17 1.7 1.7 1.7 43.8
 -0.203750359895058  19 1.9 1.9 1.9 45.7
 -0.1450072148213  24 2.4 2.4 2.4 48.2
 -0.0862640697475415  19 1.9 1.9 1.9 50.1
 -0.0275209246737831  26 2.6 2.6 2.6 52.7
 0.0312222203999752  21 2.1 2.1 2.1 54.9
 0.0899653654737335  24 2.4 2.4 2.4 57.3
 0.148708510547492  26 2.6 2.6 2.6 60.0
 0.20745165562125  26 2.6 2.6 2.6 62.6
 0.266194800695009  18 1.8 1.8 1.8 64.4
 0.324937945768767  18 1.8 1.8 1.8 66.3
 0.383681090842525  10 1.0 1.0 1.0 67.3
 0.442424235916284  17 1.7 1.7 1.7 69.0
 0.501167380990042  15 1.5 1.5 1.5 70.5
 0.5599105260638  21 2.1 2.1 2.1 72.7
 0.618653671137559  18 1.8 1.8 1.8 74.5
 0.677396816211317  13 1.3 1.3 1.3 75.8
 0.736139961285075  14 1.4 1.4 1.4 77.2
 0.794883106358834  17 1.7 1.7 1.7 79.0
 0.853626251432592  14 1.4 1.4 1.4 80.4
 0.91236939650635  19 1.9 1.9 1.9 82.3
 0.971112541580109  9 0.9 0.9 0.9 83.2
 1.02985568665387  10 1.0 1.0 1.0 84.2
 1.08859883172763  7 0.7 0.7 0.7 85.0
 1.14734197680138  11 1.1 1.1 1.1 86.1
 1.20608512187514  12 1.2 1.2 1.2 87.3
 1.2648282669489  7 0.7 0.7 0.7 88.0
 1.32357141202266  8 0.8 0.8 0.8 88.8
 1.38231455709642  11 1.1 1.1 1.1 89.9
 1.44105770217018  8 0.8 0.8 0.8 90.8
 1.49980084724393  8 0.8 0.8 0.8 91.6
 1.55854399231769  7 0.7 0.7 0.7 92.3
 1.61728713739145  11 1.1 1.1 1.1 93.4
 1.67603028246521  7 0.7 0.7 0.7 94.1
 1.73477342753897  5 0.5 0.5 0.5 94.6
 1.79351657261273  2 0.2 0.2 0.2 94.8
 1.85225971768648  8 0.8 0.8 0.8 95.6
 1.91100286276024  7 0.7 0.7 0.7 96.3
 1.969746007834  2 0.2 0.2 0.2 96.5
 2.02848915290776  4 0.4 0.4 0.4 97.0
 2.08723229798152  4 0.4 0.4 0.4 97.4
 2.14597544305528  4 0.4 0.4 0.4 97.8
 2.20471858812903  3 0.3 0.3 0.3 98.1
 2.26346173320279  4 0.4 0.4 0.4 98.5
 2.32220487827655  3 0.3 0.3 0.3 98.8
 2.38094802335031  1 0.1 0.1 0.1 98.9
 2.43969116842407  2 0.2 0.2 0.2 99.1
 2.49843431349783  5 0.5 0.5 0.5 99.6
 3.08586576423541  4 0.4 0.4 0.4 100.0
 #Total  984 100 100 100
 <NA>  0 0.0

Y se caracterizan ahora sus valores…

psych::describe(gssnet1$valor_z)
   vars   n mean sd median trimmed  mad   min  max range skew kurtosis   se
X1    1 984    0  1  -0.09   -0.06 1.05 -1.67 3.09  4.76 0.45    -0.42 0.03

Herramientas de exploración, comprobación de la normalidad y la homoscedasticidad

La lógica de la inferencia estadística

Hasta ahora se ha resumido lo que ocurre en la muestra. La inferencia estadística es el paso definitivo que permite saltar de los datos observados a conclusiones sobre la realidad del mercado. Aquí no se busca solo medir, sino verificar si lo observado es fruto de un patrón real o de simple azar.

Todo contraste sigue un proceso riguroso de cuatro etapas:

  1. Definición de hipótesis: Se formula una hipótesis experimental (lo que se pretende demostrar) frente a la hipótesis nula (\(H_0\)), que asume que no hay efecto alguno (todo es azar).
  2. Elección del modelo: Se selecciona la técnica adecuada en función de la naturaleza de los datos. Para ello es necesario validar los supuestos:
    • Nivel de medida: ¿son datos métricos o categóricos?
    • Normalidad: ¿siguen una distribución de Gauss?
    • Homocedasticidad: ¿tienen los grupos la misma variabilidad?
  3. Cálculo del test: Se evalúa qué parte de la varianza es explicada por el modelo y qué parte es ruido. Aquí se obtiene el valor crítico (p-value).
  4. Toma de decisiones: El resultado se compara con un nivel de significación (usualmente 0.05).
    • Si \(p < 0.05\): se rechaza \(H_0\) y se acepta el efecto como estadísticamente significativo.
    • Si \(p > 0.05\): no puede rechazarse \(H_0\), lo que implica que no hay evidencia suficiente para afirmar que el efecto existe.

La clave del analista es elegir la herramienta correcta. Si los datos cumplen los supuestos (normalidad, homocedasticidad), se utilizan pruebas paramétricas (más potentes). Si no se cumplen, se recurre a pruebas no paramétricas, más flexibles y “robustas” ante datos que no siguen una distribución perfecta.

Es vital insistir en que el 0.05 no es un “número mágico”, sino un criterio de convención científica. En marketing, un 0.05 ofrece la tranquilidad de que, si el estudio se repitiera 100 veces, solo en 5 de ellas se habría afirmado erróneamente que existe un efecto real.

En R se aprenderá a extraer el p-value de forma específica, lo que obliga a ser conscientes de qué test se está realizando en cada momento. Esto evita el error común de aplicar pruebas automáticas sin entender la hipótesis que hay detrás.

Contrastes de normalidad

Antes de utilizar técnicas estadísticas avanzadas, es necesario validar si la variable sigue una distribución normal. Este es el supuesto base de muchas pruebas paramétricas (como el test t o el ANOVA). Para verificarlo no basta con la intuición visual; son necesarios contrastes estadísticos formales.

Las herramientas de diagnóstico

  • Test de Shapiro-Wilk: Es el estándar de oro en muestras pequeñas. Evalúa la hipótesis nula (\(H_0\)): “La distribución de la muestra no difiere significativamente de una distribución normal”.
  • Test de Kolmogorov-Smirnov (con corrección de Lilliefors): Es una alternativa habitual, especialmente útil en muestras más grandes para comparar la forma de la distribución frente a una normal teórica.

Shapiro-Wilk: El más potente (Muestras pequeñas/medianas)

Es considerado universalmente el test más potente para detectar desviaciones de la normalidad.

  • Cuándo usarlo: Es la elección ideal para muestras de menos de 50 (e incluso hasta 100 o 200) casos.
  • Por qué: Tiene una capacidad superior para detectar que los datos no son normales cuando la muestra es pequeña.
  • Limitación: Con muestras muy grandes (por ejemplo, encuestas de 1.000+ personas), pierde su ventaja y se vuelve extremadamente sensible a cualquier mínima desviación.

Kolmogorov-Smirnov (con corrección de Lilliefors): El estándar para muestras grandes

El test K-S original es bastante pobre. Sin embargo, la corrección de Lilliefors ajusta el test específicamente para probar la normalidad cuando la media y la desviación típica se estiman a partir de la propia muestra (lo habitual en la práctica).

  • Cuándo usarlo: Es el test preferido cuando el tamaño muestral es grande (digamos, > 200 o 300 casos).
  • Por qué: Es más robusto y fiable que Shapiro-Wilk cuando el número de observaciones es elevado, ya que no se “desboca” tan fácilmente con desviaciones irrelevantes.

La trampa de la muestra grande

Conviene tener cuidado: al aumentar el tamaño de la muestra (\(n\)), estos tests se vuelven extremadamente sensibles. En bases de datos muy grandes, incluso una desviación insignificante de la normalidad provoca que el test rechace la hipótesis nula (\(p < 0.05\)). No debe confundirse “significación estadística” con “relevancia práctica”.

Una decisión nunca debe basarse únicamente en un número. El protocolo recomendado es siempre:

  1. Ejecutar el test: obtener el p-value de Shapiro-Wilk o Kolmogorov-Smirnov.
  2. Visualizar el histograma: contrastar el resultado estadístico con el gráfico. Si el test indica que no hay normalidad pero el histograma muestra una campana razonable, debe prevalecer el criterio experto del investigador.
  3. Decidir: si el sesgo es real y grave, se opta por pruebas no paramétricas o por transformaciones de los datos antes de forzar el uso de técnicas paramétricas.

En investigación de mercados, las variables casi nunca son “perfectamente normales”. El objetivo no es la perfección, sino la suficiencia. Ante la duda, el histograma siempre revela la verdad que el p-value oculta. Es una lección que hace mejores analistas.

Se testa ahora la normalidad de la distribución con la prueba de Kolmogorov-Smirnov, corrigiendo el dato con la prueba de Lilliefors (adecuada para este propósito), y se calcula también Shapiro-Wilk, la prueba más potente para medir la normalidad.

Ejecución e interpretación de Kolmogorov-Smirnov (Lilliefors) y Shapiro-Wilk

Una vez ejecutados los tests de normalidad, llega el momento de la verdad: ¿pueden aplicarse técnicas paramétricas, o es necesario buscar alternativas? En ambos tests, la hipótesis nula (\(H_0\)) es que “los datos siguen una distribución normal”.

  • Si el p-value > 0.05: no hay evidencia suficiente para rechazar la hipótesis nula. Por tanto, se asume normalidad.
  • Si el p-value < 0.05: se rechaza la normalidad. La distribución se aleja significativamente de la campana de Gauss.

Al aplicar los tests a la variable dia1 (higiene corporal, día 1 del FIB):

# --- Load the FIB hygiene dataset ---
fib2 <- expss::read_spss('data/fib2.sav')

# --- Visual check: histogram with one bar per observed value ---
# length(table(fib2$dia1)) counts how many distinct values 'dia1' takes,
# so 'breaks' shows the data at its finest granularity
hist(fib2$dia1, breaks = length(table(fib2$dia1)), main = "Distribución")

# --- Lilliefors test (Kolmogorov-Smirnov with Lilliefors correction) ---
# H0: the variable follows a normal distribution
lillie.test(fib2$dia1)

    Lilliefors (Kolmogorov-Smirnov) normality test

data:  fib2$dia1
D = 0.053023, p-value = 1.288e-05
# --- Shapiro-Wilk test ---
# H0: the variable follows a normal distribution (most powerful test for small/medium n)
shapiro.test(fib2$dia1)

    Shapiro-Wilk normality test

data:  fib2$dia1
W = 0.97795, p-value = 1.043e-09

Las conclusiones que se extraen de estos resultados representan uno de los aprendizajes más importantes para un investigador o analista de datos. Es un caso clásico de “significación estadística frente a relevancia práctica”.

La conclusión estadística estricta

Ambos tests plantean como hipótesis nula (\(H_0\)) que los datos provienen de una distribución normal.

  • En el test de Lilliefors, el p-value es \(0.00001288\) (\(< 0.05\)).
  • En el test de Shapiro-Wilk, el p-value es \(0.000000001043\) (\(< 0.05\)).

Conclusión técnica: se rechaza la hipótesis nula en ambos casos. Estadísticamente hablando, la variable dia1 no sigue una distribución perfectamente normal.

Aquí es donde entra la experiencia analítica. La muestra es de 810 casos, un tamaño muestral bastante grande. Como se ha comentado, cuando la muestra es grande, los tests de bondad de ajuste (especialmente Shapiro-Wilk) se vuelven hipersensibles. Tienen tanto “poder estadístico” que detectan cualquier mínima imperfección o asimetría microscópica en la campana de Gauss, devolviendo un p-value significativo que indica “no es normal”.

Sin embargo, hay un detalle crucial en el test de Shapiro-Wilk: el valor de su estadístico es \(W = 0.97795\). El estadístico \(W\) oscila entre 0 y 1, donde 1 significa una normalidad absoluta. Un valor de 0.978 indica que, en la práctica, la curva es extremadamente parecida a una normal. El test la rechaza por purismo matemático, pero visualmente se trata de una campana muy decente.

¿Qué hacer ahora?

Con estos resultados sobre \(n=810\), el investigador de mercados puede tomar las siguientes decisiones:

  1. Ignorar el alarmismo del p-value: no debe descartarse automáticamente el uso de técnicas paramétricas (como el Test t o el ANOVA).
  2. Revisión visual obligatoria: el siguiente paso inmediato es dibujar el histograma y el gráfico Q-Q (Q-Q plot). Si el histograma tiene forma de campana y no hay valores atípicos (outliers) extremos y deformantes, puede confiarse en la forma de los datos.
  3. El escudo del Teorema Central del Límite: con 810 casos, la muestra es tan grande que el Teorema Central del Límite protege los análisis paramétricos. Las pruebas de comparación de medias funcionarán perfectamente y serán robustas aunque la distribución original presente esa leve desviación detectada por Lilliefors y Shapiro.

Guía rápida para los informes

  1. ¿Muestra pequeña (\(n < 50\))? Se recomienda Shapiro-Wilk, el que mejor “afina” el ojo.
  2. ¿Muestra grande (\(n > 200\))? Se recomienda Lilliefors (K-S), que evita falsas alarmas que Shapiro detectaría como “no normal” por puro azar estadístico.
  3. ¿Duda eterna? Como siempre, el histograma.

Otros diagnósticos visuales

Para complementar el histograma se utilizan los gráficos Q-Q (Quantile-Quantile Plot). Su lógica es sencilla: representan los cuantiles de los datos frente a los cuantiles de una distribución normal teórica.

  • Si los puntos siguen la línea diagonal: Los datos se ajustan a la normalidad.
  • Si los puntos se curvan en los extremos: Indica colas más pesadas (más outliers de los esperados) o una asimetría clara.

Gráfico Q-Q estándar

Es la primera parada para validar la normalidad.

# qqnorm() plots the sample quantiles against the theoretical normal quantiles
qqnorm(fib2$dia1)

# qqline() adds the reference diagonal: points should lie close to this line
# if the variable follows a normal distribution
qqline(fib2$dia1)

Gráfico Q-Q “detrended”

A veces, la línea diagonal dificulta ver pequeños desvíos en el centro de la distribución. El Q-Q Detrended elimina la tendencia lineal y “aplana” el gráfico sobre el eje horizontal. Si los puntos se alejan del cero (la línea horizontal), es una señal clara de que la normalidad no se cumple.

# 1. Standard Q-Q Plot
ggqqplot(fib2$dia1, 
         main = "Normal Q-Q Plot",
         color = "steelblue")

# 2. To get a 'Detrended' effect, we subtract the theoretical normal quantiles
# This shows the residuals from the line, making non-normality 'pop'
residuos <- qqnorm(fib2$dia1, plot.it = FALSE)
data_detrended <- data.frame(x = residuos$x, y = residuos$y - residuos$x)

plot(data_detrended, 
     main = "Detrended Q-Q Plot", 
     pch = 19, col = "darkred", 
     xlab = "Theoretical Quantiles", ylab = "Deviation from Normality")

# Reference line at zero: the closer the points stay to this line, the better
# the fit to normality. Curved patterns ('S' shape) reveal departures from it
abline(h = 0, col = "black", lwd = 2, lty = 2)

En el Q-Q plot estándar, lo esperable es una línea recta. En el Q-Q Detrended, los puntos deben estar lo más cerca posible de la línea horizontal del cero. Si los puntos forman una “S” o una curva pronunciada, la variable dia1 presenta problemas de normalidad que podrían invalidar los tests paramétricos clásicos.

El procedimiento de linealización

Cuando los datos no siguen una distribución normal, no siempre es necesario renunciar a las técnicas paramétricas. A menudo, la falta de normalidad es solo un efecto visual provocado por una escala de medida desproporcionada. La linealización es el proceso de aplicar transformaciones matemáticas a las variables para “suavizar” su distribución y aproximarla a la normalidad.

Transformaciones comunes en R

En R, estas transformaciones se aplican directamente sobre la columna del dataframe, creando nuevas variables que conservan la información original pero con una escala más apta para el análisis estadístico:

  • Raíz cuadrada (sqrt()): Reduce la variabilidad en datos con una asimetría positiva moderada.
  • Logaritmo base 10 (log10()): Muy útil para variables con rangos muy amplios (ej. ingresos o población).
  • Logaritmo neperiano (log()): El estándar en modelización económica y de marketing para estabilizar la varianza.
# --- Step 1: Create transformed copies of 'dia1' in the dataframe ---
fib2$dia1_sqrt   <- sqrt(fib2$dia1)
fib2$dia1_log    <- log(fib2$dia1 + 1)   # +1 avoids errors when there are zero values
fib2$dia1_log10  <- log10(fib2$dia1 + 1) # +1 avoids errors when there are zero values

# --- Step 2: Re-run Shapiro-Wilk to check if normality has improved ---
shapiro.test(fib2$dia1_sqrt)

    Shapiro-Wilk normality test

data:  fib2$dia1_sqrt
W = 0.9165, p-value < 2.2e-16
shapiro.test(fib2$dia1_log)

    Shapiro-Wilk normality test

data:  fib2$dia1_log
W = 0.89497, p-value < 2.2e-16
shapiro.test(fib2$dia1_log10)

    Shapiro-Wilk normality test

data:  fib2$dia1_log10
W = 0.89497, p-value < 2.2e-16
# --- Step 3: Compare the three transformed distributions visually ---
# par(mfrow = c(1, 3)) arranges the next 3 plots side by side in one row
par(mfrow = c(1, 3)) 

hist(fib2$dia1_sqrt, main = "Distribución tras sqrt", col = "darkgreen")
hist(fib2$dia1_log, main = "Distribución tras log", col = "darkgreen")
hist(fib2$dia1_log10, main = "Distribución tras log10", col = "darkgreen")

# Reset the plotting layout back to a single plot per figure
par(mfrow = c(1, 1))

Nota importante: al realizar estas transformaciones, cambia la interpretación de la variable. La media de una variable logarítmica no se lee en las mismas unidades que la original. Por eso, el procedimiento correcto siempre es: transformar, realizar el análisis paramétrico y, después —si es necesario—, interpretar los resultados en el contexto de la escala original.

Homogeneidad de varianzas (homoscedasticidad)

La comprobación de la homogeneidad de varianzas, también conocida como homocedasticidad, es un pilar innegociable antes de aplicar técnicas de inferencia estadística paramétrica como el test t de Student o el ANOVA. Estas pruebas matemáticas asumen desde su origen que los grupos que se comparan tienen una variabilidad similar; es decir, que sus datos se dispersan de forma parecida en torno a su propia media. Si se ignora este paso y resulta que las varianzas son radicalmente distintas, los cálculos del error estándar se distorsionan.

Esto resulta especialmente peligroso en investigación de mercados, ya que aumenta drásticamente la probabilidad de cometer un falso positivo (afirmar que hay diferencias estratégicas entre dos segmentos de clientes cuando en realidad no las hay). Validar la homocedasticidad garantiza que los grupos se comparan bajo unas reglas del juego justas y equilibradas. Sin este diagnóstico previo, cualquier decisión de negocio basada en diferencias de medias carecerá de validez y rigor científico.

Test de Levene

# --- Levene's test for homogeneity of variances ---
# H0: Variances are equal. H1: Variances are different.
leveneTest(dia1 ~ factor(sex), data = fib2)
Levene's Test for Homogeneity of Variance (center = median)
       Df F value    Pr(>F)    
group   1  388.54 < 2.2e-16 ***
      808                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# --- Visual proof: compare the spread of 'dia1' between sex groups ---
ggplot(fib2, aes(x = sex, y = dia1, fill = factor(sex))) +
    geom_boxplot() 

Este análisis se suele complementar con gráficos de caja e histogramas, así como con el cálculo de los ratios de varianza, una medida que SPSS no proporciona.

Ratio de varianzas

Para calcular el ratio de varianzas (también conocido como F-test ratio) de forma manual en R, basta con dividir la varianza del grupo que tiene mayor dispersión entre la del grupo con menor dispersión. Esto da un índice de cuántas veces es más grande la variabilidad de un grupo respecto al otro.

# 1. Calculate variances for each group
var_male   <- var(fib2$dia1[fib2$sex == 1], na.rm = TRUE)
var_female <- var(fib2$dia1[fib2$sex == 2], na.rm = TRUE)

# 2. Calculate the ratio (Var_max / Var_min) 
# We use max() so the ratio is always >= 1, making it easier to interpret
variance_ratio <- max(var_male, var_female) / min(var_male, var_female)

# 3. Print the result
cat("Variance of Male group:", round(var_male, 3), "\n")
Variance of Male group: 2.237 
cat("Variance of Female group:", round(var_female, 3), "\n")
Variance of Female group: 0.34 
cat("Variance Ratio:", round(variance_ratio, 3), "\n")
Variance Ratio: 6.571 

Si el ratio es cercano a 1, significa que las varianzas son prácticamente idénticas. Si el ratio es mayor a 2, ya hay una diferencia considerable. Es un indicador de magnitud (tamaño del efecto), mientras que el test de Levene indica si esa diferencia es estadísticamente “confiable”.

# Visual proof: Histograms for comparison
ggplot(fib2, aes(x = dia1, fill = factor(sex))) +
  geom_histogram(bins = 15, alpha = 0.6, position = "identity") +
  facet_wrap(~factor(sex)) +
  theme_minimal() +
  labs(title = "Distribution of hygiene levels by gender",
       subtitle = "Visual comparison of variance",
       x = "Hygiene Score", y = "Frequency")

El ratio de varianzas es un indicador de magnitud. Mientras que el test de Levene indica si la diferencia es estadísticamente significativa, el ratio indica cuántas veces más grande es la variabilidad de un grupo respecto al otro.

Como norma general, si este ratio supera un valor de 2.0, la heterocedasticidad se considera lo suficientemente marcada como para desaconsejar el uso de pruebas paramétricas clásicas.