Capítulo 5- Claves
- Guarda los datos limpiados en tablas con únicos y con claves
- Mantén los datos normalizados a lo largo de tu proceso tan lejos como puedas.
Los datos son almacenados en matrices rectangulares llamadas tablas. En las tablas, las filas son elementos o registros y las columnas son variables o atributos. Cada tabla tiene una clave. Una clave es una variable, o grupo de variables, que identifica únicamente los elementos de una tabla. A las variables que conforman la clave no les pueden faltar datos, y el valor de una clave nunca puede estar duplicado en las filas de una tabla.
Cada variable en una tabla es un atributo de los elementos de una tabla. Una clave externa es una clave de otra tabla de la base de datos. Por ejemplo, en una tabla de países el país es la clave externa, a cada región le corresponde un elemento de la tabla países. Las claves externas obedecen las mismas normas que el resto de variables.
Los datos almacenados siguiendo la estructura anterior se consideran normalizados. Almacenar datos normalizados significa que los datos serán entendidos fácilmente y que será más difícil cometer errores costosos.
Sin embargo, la mayoría de programas estadísticos no ejecutaran regresiones sobre una base de datos relacional. Para realizar el análisis es necesario unir tablas para obtener una única matriz rectangular.
El procedimiento tiene tres pasos:
- Guarda los datos brutos en ficheros normalizados que preserven la información en la fuente original de los datos. Esto es necesario porque probablemente necesitarás usar esos datos en formas que actualmente no eres capaz de anticipar.
- Construye otro grupo de ficheros normalizados que incluyan la transformación de las variables originales que necesitas para tu análisis.
- Une las tablas en tu base de datos para formar una matriz rectangular sobre la cual estimarás tu modelo. En esta etapa aún debes tener datos únicos, con claves, pero probablemente no estén normalizados.
Parte 2: Automatizar y control de versiones
Parte 3: Directorios
Parte 4: Claves
Parte 5: Simplificación y documentación
Entradas relacionadas: Normalizar tablas en Excel con el asistente para tablas dinámicas
No hay comentarios:
Publicar un comentario