IN2039: Visualización de Datos
Departamento de Ingeniería Industrial
“Una visualización [de datos] es cualquier presentación visual destinada a revelar evidencia, haciendo visible lo invisible” Alberto Cairo (2015).
En esencia, una visualización de datos te permite profundizar en conjuntos de datos complejos para obtener información significativa mediante el uso de pantallas gráficas.
Las visualizaciones de datos se ocupan principalmente de proporcionar evidencia y permitir que la audiencia explore y llegue a sus propias conclusiones sobre lo que las visualizaciones revelan sobre los datos.
Muchas veces el mensaje se obtiene al contestar una pregunta de interés.
Tu gráfica debe de usar los datos para transmitir el mensaje o contestar la pregunta. Es decir, debe de convertir los datos en información.
Ayudan a especificar las operaciones, visualizaciones y modelos que podemos aplicar a los datos.
Existen gráficas apropiadas o diseñadas para visualizar variables numéricas o categóricas.
Un resumen estadístico nos ayuda a resumir un conjunto de observaciones de una manera simple.
Los resúmenes estadísticos más utilizados para datos categóricos son:
La frecuencia de una categoría es el número de observaciones que pertenecen a esa categoría.
La frecuencia relativa es la frecuencia dividida por el número total de observaciones.
Los resúmenes estadísticos más utilizados para datos numéricos son:
Tipo | Gráfica |
---|---|
Categórica | Barras y circular |
Tipo | Gráfica |
---|---|
Numérica | Histograma y gráfica de caja |
Tipo | Gráfica |
---|---|
Numéricas | Dispersión y Lineas |
Tipo | Gráfica |
---|---|
Categóricas | Barras lado a lado y barras apiladas |
Tipo | Gráfica |
---|---|
Mixta | Cleveland, dispersión por color y forma, varias lineas, área, facetas |
Tipo | Gráfica |
---|---|
Mixta | Cleveland, dispersión por color y forma, varias lineas, área, facetas |
Una función \(f(X)\) muy común para predecir una respuesta (\(Y\)) es el modelo de regresión lineal.
Tiene la forma matemática:
\[ \hat{Y}_i = \hat{\beta}_0 + \hat{\beta}_1 X_i, \]
\(\hat{Y}_i = 46.32 -0.0076 X_i\)
\(\text{mpg}_i = 46.32 - 0.0076 \times \text{peso}_i\)
Para más sobre visualizaciones efectivas, visita https://www.storytellingwithdata.com/.
Tecnológico de Monterrey