¿Qué es la visualización de datos?

IN2039: Visualización de Datos

Alan R. Vázquez

Departamento de Ingeniería Industrial

Agenda

  1. Ciencia de datos

  1. Los 3 principios de visualización

  1. Actividad

Introducción a Ciencia de Datos

La ciencia de datos es …

un campo multidisciplinario que utiliza métodos, procesos, algoritmos y sistemas científicos para extraer conocimientos e ideas de muchos datos estructurados y no estructurados.


El esquema de ciencia de datos

Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly Media, Inc.

Business understanding

  • La comprensión empresarial se refiere a definir el problema empresarial a resolver.

  • El objetivo es reformular el problema empresarial como un problema de ciencia de datos.

  • A menudo, reformular el problema y diseñar una solución es un proceso iterativo.

Data understanding

  • Si el objetivo es resolver un problema empresarial, los datos que componen la materia prima disponible a partir de la cual se construirá la solución.
  • Los datos disponibles rara vez coinciden con el problema.

  • Por ejemplo, los datos históricos a menudo se recopilan con fines no relacionados con el problema empresarial actual o sin ningún propósito explícito.

Nuestro objetivo es convertir los datos en información que contesten preguntas útiles.

Tipos de datos

Texto

Imágenes

Video

Audio

Datos númericos

La metodología de ciencia de datos esta basada en datos númericos dados en tablas.

De hecho, los textos, imágenes, videos o audios son transformados a este formato para procesarlos.

En este curso, asumiremos que los datos están en una tabla.

La Situación Problema

La inseguridad alimentaria en México es un problema persistente que afecta a una proporción significativa de la población.

Este fenómeno se caracteriza por la falta de disponibilidad y acceso regular a alimentos nutritivos y suficientes, lo que impacta negativamente en la salud y el bienestar de los individuos.

Objetivo de la situación problema

Esta situación problema concierne la creación de un póster que informe a la sociedad sobre el estatus de inseguridad alimentaria que existe en México.

Para esto, usarás una base de datos con información de 63,855 viviendas y 15 variables que se encuentra en el archivo “IngresosViviendasMexicanas.xlsx.”

Puedes encontrar más información en nuestra página de Canvas.

Los 3 principios de la visualización de datos

¿Qué es la visualización de datos?

“Una visualización [de datos] es cualquier presentación visual destinada a revelar evidencia, haciendo visible lo invisible” Alberto Cairo (2015).

https://www.nytimes.com/2019/02/28/learning/whats-going-on-in-this-graph-march-6-2019.html

https://www.nytimes.com/2018/09/18/learning/whats-going-on-in-this-graph-sept-19-2018.html

https://www.nytimes.com/2018/10/16/learning/whats-going-on-in-this-graph-oct-17-2018.html

En esencia, una visualización de datos te permite profundizar en conjuntos de datos complejos para obtener información significativa mediante el uso de pantallas gráficas.


Las visualizaciones de datos se ocupan principalmente de proporcionar evidencia y permitir que la audiencia explore y llegue a sus propias conclusiones sobre lo que las visualizaciones revelan sobre los datos.


La visualización de datos tiene 3 principios…

Principio 1: Formula el mensaje o pregunta

Formúla la pregunta de interés o el mensaje que quieres transmitir.

Be ready to lose all your money on bitcoin, FCA tells consumers" Financial newspaper  headline in Guardian 12 January 2021 Great Britain UK Europe Stock Photo -  Alamy

Principio 2: Convierte los datos en información

Tu gráfica debe de usar los datos para transmitir el mensaje o contestar la pregunta. Es decir, debe de convertir los datos en información.

Enriquece tu gráfica con símbolos de color y texto para transmitir información adicional.

Principio 3: Aplica los principios del diseño gráfico

  1. Es fácil identificar objetos por color.
  2. Utiliza etiquetas directas en lugar de una leyenda.
  3. Elementos como texto, líneas, y formas que tengan la misma naturaleza deben parecerse.
  4. Equilibra gráficos y texto.
  5. Ten cuidado con las opciones predeterminadas del software de visualización.
  6. Usa un diseño de cuadrícula para organizar su visualización.

Ejemplo

Principio 1: Es más barato tomar Uber que poseer un auto en cuatro de las cinco ciudades más grandes de USA.

Costo semanal (en USD) del viaje diario
Ciudad Uber Auto
New York City 142 218
Washington D.C. 96 130
Chicago 77 116
Los Angeles 62 89
Dallas 181 65

Principio 2: Convierte los datos en información.

Principio 3: Aplica los principios del diseño gráfico.

El mayor valor de una imagen es cuando nos obliga a notar lo que nunca esperábamos ver.” John W. Tukey.

John Tukey - Wikipedia

https://www.storytellingwithdata.com/ es una excelente guía sobre visualizaciones.

Actividad

Actividad (cooperative mode)

  1. Júntate con un compañero.
  2. Encuentren un buen y un mal ejemplo de una visualización (gráficas) en linea.
  3. Guarden las visualizaciones (por ejemplo, haciendo una captura de pantalla).
  4. Escriban una crítica breve (3 a 4 enunciados) de cada visualización.
  5. Suban un documento con sus criticas e imágenes en Canvas.

Regresar a página principal