mario
Fundamentos de Tableau
- mayo 17, 2022
- , 11:53 pm
Tableau es una herramienta de visualización de datos, la cual permite analizar, visualizar y compartir grandes volúmenes de información, de forma sencilla y amigable, una herramienta ampliamente usada en la actualidad. En este curso básico nos basaremos en Tableau Public, el cual es gratuito, pero todos nuestros proyectos creados quedarán de forma pública en la página web oficial de Tableau.
Anatomía e interfaz de tableau public
Al abrir Tableau, la pantalla principal está distribuida en 3 secciones, la primera sección ubicada en la parte izquierda, se encuentran todas las conexiones de donde podemos traer nuestros datos. La segunda sección ubicada en la parte central, se encuentran los archivos recientemente abiertos y por último en la tercera sección, ubicada en el costado derecho, se ubica el apartado de Descubre Más, donde encontraremos noticias y novedades de Tableau.
Si queremos salir de esta pantalla simplemente apretando la tecla escape, nos envía a la hoja de trabajo o Worksheet.
En esta hoja veremos una nueva distribución de elementos, en la pestaña inferior podemos ver el nombre por defecto de nuestra hoja de trabajo, a su lado (con el símbolo de un cuadro con un gráfico de barras en su interior y un más) nos da la opción de agregar otra Worksheet. La otra opción con un símbolo de un cuadrado compuesto por 4 cuadrados y un más, nos da la opcion de agregar un Dashboard (Un conjunto de visualizaciones de datos), y la opción con símbolo de un libro abierto y un más, nos da la opción de crear una nueva historia (Las cuales tienen una cierta estructura de trabajo que nos ayudará a crear un lazo de comunicación con nuestra audiencia). Por último, la opción del lado izquierdo, Fuentes de datos, nos da la posibilidad de ver nuestra base de datos, editar o crear las conexiones.
Además, podemos ver que la pantalla en general se divide en varias secciones, en la parte izquierda, donde dice Datos, irán todas nuestras variables y datos. En el centro de la pantalla se muestra nuestro lienzo donde vamos a trabajar, arriba las filas y columnas, y a un costado, los filtros y las marcas que nos ayudarán a editar nuestras visuales.
Y del lado derecho podemos ver la pestaña “Mostrarme” donde podemos ver sugerencias de distintos gráficos que podemos utilizar según los datos que tengamos desplegados en nuestra hoja de trabajo.
Importación de datos en excel
Abrimos nuestro tableau, y en la parte principal, en el costado izquierdo seleccionamos , Excel o el tipo de formato que contenga tus datos, buscamos nuestro archivo y le damos abrir.
Una vez que se cargue podemos ver en el lado izquierdo las diferentes hojas que tiene nuestro archivo. Para utilizar una, le hacemos click y la arrastramos a la parte superior.
Ahora en la parte inferior, podemos observar toda nuestra data de forma ordenada. Lo que tenemos que tener presente es el tipo de dato que tenemos en cada una de nuestras columnas. Sobre el título de nuestra columnas, cada una de ellas tiene un símbolo en azul, la cual indica el tipo de datos que cada columna posee ( entero, String, fecha, etc.), haciendo click sobre el símbolo podemos modificarla.
Si queremos ver esto mismo de manera resumida nos vamos a la pestaña Detalles de la tabla, y nos aparecerán solo los nombres de las columnas con su tipo.
Una vez revisado todo esto, podemos pasar a nuestra hoja de trabajo, donde de lado izquierdo podemos ver el nombre de nuestros valores o columnas. Podemos distinguir 2 colores distintos, los azules representan valores discretos (finitos) y los verdes valores continuos.
Tableau funciona con el sistema Drag And Drop o arrastra y suelta. Por ejemplo, tomamos una variable llamada categoría y la arrastramos a nuestras columnas, ya sea en el paño o en la parte superior donde dice columnas. Ahora si queremos ver las ventas por categoría las arrastramos a los valores del paño.
Si queremos convertir esto en una visualización de datos, le damos a Mostrarme y por ejemplo la convertimos en un gráfico de barras.
Si queremos ver el gráfico de manera vertical, con el botón de Intercambiar filas y columnas, situado en el menú principal, lo podemos hacer.
Si queremos visualizarlo mejor podemos arrastrar con el mouse sobre la última barra expandiendo la gráfica.
Y si queremos visualizar la gráfica de mejor manera podemos ordenar nuestras barras de mayor a menor, con la opción situada en el menú principal Ordenar Descendentemente.
Ahora si queremos colorear las barras según las variables de categoría, debemos tomar la variable categoría y la soltamos en los colores. Los cuales se seguirán respetando si seguimos creando visualizaciones en torno a estas variables.
Si queremos editar los colores nos vamos a la opción Color, le damos click y le damos a la opción editar colores, donde podemos utilizar una gran variedad de colores o los que nosotros queramos específicamente.
Si le damos click derecho a nuestra hoja tenemos varias opciones, una de ellas es duplicar, ocupada comúnmente para no dañar la visualización que estamos trabajando al probar nuevas ideas.
La información no solo podemos mostrarla a través de los colores, también podemos colocar etiquetas, tamaños e incluso descripciones emergentes (cuando ponemos el mouse sobre cada una de nuestras visualizaciones y aparece un comentario).
Si queremos que nuestras visualizaciones tengan etiquetas, es simplemente por ejemplo tomar la variable ventas y soltarla en etiquetas.
La parte del tamaño también lo podemos utilizar para visualizar mejor lo que queremos mostrar por ejemplo si queremos saber qué tan rentable es cada categoría, arrastramos la variable utilidad sobre la opción tamaño y nos mostrará según el grosor de las barras cuales son más rentables.
Así con este simple ejemplo, podemos ver las categorías que más ventas nos trae y las que más utilidad nos reportan, las cuales a veces no suelen correlacionarse.
Si queremos utilizar una variable de fecha, esta nos permite la anidación de datos, es decir nos puede mostrar los años, los trimestres, los meses o los días. Si simplemente no queremos mostrar uno de ellos lo tomamos y lo soltamos fuera de la visualización.
Ahora para utilizar un Dashboard necesitamos una recopilación de varios worksheets. Una vez que tengamos varias visualizaciones, nos vamos a agregar un Dashboard.
En la parte de tamaño se recomienda ponerlo en automático para que agarre el tamaño completo de nuestra pantalla y del lado izquierdo en las hojas podemos encontrar las visualizaciones que hicimos.
Tomamos una de ellas y la arrastramos en el paño y lo mismo con las demás hojas.
Además podemos agregar objetos que podemos encontrar en la parte izquierda del lado de abajo, como partes en blanco, texto, etc.
Comunidad Tableau
La comunidad de Tableau es una de las más importantes. Uno de sus retos más relevantes es uno de los que ocurre cada lunes dentro de Twitter, llamado #MakeoverMonday. Donde cada lunes liberan una base de datos para que al final del día las personas puedan subir sus descubrimientos y visualizaciones. Es donde se reconoce a las personas más dedicadas y se les comienza a dar más oportunidades. Ya que estas son las que aspiran a ser las mejores visualizaciones del día Viz of the Day.
El evento llamado Iron Viz, es un evento al que se puede llegar por medio de la comunidad, una gran competencia de visualización, para la cual es importante lograr visibilidad por medio de la comunidad con el reto mencionado anteriormente.
Otra comunidad importante es Kaggle, donde podemos encontrar conjuntos de datos importantes de distintos tipos para que podamos practicar con datos reales.
Gráfica de barra y de dispersión
Teniendo nuestros datos cargados, arrastramos y soltamos nuestras variables categorías y ventas y las coloreamos por categorías. Agregamos nuestras ventas y la arrastramos a nuestra parte de etiqueta. Luego le damos a Mostrarme y seleccionamos la gráfica de barra. Si queremos cambiar el nombre de nuestra hoja le damos click derecho a la hoja y le cambiamos el nombre, esta automáticamente cambiará el nombre superior de la hoja también.
Ahora para realizar un Scatterplot o gráfica de dispersión, la cual nos ayudará a encontrar la correlación entre 2 variables, tomamos las variables venta y utilidad, para ver si mientras más vendemos más utilidades obtenemos. Arrastramos nuestras variables y luego le damos a Mostrarme y cambiamos nuestro tipo de visualización.
Quizás nos de la suma de todos los datos como un solo punto en la gráfica, para cambiar esta opción nos vamos a la parte de análisis y le sacamos el Check a la parte de agregar medidas.
Para que quede más claro, podemos colorearlo por su utilidad, generalmente puede que nos de con un degradado de colores, si queremos utilizar los típicos colores azules para las ventas positivas o rojas para las negativas, nos vamos a la parte de colores hacemos click y luego en editar color. Seleccionamos la parte escalonada la cual nos divide en partes iguales el total de nuestro datos, por lo tanto si le decimos solo en 2, tendremos una división donde exactamente a la mitad se convierte en azul y la otra mitad en roja.
Y si queremos saber cuales son los clientes que están generando estas pérdidas, podemos agregar una descripción emergente, arrastrando la variable clientes a Descripción Emergente y ya podemos identificarlo en nuestra visualización.
Tablas y valores calculados.
Teniendo nuestra base cargada, si queremos hacer una tabla de por ejemplo nuestra ventas según trimestre año y categoría, arrastramos nuestra variable categoría a nuestra filas, luego la variable fecha también la arrastramos a nuestras filas, le damos al ícono más para que nos muestre los trimestres y esta variable la arrastramos a nuestras columnas, finalmente arrastramos las utilidades a los valores. Pero es difícil identificar donde tenemos pérdidas o ganancias, es por esto, que tomamos la variable utilidad y la soltamos en colores, editamos los colores para que sean solo 2.
Ahora crearemos un valor calculado para utilizar columnas personalizadas, utilizando fórmulas. Para esto hacemos click derecho en el apartado de la izquierda (en blanco) y le damos a crear campo calculado, le damos un nombre, por ejemplo la Razón entre utilidad y las ventas (cuánto de nuestras ventas es nuestra utilidad).
Ahora escribimos la siguiente fórmula:
SUM([Utilidad])/SUM([Ventas])
Donde podemos arrastrar y soltar las variables o simplemente escribirlas. Y el mismo tableau nos dice si el cálculo es válido. Le damos aceptar y estaría listo.
Ahora por ejemplo, podemos arrastrar la variable categoría y utilizar nuestro valor calculado, simbolizado por un =# (que significa que es un campo calculado).
Podemos apreciar que el resultado se está mostrando en decimales, pero esto no es lo que queremos, ya que el dato es un porcentaje. Para mostrarlo de esta forma, le damos click derecho a nuestro campo calculado creado, nos vamos al apartado de formatear, en número seleccionamos porcentaje y la cantidad de decimales que queremos.
Fechas y gráficas de lineas
Para esta visualización ocupamos las ventas en filas y fecha en columnas, luego lo dividimos en trimestre y finalmente lo coloreamos por año.
Acá podemos apreciar la tendencia por cada año según trimestre.
Si posteriormente la arrastramos a un Dashboard, y queremos editar el eje para por ejemplo darle un valor más alto, hacemos doble click sobre el eje, seleccionamos un Fijo y le ponemos el final que queremos.
Mapas con filtros, parámetros y KPIs
Para que esto pueda funcionar debemos tener nuestro tipo de datos como geolocalizados, el cual se simboliza por un mundo al lado izquierdo de la variable.
Arrastramos por ejemplo la variable ciudad a nuestro tablero y nos mostrará un punto geolocalizado. A veces surge un problema que es que tableau intenta localizar los puntos dentro del país que uno se encuentra actualmente, y lo único que debemos cambiar para solucionar esto, es la referencia del país.
Para esto nos vamos a la parte de arriba en Mapa y le ponemos editar ubicaciones, cambiamos el país, seleccionamos desde el campo País y a veces también es necesario cambiar el campo estado, seleccionamos desde el campo Estado y le damos aceptar. Quitamos el pin de la visualización que estaba fija en nuestro país y nos llevará a nuestra gráfica representada de manera correcta.
Ahora crearemos constantes para elaborar por ejemplo disparadores de nuestros KPIs. Le damos click derecho en la parte de la izquierda en blanco y le seleccionamos Crear parámetro, le damos un nombre por ejemplo Tolerancia, le damos el tipo de datos, flotante por ejemplo, el valor actual 1 y le damos aceptar. (Podemos cambiar su valor inicial en cualquier momento dando click en la variable y editar).
Ahora creamos un campo calculado donde utilizaremos nuestro parámetro, le damos nombre por ejemplo KPI por descuento y escribimos la siguiente fórmula:
IF [Descuento] >= [Tolerancia]
THEN TRUE
END
Ahora que ya tenemos nuestro KPI y nuestro disparador le podemos dar mayor funcionalidad. Le damos click derecho a nuestro parámetro y le damos a mostrar parámetro, el valor que le indiquemos a nuestro parámetro se va a convertir en el valor de nuestra tolerancia.
Agarramos nuestro campo calculado KPI por descuento y coloreamos. Nuestras ciudades con la tolerancia que cumpla la condición cambiaran de color. Con esto podremos distinguir cuales son mayores que nuestra tolerancia que elijamos. Si por ejemplo ponemos 0.3 se pondrán de colores ciertos puntos (Estos colores también los podemos editar como lo hemos hecho anteriormente).
Además podemos filtrar las ciudades que están en color gris, los descuentos los llevamos a filtros y seleccionamos mínimo, le damos siguiente y seleccionamos mínimo nuevamente le damos el valor por ejemplo 0.30 y se nos mostrará solo las ciudades con un mínimo de 0.30 de descuento.
Creación de tableros interactivos con acciones y filtros
Creamos un nuevo Dashboard, ponemos el paño en tamaño automático para que se ajuste al tamaño de nuestra pantalla, arrastramos los tableros que queremos mostrar, por ejemplo todos los que tenemos disponibles.
Las leyendas que nos indican qué variable está representada por cada color, si queremos los podemos eliminar, dandole click a la X de cada una de ellas.
Podemos acomodar las gráficas como nosotros queramos dándole click y moviendo nuestras gráficas. Si queremos que por ejemplo una gráfica ocupe el máximo de espacio que tiene disponible, hacemos click derecho en la pestaña gris que se encuentra sobre el espacio que está la gráfica y le damos a cuadrar en vista completa.
También podemos eliminar los títulos de cada uno de las gráficas, dandole click derecho sobre el título y le damos a la opción ocultar título.
También podemos eliminar el título de los ejes dándole doble click sobre el eje y le borramos el título.
Si queremos agregarle un título a nuestro dashboard arrastramos un espacio en blanco lo soltamos donde queramos poner el título y luego agregamos el objeto texto y lo soltamos en el espacio en blanco y le damos el título.
Si queremos agregar un disparable de selección nos vamos a la parte de Dashboard, en el menú principal y seleccionamos acciones, añadir acción, filtro. La hoja de origen es nuestro dashboard nºx que es el que tenemos seleccionado y con el cual estamos trabajando, quitamos todos los ticket del primer cuadro y dejamos solo el de la visualización que queremos mover nuestro Dashboard. Le decimos que la acción se ejecute con una selección y en el cuadro de abajo le decimos a cuales afecta, generalmente todas menos ella misma. Y le dejamos Mostrar todos los valores, así nos deja ver todos los demás valores cuando no esté en uso el filtro y le damos aceptar.
Ahora, al momento de hacerle click a una de nuestras categorías (en el gráfico de barras), un filtro automático se realiza para todas nuestras siguientes visualizaciones.
Hay que tener cuidado al momento de realizar esto, ya suele suceder que, si tenemos Top n parámetros en alguna visualización y seleccionamos una variable, hay veces que no nos muestra nada en el Top N porque la variable que seleccionamos no se encuentra en el Top n, si no que está por fuera del rango. Para arreglar esto debemos agregar contexto de filtro a nuestra visualizaciones. Nos vamos a la visualización que no se está viendo, en la sección filtro, vamos a ver que hay una variable que es el filtro de la acción, le damos click a la flecha y le damos a añadir a contexto.
Otras consideraciones importantes
Si tenemos una variable que al colocarla en nuestro tablero nos da la suma y no el recuento, le damos click derecho sobre nuestra variable en verde, en medida, la cambiamos a recuento distintivo.
Para excluir un dato, de un gráfico por ejemplo, simplemente le damos click derecho sobre el dato y le damos a excluir.
Si por ejemplo tenemos una sola variable en filas, al lado nos aparecerá ABC, que significa que está esperando que le demos un valor a la variable, si solo queremos dejar la variable y que desaparezca esto, nos vamos a color y le bajamos la opacidad a 0.
Para realizar un Top N, arrastramos nuestra variable por la cual queremos hacer el top a filtro y nos vamos a límite, escogemos por campo y seleccionamos que va a elegir el top y le damos la cantidad de datos que queremos mostrar.
Si tenemos una variable en valor continuo y la queremos en discreto, le damos click derecho y le ponemos convertir a dimensión.
Para modificar el tamaño de las letras de una hoja de trabajo, le damos click derecho al valor, le damos en formato y nos dirigimos a la parte de hoja donde esté seleccionada la tipografía y podemos escoger tamaño y color.
Si deseamos cambiar el idioma de nuestro Tableau, nos dirigimos a ayuda, en el menú principal, luego a elegir idioma y escogemos el idioma de nuestra preferencia.
Otros tipos de visualizaciones
Gráfica de burbujas: Muestra según el tamaño de las burbujas, el número que tan grande es.
Gráfica de árbol: el tamaño de los cuadros está representado por el número y también el color.
Heatmap: nos muestra varios cuadrados según el tamaño del número, pero si lo queremos en heatmap, arrastramos la variable que está con el selector tamaño a color.
Storyboard
Se trata casi de lo mismo que un Dashboard, pero este se compone de pestañas, donde no podemos utilizar nada que no se haya creado anteriormente (por ejemplo si queremos poner texto debemos crear un dashboard con solo texto).
El storytelling se trata de contar una historia con nuestro datos, y la estructura recomendada es un introducción o contexto, luego un resumen que de qué fue lo que encontramos, luego las visualizaciones que nos ayudará a contar nuestra historia, finalmente una conclusión y también podemos incluir recomendaciones.
Estructura recomendada:
- Contexto: porque elegiste el proyecto, con que fin, que quería encontrar o contestar
- Resumen: resumir los descubrimientos (también puede ser usada al final)
- Puntos de interés: dataviz que mejor representan los descubrimientos
- Conclusiones: resultados finales
- Recomendaciones: limitaciones del trabajo e invitar a indagar más
Para poder iniciar una presentación le damos click en modo presentación en el menú principal.
Fundamentos de Tableau está basado en distintos cursos de Platzi, Capacitaciones laborales y práctica personal.