Saltar la navegación

1. El dato como fuente de inteligencia de negocios y marketing

 

En un mundo globalizado y tan digitalizado como el actual, los datos se han convertido en el nuevo “petróleo” del siglo XXI [1], o tal y como apuntan algunos expertos en un futuro próximo llegará a asemejarse más bien al “agua”, al ser esencial para la vida de los ciudadanos, de las empresas y de la sociedad, en su conjunto. Pero al igual que el agua, los datos deben estar accesibles y limpios para que sean realmente útiles para la toma de decisiones.

En módulos anteriores se ha explicado la diferencia entre dato, información y conocimiento. El dato se refiere a símbolos o conjuntos de símbolos utilizados para representar o describir un valor numérico, un objeto o una idea. Los datos son imprescindibles para el diseño de estrategias y para la toma de decisiones en las empresas, pero por sí solos carecen de valor. Es necesario procesarlos, organizarlos y analizarlos para convertirlos en información útil.

A modo de ejemplo, y para que se entienda mejor, en gastronomía los datos serían los ingredientes y la información sería los platos ya cocinados [2]. Con los mismos ingredientes se pueden conseguir diferentes platos en función a diferentes elaboraciones, técnicas y procedimientos. Con los datos pasa lo mismo, la aplicación de diferentes herramientas, técnicas y procedimientos a los datos van a dar lugar a informaciones diversas para generar inteligencia (conocimiento) de negocio y de marketing. Ese conocimiento o inteligencia permitirá detectar información clave y relevante (insights) para la toma de decisiones.

Figura 1. Evolución del dato hacia la inteligencia y la toma de decisiones [3].
Figura 1. Evolución del dato hacia la inteligencia y la toma de decisiones [3].

Hoy en día, cada segundo que pasa se generan y recopilan millones de datos procedentes de clientes cuando interactúan con los productos y servicios de las empresas (ventas, llamadas a servicios de atención al cliente, petición de información…), resultados de estudios de consumidor, lectura de escáneres (terminales TPV en comercios, audiencias en medios), datos de accesos y clics en páginas web y anuncios, acciones que realizan los usuarios con sus smartphones (descarga de Apps…), comentarios (reviews) a productos, o datos de sensores IoT, entre otros.

Llegados a este punto es importante conocer que existen diferentes tipos de datos que se dividen según su estructura en: (1) estructurados, (2) no estructurados y (3) semiestructurados.

Datos estructurados

Los datos estructurados están organizados y dispuestos en filas y columnas, donde las filas representan los casos o sucesos y las columnas las variables, y son el tipo de datos con el que la mayoría de empresas trabaja. Son los que podemos encontrar en una base de datos relacional o una simple hoja de clientes, donde las filas representan los distintos clientes y las columnas sus características: dirección, teléfono, email, fecha de alta como cliente, número de productos adquiridos en el último mes, promedio del valor de las ventas realizadas, etc. Este tipo de bases de datos relacionales permiten ingresar, buscar y manipular los datos con relativa rapidez y se gestionan mediante un tipo de lenguaje de programación estructurado conocido como SQL.

Los datos estructurados pueden ser generados por las personas, como por ejemplo los datos de registro de clientes, de comportamiento de compra o de flujo de clics en Internet y redes sociales; o por las máquinas, como los datos procedentes de sensores IoT, de registro web, generados en el punto de venta mediante escáneres o datos financieros.

Figura 2. Ejemplo de datos estructurados procedentes de una encuesta a clientes. En las filas el número de identificación (ID) del cliente y en las columnas las distintas variables recogidas para cada cliente.
Figura 2. Ejemplo de datos estructurados procedentes de una encuesta a clientes. En las filas el número de identificación (ID) del cliente y en las columnas las distintas variables recogidas para cada cliente.

Datos no estructurados

Los datos no estructurados no tienen una estructura predefinida lo que hace más complicado su análisis y visualización mediante herramientas convencionales. Por tanto, no se organizan en bases de datos relacionales y requieren de otro tipo de herramientas para su administración y análisis. Están formados en su mayoría por textos, imágenes o vídeos que se organizan en bases de datos no relacionales que no usan tablas sino documentos que recogen todos los atributos. Estas bases son mucho más flexibles a la hora de crear esquemas de información, permiten una mayor escalabilidad y volúmenes de datos y son muy funcionales permitiendo mediante APIs exclusivas poder acceder a ellas para extraer la información que se requiera en cada momento.

En la actualidad entre el 80% de todos los datos de las empresas son no estructurados [4] y dicho porcentaje seguirá incrementándose con el tiempo a medida que se vaya extendiendo la digitalización a todos los niveles en la empresa y se vaya extendiendo el IoT.

Analizar los datos no estructurados es mucho más complejo que los estructurados, dado que requiere sistemas mucho más potentes que permitan manejar un mayor volumen de datos y herramientas de análisis más sofisticadas que trabajen con datos masivos de carácter no solo cuantitativo sino también cualitativo, como textos o imágenes. En este sentido, las técnicas de minería de datos y de inteligencia artificial aplicadas a este tipo de datos constituyen hoy en día una importante ventaja competitiva para las empresas al permitir, por ejemplo, entender y predecir el comportamiento real de los consumidores observando sus hábitos, o sus sentimientos hacia un producto o servicio examinando sus opiniones y revisiones que hacen.

Entre las fuentes que generan más datos no estructurados hoy en día cabe destacar las redes sociales que se han convertido en parte de nuestras vidas y a las que acceden miles de millones de personas en todo el planeta. Estas redes generan ingentes cantidades de datos segundo a segundo las 24 horas en forma de texto, imágenes, videos, audios, ubicaciones geográficas, etc. Asimismo, el IoT es una fuente enorme de generación de datos mediante sensores instalados en los automóviles, en productos electrónicos o dispositivos accesorios o wearables, entre otros.

Figura 3. Ejemplo de datos no estructurados procedentes de comentarios de usuarios de un hotel en el portal TripAdvisor o de opiniones en redes sociales de clientes.
Figura 3. Ejemplo de datos no estructurados procedentes de comentarios de usuarios de un hotel en el portal TripAdvisor o de opiniones en redes sociales de clientes.

Datos semiestructurados

Los datos semiestructurados están a medio camino entre las dos tipologías anteriores, al no estar completamente estructurados como los que se registran en bases relacionales, si bien proporcionan otros medios para describir dichos datos y las jerarquías entre ellos, como por ejemplo las etiquetas semánticas. El típico ejemplo de datos semiestructurados sería el código HTML que impone jerarquía de los datos a través de los elementos semánticos, aunque no restringe la cantidad de información a incluir en un documento. Otros ejemplos serían los datos de los correos electrónicos y archivos adjuntos, o los archivos comprimidos [5].

La forma que adoptan este tipo de datos es en árbol con etiquetas. Contienen también metadatos (etiquetas y elementos) que se emplean para agruparlos y describir cómo se almacenan, aunque su gestión y almacenamiento es algo más difícil que los estructurados.

Figura 4. Ejemplo de datos semiestructurados procedentes del código fuente HTML de una página web
Figura 4. Ejemplo de datos semiestructurados procedentes del código fuente HTML de una página web