Codea Blog  

Blog Details

Base de datos - Data warehouse en el Business Intelligence

INTRODUCCIÓN

 

Los datos pueden considerarse uno de los activos más valiosos para cualquier negocio si se usan correctamente. A medida que aumenta el volumen de datos con cualquier negocio, también aumenta su capacidad para realizar análisis de calidad y tomar mejores decisiones basadas en datos. Pero estas decisiones basadas en datos solo conducirían al crecimiento si los datos que se utilizaron para realizar el análisis fueran precisos.

 

Incluso los datos precisos pueden conducir a ideas inexactas o parciales si los datos no se utilizan correctamente. Para garantizar un análisis preciso, las empresas deben asegurarse de que su personal esté bien capacitado y de que las herramientas de almacenamiento de datos e inteligencia empresarial estén configuradas y utilizadas correctamente.

 


DATA WAREHOUSE

 

Almacenamiento de datos (Data Warehouse) según Oracle cloud, es un sistema especializado en la gestión de datos diseñado específicamente para respaldar las operaciones de inteligencia empresarial (Business Intelligence), en particular, las actividades analíticas. Su función principal es la de facilitar consultas y tareas de análisis, por lo que típicamente alberga vastas cantidades de datos históricos. Este tipo de almacén de datos se alimenta de diversas fuentes, que pueden incluir registros de aplicaciones y sistemas de transacción, con el objetivo de proporcionar información valiosa para la toma de decisiones empresariales.

 

Dicho de otro modo, un almacén de datos es un repositorio central para que las empresas almacenen y analicen cantidades masivas de datos de múltiples fuentes. El almacenamiento de datos se considera un elemento clave del proceso de inteligencia empresarial, proporcionando a las organizaciones las herramientas para tomar decisiones informadas.

 

Figura 1. Data Warehouse

 

Las ventajas de utilizar un almacén de datos son las siguientes:

• Datos de mejor calidad: Los datos de todas las fuentes de datos pasan por varias transformaciones que aseguran que los datos almacenados en el almacén de datos sean de la mejor calidad posible. Esto significa que se han abordado varias inconsistencias que podrían estar presentes en los datos operativos para garantizar que solo haya datos consistentes y de buena calidad en el almacén de datos.

• Toma de decisiones más rápida: Dado que los datos en el almacén de datos ya son consistentes y de alta calidad, se puede considerar que están en una forma adecuada para el análisis. Por lo tanto, el equipo de negocios puede realizar el análisis requerido en menos tiempo sin preocuparse por resultados inexactos.

 

NECESIDAD DE DATA WAREHOUSE

Para comprender la necesidad de almacenes de datos, primero debe comprender qué son los sistemas de Online Transactional Processing (OLTP) y Online Analytical Processing (OLAP).

 

Online Transactional Processing (OLTP):

Un sistema de procesamiento transaccional en línea (OLTP) se puede definir como un sistema que es requerido por cualquier empresa para sus operaciones diarias. Por lo tanto, estos sistemas deben ser capaces de manejar un gran número de operaciones que ocurren en la base de datos en tiempo real. Algunos ejemplos de sistemas OLTP incluyen sistemas de transacciones financieras, sistemas minoristas, etc. La mayoría de las operaciones de base de datos que tienen lugar en un sistema OLTP son INSERT, UPDATE o DELETE. Idealmente, un sistema OLTP requiere un número bajo de operaciones READ.

 

Online Analytical Processing (OLAP):

Un sistema de procesamiento analítico en línea (OLAP) se puede definir como un sistema que permite a los usuarios realizar análisis multidimensionales en grandes volúmenes de datos a alta velocidad. Dado que un sistema OLAP solo se utiliza para el análisis, la mayoría de las operaciones que tienen lugar en él son operaciones READ.

 

Figura 2. OLTP vs OLAP.

 

Aquí, se puede observar que los datos operativos de cualquier organización pueden almacenarse en las bases de datos de varios sistemas OLTP y un sistema OLAP requiere que todos los datos estén presentes en una única ubicación centralizada desde donde puede obtener datos según los requisitos del análisis.

 

Los datos en sistemas OLTP pueden no ser aptos para el análisis directo, requiriendo transformaciones previas. Para llevar a cabo análisis efectivos, es necesario someter los datos de múltiples bases de datos OLTP a un proceso de ETL (Extraer, Transformar, Cargar) y consolidarlos en un almacén de datos centralizado. El uso de un Data Warehousing independiente permitiría a las empresas cumplir con sus requisitos operativos, de almacenamiento de datos y de Business Intelligence.

 

SERVICIOS DE DATA WAREHOUSE

• Amazon Redshift: Amazon Redshift forma parte de la plataforma Amazon Web Services (AWS). Es uno de los Data Warehouses más populares y preferidos de todas las opciones disponibles en el mercado. Varias marcas como McDonald's, Intuit, etc. utilizan Amazon Redshift como su almacén de datos.

• Snowflake: Snowflake es una solución de almacenamiento de datos e inteligencia empresarial que permite que su empresa se base más en datos. Una de las mayores ventajas de usar Snowflake sobre otros almacenes de datos es que Snowflake tiene un modelo de precios por segundo, lo que significa que solo paga por lo que usa.

• Google BigQuery: Google BigQuery es la solución de almacenamiento de datos de Google y forma parte de Google Cloud Platform (GCP). Google BigQuery utiliza consultas SQL y se creó para analizar datos que tienen miles de millones de registros.

 

                    

Figura 2. Mejores soluciones de Data Warehousing

 


BASE DE DATOS VS DATA WAREHOUSE

 

La primera y más crucial diferencia entre los dos es el hecho de que las bases de datos registran datos y transacciones, generalmente en un formato de tabla, al que los usuarios pueden acceder, manipular y recuperar a su voluntad. El objetivo final de una base de datos es proporcionar a los usuarios una forma segura y organizada de almacenar y acceder a su información. Los Data Warehouses, por otro lado, almacenan cantidades masivas de datos de múltiples fuentes dispares y los almacenan con fines analíticos.

 

La segunda diferencia, que también se encuentra entre las más significativas, es la forma en que procesan los datos. Por un lado, las bases de datos utilizan el procesamiento transaccional en línea (OLTP) para realizar una serie de transacciones simples, como insertar, reemplazar y actualizar, entre otras. Además, OLTP responde a las solicitudes de los usuarios de inmediato, lo que permite procesar datos en tiempo real. Por otro lado, los almacenes de datos utilizan el procesamiento analítico en línea (OLAP) para analizar cantidades masivas de big data rápidamente. La principal diferencia entre los dos es que mientras OLTP puede recopilar datos que ocurrieron hace unos segundos, OLAP puede procesar y analizar los datos mil veces más rápido.

 

Una tercera y última diferencia entre los dos es que las bases de datos generalmente se limitan a un solo caso de uso, por ejemplo, almacenar datos en tiempo real sobre cada artículo vendido en su sitio web. Puede procesar una gran cantidad de consultas simples y detalladas en poco tiempo. Por el contrario, un DWH está "orientado al tema" y puede recuperar datos resumidos para consultas complejas que luego se utilizan para análisis e informes.

 


BUSINESS INTELLIGENCE

 

La inteligencia empresarial (Business Intelligence) es una amplia categoría de aplicaciones y tecnologías para recopilar, proporcionar acceso y analizar datos con el fin de ayudar a los usuarios de la empresa a tomar mejores decisiones empresariales. El término implica tener un conocimiento exhaustivo de todos los factores que afectan a una empresa, como clientes, competidores, socios comerciales, entorno económico y operaciones internas, lo que permite tomar decisiones óptimas. Business Intelligence ofrece a los lectores una introducción y una guía práctica a los modelos matemáticos y las metodologías de análisis vitales para la inteligencia empresarial (Vercellis, 2013).

 

Figura 4. Vision General de la arquitectura BI.

 

IMPORTANCIA DE BUSINESS INTELLIGENCE

Segun Trujillo y Maté (2012), es importante por las siguientes razones:

• El almacenamiento de datos y la inteligencia empresarial pueden mejorar la calidad de la toma de decisiones.

• La solución de almacenamiento de datos e inteligencia empresarial se utiliza para crear y realizar un seguimiento de los KPI (indicadores clave de rendimiento) que se pueden utilizar como una medida de qué tan bien una empresa está logrando sus objetivos deseados.

• Las soluciones de almacenamiento de datos e inteligencia empresarial se pueden utilizar para identificar diversas tendencias del mercado y problemas comerciales.

 

HERRAMIENTAS DE BUSINESS INTELLIGENCE

• Looker: Looker es una herramienta de inteligencia empresarial que forma parte de Google Cloud. Una de las ventajas más significativas de usar Looker sobre otras herramientas de BI es que le permite realizar cualquier análisis que desee en datos en vivo utilizando su propio lenguaje de consulta similar a SQL llamado LookML.

• Tableau: Tableau se considera una de las herramientas de inteligencia empresarial más potentes y de más rápido crecimiento. Tiene varias personalizaciones y características, como la combinación de datos, el análisis en tiempo real, etc., que permiten que los datos sin procesar se conviertan en una forma que cualquiera pueda entender.

• Microsoft Power BI: Microsoft Power BI se puede ver como una colección de herramientas de inteligencia empresarial, informes y visualización. Una de las mayores ventajas de usar Microsoft Power BI sobre otras herramientas es que ofrece una fácil integración con todos los productos y servicios de Microsoft, lo que la convierte en una de las soluciones de almacenamiento de datos e inteligencia empresarial más utilizadas.

• Google Data Studio: Google Data Studio es una herramienta gratuita de visualización de datos de Google. Google Data Studio le permite crear informes visuales e informativos que se pueden compartir con cualquier persona. También se puede integrar fácilmente con Google BigQuery para sus necesidades de almacenamiento de datos e inteligencia empresarial.

 

                              

Figura 5. Herramientas BI

 


CONCLUSIONES

 

Un Data Warehouse, en esencia, constituye una potente infraestructura de almacenamiento de datos que desempeña un papel fundamental al permitir la consolidación de información proveniente de diversas fuentes en una ubicación centralizada. Esta capacidad facilita el acceso rápido y eficaz a datos históricos y actuales, lo que, a su vez, empodera a las organizaciones para extraer información valiosa y tomar decisiones informadas. Al reunir datos dispersos en un solo repositorio, las empresas pueden optimizar sus procesos, identificar tendencias, patrones y oportunidades ocultas, y, en última instancia, mejorar la eficiencia de sus operaciones, lo que se traduce en una ventaja competitiva significativa en un entorno empresarial cada vez más orientado a los datos.

 

Antes, se sostenía que el poder residía en la información; no obstante, en la actualidad, el auténtico poder radica en la capacidad de comprenderla, es imperativo que cualquier entidad empresarial contemporánea de cualquier industria considere de manera seria la adopción de herramientas de análisis de datos como un elemento fundamental para desentrañar el conocimiento latente en su estructura organizativa. Solo a través de esta perspicacia podrá mantenerse en un plano competitivo dentro del mercado altamente dinámico en el que opera.

 


REFERENCIAS

 

1.  ¿Qué es un almacén de datos? (s. f.). https://www.oracle.com/pe/database/what-is-a-data-warehouse/

2.  Wieder, B., & Ossimitz, M. (2015). The impact of business intelligence on the quality of decision making – a mediation model. Procedia Computer Science, 64, 1163-1171. https://doi.org/10.1016/j.procs.2015.08.599

3.  Vercellis, C. (2013). Business Intelligence: data mining and optimization for decision making. http://www.boostem.org/pdf/BUSINESS/Business_Intelligence_Data_Mining.pdf

4.  Business intelligence. (2012). En Springer eBooks. https://doi.org/10.1007/978-3-642-27358-2

5.  media. (2022, 8 noviembre). ¿Qué es Business Intelligence (BI) y qué herramientas existen? ¿Qué es Business Intelligence (BI) y qué herramientas existen? https://blog.signaturit.com/es/que-es-business-intelligence-bi-y-que-herramientas-existen

6.  ¿Qué es Business intelligence y cómo funciona? | IBM. (s. f.). https://www.ibm.com/mx-es/topics/business-intelligence#:~:text=de%20la%20BI-,%C2%BFQu%C3%A9%20es%20Business%20Intelligence%3F,forma%20amigable%20para%20el%20usuario.

Comentarios

Registrate o Inicia Sesión para comentar y obtener Cursos de pago gratis

function loadurl(){ var val1 = document.getElementById("valor3").value; console.log(val1); if(val1){ window.location = "/comunidad/blog/filtrar/"+val1+"/"} }