Resumen:
Se estudian dos tecnologías para el análisis de datos: el cubo OLAP y el motor de búsqueda. El primero permite analizar las transacciones de un depósito de datos tomando en cuenta su contexto, mientras que el segundo es utilizado como filtro de documentos. Ambas tecnologías se comparan con el fin de determinar si pueden ser utilizadas para análisis de datos transaccionales. Una de las ventajas que ofrecen las tecnologías actuales es el procesamiento en paralelo. La computación paralela es una arquitectura que permite que un grupo de procesadores trabaje de manera colaborativa, a fin de que se pueda resolver un problema determinado. Existen diferentes formas de implementación, sin embargo, una de las más usadas es la forma “nada compartido”, el cual trata de nodos independientes que trabajan en conjunto. Con el objetivo de poder realizar una distribución de los datos de manera eficiente, se debe escoger un tipo de particionado para los mismos. Distintos algoritmos existen para esto, como el Round Robin, por medio de Hash y por rango de los datos. Se han realizado diferentes estudios para ambas tecnologías, que van desde análisis de datos científicos hasta el de comportamiento de clientes para tiendas en línea. Cada una de dichas investigaciones muestra las capacidades de análisis de las tecnologías en estudio, en las que se muestran las ventajas del uso de la misma en cada caso comparándolas con otras metodologías. Entre ambas tecnologías, se denota una clara ventaja sobre las herramientas OLAP en los ámbitos de recursos y rendimiento. En una misma consulta, los casos de OLAP duran menos tiempo para la misma cantidad de recursos utilizados. Además, es fácil concluir que las aplicaciones de recuperación de información son más intensivas en memoria, mientras que las tecnologías OLAP son más orientadas al consumo del procesador.