Resumen:
El presente documento muestra la documentación respectiva a una herramienta desarrollada para la utilización de la minería de datos en un Data Warehouse 2.0 mediante escenarios con información de alertas e incidentes del departamento Global System Monitoring (GSM) en Costa Rica y Malasia respectivamente, de la compañía Intel. La utilización de algoritmos en la minería de texto, son fundamentales para la búsqueda de tendencias mediante palabras claves, lo cual, es y será, un pilar fundamental en las organizaciones pues les permitirá transformar en conocimiento los grandes volúmenes de datos existentes hoy en día.
A partir de ahí, el presente proyecto tiene como objetivo principal la implementación de un Data Warehouse 2.0 y su respectiva aplicación de técnicas de minería de texto que permitan recuperar las descripciones de tiquetes relacionados al soporte de la plataforma tecnológica de manejo de tiquetes de Intel, en tiempo real. Se manejarán tres categorías de tiquetes: incidentes, los cuales son problemas específicos no esperados del cliente los cuales no pueden ser asociados a un guion de resolución, los “¿cómo puedo?” concernientes a preguntas frecuentes a resolver mediante un script y los tiquetes tipo solicitud donde el cliente pide un servicio en específico, por ejemplo el aumento de espacio en disco a nivel de servidor.
Las descripciones de los tiquetes no poseen ningún formato estándar por lo cual es difícil recuperar manualmente cuales son los problemas más frecuentes. Por esta razón, se utilizarán técnicas de minado de texto, para otorgar la oportunidad de mostrar a los usuarios aquellas palabras claves que podrían considerarse como relevantes para su análisis, ya sea en períodos de una hora para alertar de una posible degradación de servicios en una aplicación determinada, o en tiempos iguales o menores a un año a fin de poder analizar proactiva y reactivamente los problemas enfrentados por un servidor y aquellos que podrían llegar a generarse.
Como resultado, se implementarán planes de acción que permitan disminuir el volumen de tiquetes relacionados a una misma área de soporte; para evitar escalaciones1 futuras, visualizar elementos recurrentes que afecten la operaciones de negocio, incrementar los niveles de resolución de incidentes y finalmente aumentar el nivel de confianza de los clientes.