Revista Digital del Departamento de Ingeniería e Investigaciones Tecnológicas de la Universidad Nacional de La Matanza

ISSN: 2525-1333 | Vol.:6-Nro.1 (Julio-2021)

                 


 

Comunicación en congreso

VINCULACIÓN profesional para el monitoreo de servicios de TICs utilizando Big Data

 

PROFESSIONAL LINKAGE FOR THE MONITORING OF ICT SERVICES USING BIG DATA

 

Marcelo Dante CAIAFA1   Ariel AURELIO2  Adrián Marcelo BUSTO3

1Departamento de Ingeniería e Investigaciones Tecnológicas, Universidad Nacional de la Matanza, Argentina

mcaiafa@unlam.edu.ar

2Departamento de Ingeniería e Investigaciones Tecnológicas, Universidad Nacional de la Matanza, Argentina

aaurelio@unlam.edu.ar

3Departamento de Ingeniería e Investigaciones Tecnológicas, Universidad Nacional de la Matanza, Argentina

abusto@unlam.edu.ar

 

Resumen:

La articulación entre la formación universitaria y la profesional es uno de los objetivos de nuestra labor educativa. El interés del trabajo es poner de manifiesto las competencias relevantes del estudiante en un proceso concreto de vinculación entre el ambiente académico y el ambiente productivo.

La investigación se basa en el desarrollo de herramientas para el monitoreo de servicios de los sistemas TIC (tecnología de la información y la comunicación). En esta articulación universidad-empresa se utiliza tecnología Big Data para el procesamiento de un gran volumen de datos contenido en los archivos generados por los sistemas de comunicaciones de una organización de servicios masivos que atiende a más de dos millones de clientes.

Se pretende construir un tablero de control basado en tecnología de código abierto ELK (Elasticsearch-Logstash-Kibana), que se abastecerá con los registros de detalle de llamada CDRs (Call Detail Records) generados por la plataforma de comunicaciones.

El objetivo es validar si el dominio de competencias técnicas es condición suficiente o si las habilidades blandas también son necesarias para lograr un eficiente desempeño en un proyecto de estas características.


 

Abstract:

The articulation between university and professional training is one of many targets from our educational work. The interest of this work is to show the relevant skills of the students in a concrete process of linking between the academic and the productive environment.

The research is based on the development of tools for the monitoring of services based on ICT systems (information and communication technology). In this university-company articulation, Big Data technology is used to process a large volume of data contained in the files generated by the communication systems of a mass service organization that serves more than two million clients.

It is intended to build a control panel based on an open source ELK (Elasticsearch-Logstash-Kibana) technology, which will be supplied with the call detail records CDRs (Call Detail Records) generated by the communications platform.

The objective is to validate if the domain of technical skills is enough condition or if soft skills are also necessary to achieve efficient performance in a project of these characteristics.

 

Palabras Clave: Big Data, Tecnología de la Información, Competencias Profesionales del ingeniero del sector TIC, ELK

Key Words: Big Data, Information Technology, Professional Competences of the ICT engineer segment, ELK

Colaboradores: José Antonio Krajnik, Departamento de Ingeniería e Investigaciones Tecnológicas, Universidad Nacional de la Matanza, Argentina, jkrajnik@unlam.edu.ar; María de los Milagros Garófalo, Departamento de Ingeniería e Investigaciones Tecnológicas, Universidad Nacional de la Matanza, Argentina, mgarofalo@alumno.unlam.edu.ar; Christian Ariel Gomez, Departamento de Ingeniería e Investigaciones Tecnológicas, Universidad Nacional de la Matanza, Argentina, chgomez@alumno.unlam.edu.ar

 

 

 


I. CONTEXTO

El área de conocimiento pertenece a Ingeniería de las Comunicaciones, siendo el campo de aplicación las Comunicaciones/Telecomunicaciones. Temática: Empleo de herramientas específicas de Big Data en la vinculación profesional para el monitoreo de servicios de las TICs [1].

 

 

II. INTRODUCCIÓN

El presente trabajo se basa en la utilización de herramientas de Big Data, específicamente el ELK en el monitoreo de servicios de los sistemas de TICs (tecnologías de la información y la comunicación). En el objetivo que es la articulación universidad-empresa la utilización del modelo de Big Data [7], permite el procesamiento de un gran volumen de datos contenido en los archivos generados por los sistemas de comunicaciones (CDRs o Call Detail Records) de una organización de servicios masivos que atiende a más de dos millones de clientes. Por otro lado, Big Data analítica es un conjunto de tecnologías y técnicas que requieren nuevas formas de integración para revelar grandes valores ocultos en grandes conjuntos de datos [2]. La articulación universidad-empresa [6], es de vital importancia como vínculo entre la institución formadora de profesionales y la industria, en la cual se aplican los conocimientos adquiridos en la producción de bienes y servicios.

 

 

III. MÉTODOS

Como se ha indicado en el ítem II INTRODUCCIÓN, se utilizará el modelo de Big Data y las herramientas para su tratamiento. En éste trabajo el volumen de datos a ser analizado consta de archivos de CDRs (Call Detal Records), siendo la herramienta a ser utilizada el ELK. Para realizar éste análisis se utiliza un servidor en el cual se descargan éstos archivos (CDRs) y la correspondiente herramienta (ELK).

 

 

IV. RESULTADOS Y OBJETIVOS

A. Objetivos

La finalidad del proyecto es aportar solución innovadora al sector de las de las tecnologías de la información que representan las comunicaciones unificadas de telefonía, video y colaboración. A partir de trabajo se pretende desarrollar de un tablero de comando que brinde información basado en la explotación de los datos provistos por los registros CDRs.

General: Diseñar e implementar un tablero de comando a partir de indicadores específicos desarrollados sobre infraestructura de Big Data de código abierto que utiliza los registros CDR como fuente de datos. Dicha herramienta pretende aportar valor al análisis de la utilización que los clientes realizan en los sistemas de comunicaciones unificadas sobre los diferentes tipos de servicios.

Específicos: Identificar las tecnologías, herramientas de software y requerimientos de hardware necesarios para la implementación de una plataforma de Big Data de código abierto a partir de cada uno de sus componentes. Realizar la implementación, configuración e integración de las herramientas constitutivas del ambiente seleccionado y su interacción con las fuentes de datos a partir de los CDR para lograr su explotación desde ElasticSearch. Diseñar los diferentes indicadores y componer un tablero de comando visualizable desde Kibana que permita consolidar los indicadores de factores de ocupación, calidad de servicio y niveles de adopción.

B. Resultados

1. Resultados en cuanto a la producción de conocimiento:

Uno de los resultados del presente trabajo será la identificación de las mejores prácticas que validen el valor y la oportunidad que representa la plataforma de Big Data de código abierto conforme a su capacidad para generar información importante para los gestores de los sistemas de telecomunicaciones.

Se estima que lo anterior sea escalable a otras plataformas tecnológicas de forma tal que el servicio pueda ser ofrecido por los alumnos de la universidad en el mercado local.

2. Resultados en cuanto a la formación de recursos humanos:

Dentro de los integrantes del equipo está la participación activa de un estudiante que tendrá su primera incursión en los trabajos de investigación.

Todas las tareas estarán supervisadas por el director del proyecto. El estudiante compartirá su horario con algún miembro del equipo de investigación, quién lo guiará y asesorará para que pueda concretar las tareas encomendadas a lo largo del proyecto.

3. Resultados en cuanto a la difusión de resultados:

Está planificada la asistencia a congresos como CONAIISI y CACIC que además de permitir la difusión de los resultados posibilita el intercambio con pares sobre diversos tópicos relacionados con las plataformas tecnológicas utilizadas, los procedimientos seleccionados y las conclusiones alcanzadas.

4. Resultados en cuanto a transferencia hacia las actividades de docencia y extensión:

Actualmente en la currícula de la Universidad existen diversas asignaturas que dan tratamiento a las tecnologías de la información y las comunicaciones. Por ejemplo, en las asignaturas de ingeniería electrónica, Servicios avanzados de comunicaciones, Redes de computadoras y Desarrollo de Mercados Tecnológicos, entre otras. La particularidad que comparten entre ellas es el abordaje sobre distintas temáticas de la gestión de los sistemas de comunicaciones. Tanto desde un enfoque estrictamente técnico como de gestión de recursos para lo cual esta propuesta espera representar un agregado de valor.

5. Resultados en cuanto a la transferencia de resultados a organismos externos a la UNLaM:

Está prevista la transferencia de conocimientos a organismos externos a la UNLAM como el IEEE mediante la publicación de los resultados en su librería digital IEEE Xplore.

6. Vinculación del proyecto con otros grupos de investigación del país y del exterior:

Está prevista la vinculación con un grupo de investigación del exterior compuesto por Sara B. Elagib, Aisha-Hassan A. Hashim ; R. F. Olanrewaju, Department of Electrical & Computer Engineering, Faculty of Engineering, International Islamic University Malaysia, Kuala Lumpur Malaysia debido a su experiencia en un trabajo referido del año 2016 publicado en el IEEE.

 

 

V. DISCUSIÓN

A. Desarrollo del trabajo

El desarrollo del trabajo se encuentra estructurado en cinco etapas. En la primera etapa, el detalle del sistema de comunicaciones se ha llevado a cabo para conocer la fuente de datos. Para la segunda etapa, se obtienen los registros de los CDR y, se prepara el diccionario de datos. La etapa tres negocia con la indexación de la base de datos. Cada campo de los CDRs con información relevante es asignado a un tipo específco de parámetro desde el archivo de texto a un documento JSON. La etapa cuatro corre los procesos ETL. El archivo de texto se construye a partir de que el módulo de Logstash se configure para la ingestión de datos dentro de la correspondiente base de datos. En la última etapa, las búsquedas se llevan a cabo acorde a objetivos específicos que tienen que alcanzarse, con lo cual, el módulo de Kibana, permite a los datos ser consolidados en un panel de control.

B. Contextualización de la fuente de datos.

Para alcanzar los objetivos propuestos se utilizó como fuente de datos registros CDRs, generados por los sistemas de comunicaciones de una organización con más de dos millones de clientes dedicada al servicio masivo [3]. Está compuesta por miles empleados con cientos de sucursales a lo largo del territorio nacional. Dado la extensa normativa que regula sus productos, su estrategia de competencia se focaliza en la diferenciación a partir de la calidad de atención al cliente, lo que potencia el valor del presente trabajo.

Dentro del proceso de vinculación fueron necesarias distintas sesiones de trabajo entre ambos equipos de trabajo, del lado de la universidad y del lado de la empresa. Las mismas se enfocaron en descubrir detalles de la infraestructura y aspectos funcionales de los servicios referidos entre los que se citan:

·               la arquitectura funcional de los sistemas que son fuentes de datos,

·               el plan de direccionamiento IP de los segmentos de red LAN, MAN y WAN,

·               el plan de numeración del servicio telefónico y su interconexión con prestadores,

·               la estructura de los diferentes modelos de atención al cliente a estudiar.

Estas actividades fueron clave para la adecuada contextualización de los datos y su correspondiente interpretación [5].

C. Indexación de la base de datos

Para generar la base de datos es preciso crear un índice en Kibana. Se definen los campos necesarios para dar formato a la estructura de datos que se espera recibir. Esto se ejecuta en el apartado DevTools con una petición PUT. La figura 4 muestra parte del archivo utilizado:

Figura 1: Indexación de la base de datos

Fuente: Elaboración propia

 

D. Proceso ETL

El proceso ETL (Extract, Transform and Load) es el proceso de toma de datos, la adaptación de sus campos y tipos, y la carga de datos a la base. Esto se realiza configurando el logstash con el archivo que se ilustra en la figura 5. Se identifican claramente tres instancias. La primera es la entrada (input), que consiste en indicar la ruta del archivo de donde se extraen los datos. El siguiente paso es el filtro (filter) donde se listan todos los campos que contendrá en formato separado por comas. En el caso particular de las fechas, se pueden convertir los datos que se reciben en formato UNIX a un tipo dato. Por último, se tiene la salida (output) que indica el nombre del índice donde quedarán cargados los datos. El agregado del comando “stdout” habilita la opción para observar la carga en pantalla. 

 

Figura 2: Proceso ETL

Fuente: Elaboración propia

E. Resultados Obtenidos

El parámetro finalCalledPartyNumber se utilizó para clasificar el tráfico de voz según las categorías destino: Locales, Nacionales, Emergencia, Internacionales y Celulares. Esto permite registrar la distribución del tráfico telefónico y el costo operativo del servicio de los proveedores de la PSTN. El filtro se aplicó a diferentes períodos para evidenciar los cambios provocados por las restricciones generadas por la pandemia. La figura 6 compara los datos correspondientes a los períodos prepandemia (Nov/Dic 2019) y período durante la pandemia (Nov/Dic 2020)

Figura 3: Distribución del tráfico saliente

Fuente: Elaboración propia

Figura 4: Indicadores de atención al cliente

Fuente: Elaboración propia

 

Se utilizaron 2 gráficos para construir el tablero que mide el nivel de calidad de atención al cliente y se muestra en la figura 7. El gráfico superior tiene la distribución de llamadas entrantes clasificadas por tipo de atención. La atención se conforma en tres grupos: centro contacto con clientes, atención a individuos y grandes clientes. El gráfico inferior detalla la duración de las llamadas en grupos segmentados por minuto.

Respecto a las habilidades genéricas transversales puestas de manifiesto, fundamentalmente en las etapas 1, 2 y 5 del proyecto se relevaron la capacidad de indagación, pensamiento crítico, organización del tiempo y comunicación efectiva.

 

 

VI. CONCLUSIONES

El trabajo permitió valorar la experiencia de enseñanza de la ingeniería a través de la participación de estudiantes en un proyecto concretos de articulación academia-empresa, donde la industria aportó contexto productivo y especialistas técnicos y de negocio [4].

Respecto a los datos de tráfico del servicio de telefonía, comparando los mismos meses de 2019 (pre Covid-19) frente al último 2020 (durante Covid-19) se observa un incremento del 320% para la categoría destino Celulares y una reducción del 50% de la categoría destino Locales. Esto refleja la forma en que afectaron los cambios impuestos por las restricciones de la pandemia, que redujo la concurrencia de personal a las sucursales a cambio de utilizar teléfonos celulares.

En el tablero de atención del cliente se observa que los llamados atendidos por el centro de contacto (CC) representan un 60% del total de llamadas a sucursales. El tráfico restante se distribuye en dos tercios para el sector individuos y uno a grandes empresas.

En el CC el 45% de las llamadas duran menos de 1 minuto. El personal del CC adapta su disponibilidad de recursos a niveles de productividad predefinidos.

Comparando las llamadas respondidas por oficiales en sucursal con duración mayor a 5 minutos, se observa que grandes empresas tienen un 10% del total, mientras que individuos es sólo 1%.

En este proceso de vinculación con el ambiente productivo se comprobó que, si bien requirió de competencias técnicas, puso de manifiesto la necesidad de competencias genéricas para las tareas de interpretación de los datos. Se comprobó capacidad de indagación para adecuada interpretación de la fuente de datos y de la arquitectura de servicios.

Desde el punto de vista de los estudiantes, el análisis de esta experiencia permitió identificar como ventaja, la aplicación de los conocimientos técnicos en ambientes profesionales y el reconocimiento de las habilidades blandas como factores críticos de éxito dentro del proyecto.

Estas últimas resultaron clave particularmente en la etapa de contextualización de datos.

Como futuros trabajos se propone el estudio de metodologías de evaluación de competencias en proyectos de vinculación. Esto constituye un insumo importante para la valoración del desarrollo de habilidades blandas en entornos de integración de plataformas tecnológicas.

 

 

VII. REFERENCIAS Y BIBLIOGRAFÍA

[1] Chen, M.: Use cases and challenges in telecom big data analytics. In: APSIPA Transactions on Signal and Information Processing, vol. 5, p. e19, Cambridge University Press (2016)

[2] Verma, J.:, Agrawal, S., Patel. B.: Big Data Analytics: challenges and applications for text, audio, video and social media data. In: International Journal on Soft Computing, Artificial Intelligence and Applications (IJSCAI), Vol.5, No.1 (2016) .

[3] Elagib, S., Hashim, A., Olanrewaju, R.: CDR Analysis using Big Data Technology. International Conference on Computing, Networking, Electronics and Embedded Systems Engineering (2015). https://ieeexplore.ieee.org/document/7381414, last accessed 2021/01/21.

[4] Morato, J., Sanchez Cuadrado, S., Fernández, B.: Trends in the technological profile of information professionals. 25(2),169-178 (2016). https://doi.org/10.3145/epi.2016.mar.03, last accessed 2021/04/02.

[5] Agrawal, D., Bernstein, P., Bertino, E., Davidson, S., Dayal, U.: Challenges and Opportunities with Big Data. USA, Cyber Center Technical Reports (2011). http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1000&context=cctech, last accessed 2021/03/17.

[6] S. Mutula. Big Data Industry:Implication for the library and information sciences. 2016. African Journal of Library Archives and Information Science, 26(2), 93–96. Disponible https://www.ajol.info/index.php/ajlais/article/view/167425          

[7] M. Machado. Applications of Big Data for Development. 2016 Disponible en https://www.engineeringforchange.org/news/applications-of-big-data-fordevelopment/

 

 

Recibido: 2021-06-06

Aprobado: 2021-07-26

Hipervínculo Permanente: https://reddi.unlam.edu.ar/index.php/ReDDi

Datos de edición: Vol. 6 - Nro. 1 - Art. 3

Fecha de edición: Formato: 2021-07-27