Revista Digital del Departamento de Ingeniería e Investigaciones Tecnológicas de la Universidad Nacional de La Matanza

ISSN: 2525-1333 | Vol.:6-Nro.1 (Julio-2021)


 

Artículo original

CONSTRUCCIÓN DE UNA BASE DE VOZ DE PERSONAS CON Y SIN ENFERMEDAD DE PARKINSON

 

CONSTRUCTION OF A SPEECH DATABASE OF PEOPLE WITH AND WITHOUT PARKINSON'S DISEASE

 

M. GIULIANO(1), D. ADAMEC(2), M. I. DEBAS(3)

 

(1) Universidad Nacional de La Matanza (UNLaM)

(2)Hospital A. Posadas: Sección de estudios neurofisiológicos. Servicio Neurología Funcional

Hospital Rivadavia Servicio de Neurología

(3)Hospital Rivadavia Servicio de ORL y Fonoaudiología

 

Resumen:

El análisis de la voz para la evaluación de los pacientes con enfermedad de Parkinson (EP) tiene relevancia como método no invasivo de diagnóstico y seguimiento. Un grupo interdisciplinario coordinado por investigadores de la Universidad Nacional de La Matanza (UNLaM), sumado a personal de la salud del Hospital Posadas y del Hospital Rivadavia, permitió construir una base de voces de pacientes con EP. Las voces fueron grabadas durante 2019 por un técnico en sonido y una fonoaudióloga en un espacio especialmente acondicionado del Hospital Rivadavia, con instrumentos de sonido proporcionados por la UNLaM. A los pacientes con EP se les realizó una evaluación neurológica, la grabación de la voz y por último una endoscopía de las cuerdas vocales. El procedimiento contó con la supervisión del Comité de Ética en Investigación (CEI) del Hospital Rivadavia y permitió la construcción de una base de datos con 55 pacientes con EP, 24 mujeres y 31 varones, en un rango etario entre 38 y 79 años y tiempo de inicio de la EP entre 1 y 16 años. Posteriormente, se grabaron 64 voces de personas sin EP con el mismo protocolo e instrumentos de grabación.

 Los resultados preliminares muestran diferenciación en la voz de personas con y sin EP, aunque resta la identificación de parámetros y métodos que optimicen y sinteticen las diferencias. Los resultados generales en cuanto al estado de las cuerdas vocales y la ronquera de la voz muestras diferencias apreciables, en promedio, respecto a personas sanas.

El trabajo colaborativo entre este grupo interdisciplinario permitirá construir una herramienta a bajo costo que permitirá el seguimiento de enfermos de Parkinson con resultados confiables y de fácil utilización para los profesionales de la salud.

 

Palabras Clave: Datos de habla, Personas sanas y con Enfermedad de Parkinson, Mediciones controladas de la voz

 

Abstract:

Voice analysis for the evaluation of patients with Parkinson's disease (PD) has relevance as a non-invasive method of diagnosis and follow-up. An interdisciplinary group coordinated by researchers from the National University of La Matanza (UNLaM), together with health personnel from Hospital Posadas and Hospital Rivadavia, made it possible to build a database of voices of patients with PD. The voices were recorded during 2019 by a sound technician and a speech therapist in a specially conditioned space at the Rivadavia Hospital, with sound instruments provided by the UNLaM. PD patients underwent neurological evaluation, voice recording and finally vocal cord endoscopy. The research was supervised by the Research Ethics Committee (CEI) of the Rivadavia Hospital and allowed the construction of a database with 55 PD patients, 24 women and 31 men in an age range between 38 and 79 years and time of onset of PD between 1 and 16 years. Subsequently, 64 voices of people without PD were recorded with the same protocol and recording instruments.

 Preliminary results show differentiation in the voice of people with and without PD, although the identification of parameters and methods to optimize and synthesize the differences remains to be done. The general results regarding the state of the vocal cords and hoarseness of the voice show appreciable differences, on average, with respect to healthy people.

The collaborative work between this interdisciplinary group will allow the construction of a low-cost tool that will allow the follow-up of Parkinson's patients with reliable and easy-to-use results for health professionals.

Key Words: Speech data, Healthy and Parkinson's disease individuals, Controlled voice measurements

 

Colaboradores: S. N. Pérez (Universidad Nacional de La Matanza-UNLaM), E. Maldonado (Hospital A. Posadas: Sección de estudios neurofisiológicos. Servicio Neurología Funcional y Universidad Nacional de La Matanza-UNLaM), C. A. Morales (Hospital Rivadavia Servicio de ORL y Fonoaudiología), L. de León(Hospital Rivadavia Servicio de ORL y Fonoaudiología), A. Yanco(Hospital Rivadavia Servicio de ORL y Fonoaudiología), J. M. Birelli (Hospital Rivadavia Servicio de Neurología), M. Martínez Ribaya (Hospital Rivadavia Servicio de ORL y Fonoaudiología), M. L. Lacaze (Hospital Rivadavia Servicio de ORL y Fonoaudiología), P. Bondar(Universidad Nacional de La Matanza-UNLaM), D. Linari (Universidad Nacional de La Matanza-UNLaM), Ing. Dr. Jorge A. Gurlekian (Laboratorio de Investigaciones Sensoriales-INIGEM-CONICET-UBA).


 

I. RESUMEN DEL PROYECTO

Se propone el análisis estadístico de parámetros acústicos de la voz como método objetivo y no invasivo para el diagnóstico y seguimiento de la Enfermedad de Parkinson (EP). El uso del análisis acústico puede ser útil, dada su capacidad para identificar cambios tempranos que carecen de correlatos clínicamente perceptibles hasta que la enfermedad se encuentra en etapa avanzada. En los resultados se observan características de las cuerdas vocales y los parámetros acústicos, que diferencian a pacientes con EP y personas sin EP.

El trabajo colaborativo entre personal de salud de los hospitales participantes y el equipo de investigadores de la Universidad de La Matanza (UNLaM) resultó exitoso y con perspectivas de profundizar en los resultados.

Es notable observar que en el análisis de la voz de personas con EPI es de creciente interés en la comunidad académica, aunque los resultados  muestran que no hay consenso en cuanto a la selección de las características adecuadas de la señal acústica para establecer modelos predictivos de la EP. Por tanto, se hace necesario ampliar las investigaciones en nuestro medio con investigación aplicada en las Ciencias Médicas vinculada a los desarrollos tecnológicos del análisis de la voz.

 

 

II. INTRODUCCIÓN

La enfermedad de Parkinson (EP) es un trastorno neurodegenerativo crónico y progresivo del sistema nervioso central, de comienzo gradual, sin sintomatología obvia, y progresión lenta, apareciendo en edades medias, entre 40 y 70 años. La enfermedad de Parkinson representa el resultado de la pérdida del tono dopaminérgico asociado directamente a daño de la sustancia nigra pars compacta. Las manifestaciones motoras de la EP están representadas por temblor de reposo, rigidez y bradicinesia [1]. En su evolución natural se agregan otros síntomas como: trastornos de la marcha, desequilibrio y alteraciones de la voz, que implican un marcado impacto en la calidad vida [2].

La rigidez asociada afecta al sistema respiratorio encargado de facilitar el flujo y la presión de aire necesarios para la emisión vocal lo que se traduce en una disminución de presión sub-glótica dando como resultado menor intensidad de la voz. Se destaca además disminución del número de ciclos vibratorios de las cuerdas vocales generando reducción del tono fundamental con aumento de la variación de frecuencia de un ciclo a otro "Jitter" e incluso valores de frecuencia fundamental superiores a grupos controles. Dada la discrepancia actual de resultados observados en la literatura se propone investigar las características acústicas de la voz en pacientes con enfermedad de Parkinson (EP) en nuestra población.

Se estima que entre un 60-80% de paciente con EP presentan alteraciones de la voz, caracterizados por cambios en frecuencia, duración e intensidad del habla [3]. Estas alteraciones se confunden en muchas ocasiones con los cambios naturales de los adultos mayores, en relación con la presbifonía (distensión y flacidez de los pliegues vocales) [4]. Otro síntoma frecuente en la EP es la presencia progresiva de disartria hipocinética (rigidez muscular e incapacidad de producir movimiento). La EP puede dejar marcas en la distonía y el temblor de las cuerdas vocales. Los parámetros biomecánicos que controlan la tensión y el desequilibrio de las cuerdas vocales ayudan a rastrear la actividad neuromotora de las vías laríngea y articulatoria [5].

El análisis acústico de la voz permite detectar los cambios de los parámetros vocales, lo cual puede ser utilizado para predecir el avance de la EP y definir una intervención clínica específica [6]. Se ha observado que el análisis acústico podría actuar como marcador diagnóstico objetivo y no invasivo en la EP. Esto facilitaría el diagnóstico y tratamiento, aumentando la calidad de vida de los pacientes, [7]. Estos biomarcadores permiten el diagnóstico temprano de la enfermedad, así como el análisis de la efectividad de las respuestas a tratamientos con levodopa o quirúrgicos [8]. Además, el diagnóstico de EP a través del análisis de trastornos del habla utilizando sistemas de tele-diagnóstico y tele-monitoreo son de bajo costo y de posible auto administración por parte de los pacientes [5,9-11].

La EP se caracteriza por presencia de disprosodia (aumento o enlentecimiento exagerados de la velocidad del habla con alteración en la melodía y ritmo del discurso, que se vuelve monótono) y disartria. La disartria es el nombre colectivo que se aplica a los trastornos del habla, que resultan de las alteraciones del control muscular sobre los mecanismos fonatorios, y se deben a daños sobre el sistema nervioso central o periférico. La disartria designa problemas de comunicación oral producidos por parálisis, debilidad o incoordinación de la musculatura que interviene en el proceso fonatorio [12]. La disartria hipo cinética relacionada con la enfermedad de Parkinson se caracteriza por el reducido y monótono volumen del habla, articulación imprecisa, y por un desorden de la velocidad del habla, los cuales pueden contribuir a déficits en la inteligibilidad.

El habla del parkinsoniano se caracteriza por tener una sonoridad e intensidad monótona, de bajo tono y pobremente prosódica, que tiende a desvanecerse al final de la fonación. El habla se produce en quiebres y significativas pausas para respirar entre palabras y sílabas, reduciéndose la fluidez verbal y el ritmo. La articulación de los sonidos, tanto linguales, como labiales, se empobrecen, reduciendo significativamente su inteligibilidad y dificultando la identificación de su estado emocional.

El objetivo del presente trabajo es relevar parámetros acústicos de la voz en pacientes con diagnóstico de EP, diferenciándolas de personas sin EP, a partir de una investigación de carácter exploratorio.

 

 

 

III. MÉTODOS

Construcción de una base de voces de pacientes con EP. Se realizó durante 2019 en el Hospital Bernardino Rivadavia de la Ciudad de Buenos Aires. Los pacientes que prestaron su colaboración son tratados mayormente en el Hospital Nacional Profesor Alejandro Posadas de la Provincia de Buenos Aires, en el servicio de Neurología funcional.

 

III.1 Circuito de la base de datos de pacientes con EP

En el Hospital Bernardino Rivadavia, los pacientes siguieron un circuito de evaluación neurológica, grabación de la voz y lagringoscopía, en el espacio físico del servicio de otorrinolaringología de dicho hospital.

En primer lugar fueron evaluados neurológicamente con escala Hoehn &Yarh (H&Y) y el test UPDRS en español en la versión patrocinada por la Sociedad de Trastornos del Movimiento (Movement Disorders Society, MDS) [13].

Posteriormente se realizaron las grabaciones de la fonación de los pacientes con EP en cabinas acústicas. Se utilizó un micrófono condensador polarizado permanente de placa trasera con carga fija (AT2020 micrófono de condensador cardioide), con equipos y personal calificado, técnico en sonido, provisto por la UNLaM.

Por último, con el fin de descartar patología laríngea excluyente a los cambios que pueden observarse en la laringe en relación a la EP [14], se les realizó un estudio de laringoscopia y estroboscopia laríngea con naso-fibroscopio flexible HENKE-SASS WOLF Gmbh modelo: 6903003600 y estroboscopio Stroboled (óptica rígida STORZ de 70° con fuente de luz Led de alta potencia 80W y cámara de video PROCAM) con sistema endodigi, pertenecientes al Servicio de Otorrinolaringología.

El procedimiento de construcción de la base de datos fue avalado por el Comité de Ética en Investigación (CEI) perteneciente al Hospital B. Rivadavia. Tanto los pacientes con EP como las personas sin EP firmaron un consentimiento informado que se encuentra archivado.

 

III.2 Criterios de inclusión y exclusión de pacientes

Como criterios de inclusión de pacientes se consideraron los siguientes:

                Caracterización de patrones acústicos de la voz en pacientes con diagnóstico de EP idiopática entre 0 a 5 años de evolución.

                Caracterización de patrones acústicos de la voz en pacientes con diagnóstico de EP idiopática en periodo de complicaciones motoras hasta 15 años de evolución

                Comparación de patrones de voz con grupo control.

Como criterios de Exclusión de pacientes se consideraron los siguientes:

                Parkinsonismos.

                Pacientes con enfermedad de Parkinson de más de 15 años evolución.

                Pacientes con antecedentes quirúrgicos de ganglios basales por enfermedad de Parkinson.

                Antecedentes de accidente cerebrovascular.

                Trastornos de voz previos o antecedentes de patología laríngea.

                Otras enfermedades neurodegenerativas.

 

III.3  Protocolo de grabación y grabación de voces sin EP

Las grabaciones de las voces de 55 pacientes con EP se realizaron en el hospital Rivadavia. A su vez, en el espacio de la UNLaM, se grabaron 64 voces de personas sin EP en cabina acústica insonorizada.

Tanto para pacientes con EP como para el resto de personas, el protocolo incluyó la grabación de habla espontánea de la fonación de las vocales sostenidas /a/, /i/, /u/ por separado y por un tiempo estimado de 3 a 5 segundos. Además, se incluyó la repetición de la palabra “Pataka” y la fonación de la frase “¡Betty! ¡Qué inmensa alegría escucharte! Cuando vengas para fin de año, quiero llevarte a recorrer toda la Argentina.”

 

III.3 Análisis de resultados

Aquí se presentan los resultados de analizar la fonación sostenida de la vocal /a/ en aproximadamente 3 segundos y las características de los pacientes con EP.

Se utilizaron varios softwares como soporte de los análisis de la base de datos construida. Para el análisis perceptual realizado por la fonoaudióloga del equipo, se utilizó el Sistema de Evaluación Audio-Perceptual, EVAPER [15, 16].  El análisis de parámetros acústicos se realizó con el software ANAGRAF (Análisis Acústico y Graficación de Señales del Habla) [17].

Los análisis estadísticos se realizaron con el software SPSS, que permitió un análisis exploratorio a partir de gráficos y tablas.

 

 

IV. RESULTADOS

IV.1 Características clínicas de los casos de estudio con EP

Se analizaron un total de 57 pacientes en total, de los cuales el 44% son mujeres y el 56% hombres, a dos de ellos, no se les grabaron las voces porque asistieron cuando no estaba el técnico en sonido, aunque si se les hicieron las demás evaluaciones. En la Tabla 1, se observa que la media de edades es de 64 años, entre 38 y 79 años. El tiempo de evolución promedio de la enfermedad desde el diagnóstico es de 6 años con valores que van entre los 6 meses y los 16 años.


 

Tabla 1: Estadísticos de las variables que describen la enfermedad de Parkinson en los pacientes (N=57)

 


En el gráfico 1(a) se muestra la distribución por edad de los pacientes y el gráfico 1(b) la distribución de la duración de la EP. La mediana en ambos cuadros nos muestra que el 50% de los pacientes tiene menos de 65 años y una duración de la enfermedad menor a 5 años.


 


Gráfico 1: (a) distribución de edad de los pacientes y (b) la distribución de la duración de la EP (N=57)

 

El gráfico 2 muestra la distribución de la escala H&Y de los pacientes y la distribución de dosis de L-dopa, medicación habitual que toman los pacientes. Se observa los valores promedios en 1,6 y 878, mientras la mediana indica que el 50% de la muestra tiene valores en la escala menores o iguales a 1,5 y una dosis de L-dopa menor o igual a 850 gr.


Gráfico 2: (a) distribución de escala H&Y; (b) la distribución de L-dopa (N=57)

 


En el gráfico 3 se observa la distribución de la escala UPDRS en dos formatos (III y 3.1). Los valores promedios en 30 y 0,4, respectivamente: La mediana indica que el 50% de la muestra tiene valores en la escala UPRS III, menores o iguales a 29 y en el caso de UPDRS 3.1 el 50% es menor o igual a cero.


Gráfico 3: (a) distribución de edad de la escala UPRS III; (b) la distribución de la UPRS 3.1 (N=57)


 


IV.2 Características de los casos de estudio en cuanto a la fibroscopía

 

A cada paciente se le realizó una fibroscopia donde se observaron características en 4 dimensiones: 1) cambios en la voz; 2) signos de reflujo gastroesofágico (RGE) en fibroscopia; 3) otras patologías; 4) hallazgos en fibroscopia.

En la tabla 2 se observan que los cambios de la voz no son percibidos por el 70% de los pacientes, mientras un 26% observa disminución de la intensidad de la voz.

 

 


Tabla 2: Referencia de los pacientes sobre cambios percibidos en la voz (N=57)

 

 


La tabla 3 muestra que el 30% de los pacientes no presentan signos RGE en la fibroscopia. Un 61% presenta algún tipo de congestión, mientras que un 39% presenta congestión en el arco posterior, siendo esta la patología más frecuente. Del total el 68% tiene algún tipo de congestión, mientras solo un 2% presenta hipertrofia de la mucosa del arco posterior y otro 2% eritema faringolaringeo difuso.


Tabla 3: Signos de RGE en fibroscopia (N=57)

 


En el grupo de otras patologías aparecen dos casos, uno con Hipertiroidismo y otro con Sarcoidosis. Los demás presentan patologías sin relación con la voz.

En la tabla 4 se observan los hallazgos de la fibroscopía, entre los que se destaca un 67% de temblor vocal en reposo y fonación. Un 25% presenta cierre glótico incompleto, un 14% de contracción lateral supraglótica, un 12% de hipertrofia de banda ventricular y un 11% de hiperfunción lateral supraglótica.

 

 

 


Tabla 4: Hallazgos en fibroscopia (N=57)

 


IV.3 Características de los casos de estudio en cuanto a las medidas perceptuales

Las medidas perceptuales analizadas fueron: aspereza, soplo, astenia-tensión, temblor, quiebres y ronquera. La evaluación fue realizada por una fonoaudióloga con soporte del software Evaper. En la tabla 5 se muestra que en ninguno de los pacientes se encontraron quiebres.


 

Tabla 5: Medidas de perceptuales (N=55)

 


La distribución de la Aspereza y el Soplo de los pacientes con EP se observan en el gráfico 4. Solo 4 pacientes tienen Aspereza cero y 22 pacientes tienen valor 1, que representan el 47% de la muestra. Un 40% tiene Aspereza entre 2 y 3, mientas el 13% restante tiene valores superiores entre 4 y 6 inclusive. En el cas­o del Soplo 25% toma valores normales, un 50% toma valores entre 1 y 2, mientras el 25% restante valores entre 3 y 5.



Gráfico 4: (a) distribución de la Aspereza; (b) la distribución del Soplo (N=55)

 

La distribución de la Astenia - Tensión y el Temblor de los pacientes con EP, se observan en el gráfico 5, en ambos parámetros solo el 16,4% (9 pacientes) presenta el valor cero, el resto presenta alteraciones.

 


Gráfico 5: (a) distribución de la Astenia-Tensión; (b) la distribución del Temblor (N=55)

 


En la Tabla 6 se observa las frecuencias de los valores tomados de ronquera y según la fonoaudióloga el 42% tiene valores normales.

 

 

 

 

 

 


Tabla 6: Tabla de frecuencias para la Ronquera (N=55)

 


En la Gráfico 6 se observa la clasificación según el análisis perceptual de la voz de los pacientes, donde se percibe que solo el 30% tiene alteración moderada, casi un 60% leve y un 20% severo.

 


 

Gráfico 6: Clasificación de los pacientes según la evaluación perceptual fonoaudilógica con EVAPER (N=55)


 


IV.4 Características de los casos de estudio en cuanto a las medidas acústicas.

Sobre las medidas acústicas analizadas se consideraron: Jitter, Shimmer, Armónico-Ruido (H-R) y Cepstrum. Además se consideró el IPA (índice de precisión vocal) y el IPI (Indice de Perturbación Integrado). La evaluación fue realizada con soporte del software Anagraf. En la Tabla 7 se observa las medidas de resumen, aunque en dos casos no pudieron calcularse los valores.


 

Tabla 7: Medidas de resumen de los parámetros acústicos (N=53)

 


Considerando los valores en una escala de 1 a 5 los parámetros acústicos quedan comparables de modo que 0 y 1 son normal, 2 y 3 valores de riesgo, 4 y 5 valores alterados y “No corresponde” se refiere a que no fue posible calcular los valores o quedaron fuera de los rangos previstos (Gurlekian 2012).


 

Tabla 8: Tabla de frecuencia para los valores en escala 0-5 de los parámetros acústicos (N=55)

 


En la Tabla 8 se observan la frecuencia de los valores en la muestra, donde el Cepstrum tiene valores alterados en 19 casos que representan el 35% de la muestra, mientras el 27% tiene valores en el sector de riesgo y solo un 35% en valores normales. En el caso del Armónico-Ruido (H-R) los valores son similares. En el Shimmer hubo problemas para calcularlo en 5 casos (el 9% de la muestra), además el 58% toma valores en la zona de riesgo. El Jitter es el parámetro con mayor incidencia de valores normales, un 63%.

El IPI se observa en el Gráfico 7 donde se ve globalmente, que los valores están perturbados, ya que solo un 15% tiene valores normales. En el Gráfico 8 se observa los valores de perturbación donde se observa que casi un 40% presenta alteraciones, mientras la mitad está en zona de riesgo vocal.

 


Gráfico 7: Clasificación de los pacientes según la evaluación IPI. Gráfico 8: Clasificación de los pacientes según el grado de IPI para personas con EP, realizado con ANAGRAF. (N=55)

 

 


V. RESULTADOS DE ANÁLISIS DE VOCES SIN EP COMPARATIVO SON EP

La construcción de base de datos de voces en personal y pacientes sin EP se realizaron en un grupo etario similar al de los pacientes con EP.  Para las grabaciones de las voces se utilizó una cabina en el espacio de la UNLaM. Se realizaron con el mismo equipo de grabación y técnico en sonido que en el Hospital Rivadavía, y las personas hicieron las mismas fonaciones que los pacientes con EP.

 

Gráfico 9: Clasificación de los pacientes según el grado de IPI para personas sin EP, realizado con ANAGRAF. (N=64)

 

 

A la fonación de la /a/ se realizaron los mismos análisis perceptuales con EVAPER y los parámetros acústicos con ANAGRAF. En el análisis perceptual no se observan diferencias apreciables, pero en el análisis acústico sí. Inicialmente se grabaron 67 voces, pero luego de un análisis previo se seleccionaron 64 grabaciones de personas sin EP, descartadas aquellas evidentemente muy afectadas.

En el Gráfico 9 se observa que el IPI en el mismo grupo de edad presenta más casos normales y menos alteraciones con respecto a los pacientes con EP.

Aún queda pendiente un análisis estadístico comparativo de ambas bases y es un trabajo proyectado para 2021.

Cualitativamente se compararon algunas voces con el uso de Parkinsoft (Figura 1). Un grupo de estudiantes de UNLaM a elaborado en 2019 un sistema libre y accesible denominado “Parkinsoft “. El mismo permitiría realizar seguimiento, teniendo como entrada audios de los pacientes, para presentar como salida una serie de gráficas representativas de las parametrizaciones de los audios [18].

 

 

Figura 1: software libre para el registro de voces de los pacientes, visualización de gráficas para seguimiento de los pacientes

 

Parkinsoft se construyó a partir de entrevistas realizadas a profesionales de la salud de dos hospitales públicos de Argentina (Hospital Posadas y Hospital Rivadavia). Se buscó interpretar las necesidades de los médicos, los avances de la investigación y las posibilidades tecnológicas para desarrollar un producto confiable y utilizable pero perfectible en el tiempo. Los médicos consideran útil una herramienta que pueda utilizase en el consultorio para determinar si un paciente tiene trastornos en la voz y decidir sobre la conveniete derivación al grupo de fonoaudiólogos y/o otorrinos.

El análisis de las voces para la diferenciación de enfermos de no enfermos se realiza aquí con el uso de Parkinsoft en forma cualitativa. Se seleccionaron tres casos del mismo género y con edades similares para compararlos.

Para los resultados se presentan los gráficos que se obtienen de Parkinsoft para los casos de estudio. A continuación, se analizan los gráficos espectrales en tiempo real de cada una de las señales.

 

Gráfico 10.  Espectrograma de Persona sin EP

 

Gráfico 11.  Espectrograma de Persona con EP moderado

 

Gráfico 12.  Espectrograma de Persona con EP avanzado

 

El Gráfico 10 pertenece al espectrograma de una persona sana y se observan los picos máximos de los formantes bien definidos. En el Gráfico 11 los picos pierden intensidad en un paciente con EP moderada y en el Gráfico 12, cuya señal pertenece a una persona con EP en un grado avanzado, los picos prácticamente desaparecen o presenta una intensidad muy baja. Se podría decir entonces que el grado de definición de los formantes podría estar relacionado con el grado de EP.

 

Gráfico 13.  Gráfica Prosody de Persona sin EP

 

 

Gráfico 14.  Gráfica Prosody de Persona con EP moderado

 

Gráfico 15.  Gráfica Prosody de Persona con EP avanzado

 

Al analizar las Gráficas Prosody (Gráfico 13, 14 y 15) se evidencian, a simple vista, diferencias entre las personas con y sin EP. En el Gráfico 13 se observa que la persona sin EP presenta una gráfica de su frecuencia fundamental constante y sin temblores. En los gráficos de las personas con voz patológica se observan temblores de gran amplitud (Gráficos 14 y 15) y una longitud menor.

 

Gráfico 16.  Gráfico de energía de la voz de Persona sin EP

 

 

 

Gráfico 17: Gráfico de energía de la voz de Persona con EP moderado

 

 

Gráfico 18.  Gráfico de energía de la voz de Persona con EP avanzado

 

En los Gráficos 16, 17 y 18, se observan diferencias significativas en la energía según el grado de EP, perdiendo la uniformidad y haciéndose más temblorosa. En el caso de del Gráfico 18, con grado avanzado de EP, se observa una rápida caída de la energía.

 

 

VI. CONCLUSIONES Y DISCUSIÓN

Se han construido dos bases de datos, una base de datos con voces de pacientes con EP en el ámbito del Hospital Rivadavia y otra con voces sin EP en la UNLaM. Aquí se han presentado algunos resultados que muestran evidencias de diferencia en la voz de personas con y sin EP, además confirma la potencialidad del trabajo interdisciplinario en esta área para obtener resultados más precisos y accesibles. Se evidencia el trabajo en el informe presentado al hospital Rivadavia [19].

Los resultados muestran evidencias de alteraciones en los pacientes con enfermedad de Parkinson respecto de personas que no tienen dicha enfermedad, tanto en el análisis cuantitativo como cualitativo.

Los resultados cualitativos con Parkinsoft muestran diferencias apreciables en casos de personas con y sin EP analizados. La búsqueda de consensos entre las necesidades de los médicos, los avances de la investigación y las posibilidades tecnológicas permitió generar un producto confiable, utilizable pero perfectible para el seguimiento de los pacientes con Parkinson en la consulta médica.

El trabajo colaborativo interdisciplinario para abordar problemas complejos y proponer soluciones tecnológicas accesibles se hace necesario cada vez más en la comunidad científica. Aquí se presenta parte del trabajo realizado entre médicos de hospitales públicos de Argentina, Hospital Rivadavia y Hospital Posadas e investigadores de la Universidad Nacional de La Matanza (UNLaM) para el estudio de la voz de pacientes con Enfermedad de Parkinson (EP). Complementariamente, el trabajo realizado interesó a un grupo de estudiantes de Ingeniería Informática de la UNLaM que ha desarrollado Parkinsoft, un sistema libre elaborado que permitiría el relevamiento de voces en consultorio de pacientes con EP, en cuya elaboración se tuvieron en cuenta las necesidades de posibles usuarios en diferentes niveles: médicos, pacientes, fonoaudiólogos, investigadores, entre otros.

La base de datos con voces de personas con y sin EP se publicará con acceso abierto en el ropositorio de UNLaM.

Ante la falta de consenso sobre cuáles de las características de la señal acústica resultaría más adecuada para establecer modelos predictivos de EP (Martínez-Sánchez 2010; Aguilera Pacheco, 2015), resulta necesario ampliar la investigación analizando la incidencia de diferentes características, y proponiendo posibles nuevas variables y metodologías de análisis, para el diagnóstico y seguimiento de la EP.

En los últimos años se han utilizado varios métodos para la parametrización del habla de personas con EP [8, 21-23]. Además, se han considerado diversos algoritmos y metodologías para la selección de parámetros [24-28]. La mayoría de los trabajos se dirigen a la fonación de la vocal /a/. Con la base construida aumenta el volumen a analizar.

 

 

VII. AGRADECIMIENTOS

Al Servicio de Otorrinolaringología y Fonoaudiología del Hospital Municipal Bernardino Rivadavia y al Servicio de Neurocirugía Funcional del Hospital Nacional Profesor Alejandro Posadas

Proyecto PROINCE-C224, Universidad Nacional de La Matanza, Argentina.

 

 

VII. REFERENCIAS Y BIBLIOGRAFÍA

[1] Jankovic, J. (2008). Enfermedad de Parkinson: características clínicas y diagnóstico. Revista de neurología, neurocirugía y psiquiatría, 79 (4), 368-376.

[2] Kollensperger,M; Wenning, M.S.A.S.G. European, Red flagsformultiplesystematrophy, Movementdisorders: official journal of the Movement Disorder Society 23(8) (2008) 1093-9.

[3] De Letter M, Santens P, Borsel, JV. (2003). The effects of levodopa on word intelligibility in Parkinson’s disease. J CommunDisord 2005; 28: pp. 187-196.

[4] Murray Morrison, Linda Rammage “Tratamiento de los trastornos de la voz” Elsevier España, 1996 capítulo 8, pág. 162.

[5] Gómez-Vilda, P., Vicente-Torcal, M., Ferrández-Vicente, J., Álvarez Marquina, A., Rodellar-Biarge, V., Nieto-Lluis, V.,etal. (2015) Parkinson’s disease monitoring from phonation biomechanics. In: Ferrández Vicente, J.M., Álvarez Sánchez, J.R., de la Paz L´opez, F., Toledo-Moreo, F.J., Adeli, H., editors. Artificial Computation in Biology and Medicine; vol. 9107 of Lecture Notes in Computer Science. (http://link.springer.com/chapter/10.1007%2F978-3-319-18914-7_25)

[6] Chiaramonte, R., and Marco Bonfiglio. "Análisis acústico de la voz en la enfermedad de Parkinson: revisión sistemática de la discapacidad vocal y metaanálisis de estudios." Revista de neurología 70.11 (2020): 393-405.

[7] Picó Berenguer Marusela, Yévenes Briones Humberto Alejandro. Trastornos del habla en la enfermedad de parkinson. Revisión. Rev Cient Cienc Méd  [Internet]. 2019  [citado  2021  Mar  06] ;  22( 1 ): 36-42. Disponible en: http://www.scielo.org.bo/scielo.php?pid=S1817-74332019000100006&script=sci_arttext

[8] Holmes RJ, Oates JM, Phyland DJ, Hughes AJ. (2000). Voice characteristics in the progression of Parkinson’s disease. Int J Lang Commun Disord 2000; 35: pp.  407-418.

[9] Little, M.A, McSharry, P. E., Hunter, J. E. Spielman, J. &Ramig, L. O. (2009). Suitability of dysphonia measurements for tele monitoring of Parkinson’s disease,” IEEE Trans. Biomed. Eng., 56(4):1010–1022

[10] Orozco-Arroyave, J. R., Vásquez-Correa, J. C., Klumpp, P., Pérez-Toro, P. A., Escobar-Grisales, D., Roth, N., ... & Nöth, E. (2020). Apkinson: the smartphone application for telemonitoring Parkinson’s patients through speech, gait and hands movement. Neurodegenerative Disease Management, 10(3), 137-157.

[11] Tsanas, Athanasios, and Siddharth Arora. (2021). "Assessing Parkinson’s Disease Speech Signal Generalization of Clustering Results Across Three Countries: Findings in the Parkinson’s Voice Initiative Study." Age 63.10.8 (2021): 63-5.

[12] Cobeta, Ignacio. Núñez, Faustino. Fernández, Secundino (Coordinadores). (2013). Patología de la voz. 1.ª edición, 2013 Edita: Marge Médica Books. Barcelona (España)

[13] Goetz CG, Fahn S, Martinez‐Martin P, Poewe W, Sampaio C, Stebbins GT, Stern MB, Tilley BC, Dodel R, Dubois B, Holloway R. Movement Disorder Society‐sponsored revision of the Unified Parkinson's Disease Rating Scale (MDS‐UPDRS): process, format, and clinimetric testing plan. Movement disorders. 2007 Jan;22(1):41-7.

[14] Mamolar Andrés, María Liliana Santamarina Rabanal, Carla María Granda Membiela, María José Fernández Gutiérrez, Paloma Sirgo Rodríguez, César Álvarez Marcos. Swallowing Disorders in Parkinson’s Disease. Acta Otorrinolaringológica Española, Volume 68, Issue 1, January–February 2017, Pages 15-22.

[15] Gurlekian, J. A., & Torres, B. I. D. H. Informe Técnico del Sistema de Evaluación Audio-Perceptual, EVAPER.

[16] Gurlekian, Jorge A., Humberto M. Torres, and Melissa Rincón Cediel. "A Perceptual Method to Rate Dysphonic Voices." Journal of Voice 33.4 (2019): 453-464.

[17] Gurlekian, J. A., & Molina, N. (2012). Índice de perturbación, de precisión vocal y de grado de aprovechamiento de energía para la evaluación del riesgo vocal. Revista de logopedia, foniatría y audiología, 32(4), 156-163.

[18] Luciano, E.; Massiolo, R.; Procopio, G.; Vaccotti, F.; Viqueira, M. Parkinsoft: Sistema de Seguimiento de la Voz para Pacientes con Parkinson. Actas CONAIISI 2019.

[19] Maldonado, E, M. Giuliano, D. Adamec, M. I. Debas, C. A. Morales, L. de León, A. Yanco, J. M. Birelli, M. Martínez Ribaya, M. L. Lacaze, P. Bondar, D. Linari. (2020). Análisis acústico de la voz en pacientes con enfermedad de Parkinson (informe de avance). Proyecto con Hospital Rivadavia y Hospital Posadas.

[20]Brabenec, L.; Mekyska, J.; Galaz, Z.; Rektorova, I. Speech disorders in Parkinson’s disease: Early diagnostics and efects of medication and brain stimulation. J. Neural Transm. 2017, 124, 303–334.

[21]Arias-Vergara, P. Argüello-Vélez, J.C. Vásquez-Correa, E. Nöth, M. Schuster, M.C. González-Rátiva, J.R. Arias-Vergara, T.; Vásquez-Correa, J.; Orozco-Arroyave, J.; Nöth, E. Speaker models for monitoring Parkinson’s disease progression considering diferent communication channels and acoustic conditions. Speech Commun. 2018.

[22] Tsanas, A. (2012). Accurate telemonitoring of Parkinson’s disease symptom severity using nonlinear speech signal processing and statistical machine learning (Doctoral dissertation, Oxford University, UK).

[23] Tsanas, M. A. Little, C. Fox and L. O. Ramig, (2014) "Objective Automatic Assessment of Rehabilitative Speech Treatment in Parkinson's Disease," in IEEE Transactions on Neural Systems and Rehabilitation Engineering, vol. 22, no. 1, pp. 181-190, Jan. 2014, doi: 10.1109/TNSRE.2013.2293575

[24] Díaz-Pérez. F. García-López. A. Rubio-Sánchez. M and Álvarez-Marquina. (2017).  A. Using Classification Algorithms forTelemonitoring Parkinson’s Disease Severity. in Advances in Data Mining 17th Industrial Conference on DM (2017)

[25] Giuliano, M., García-López, A., Pérez, S., Pérez, F. D., Spositto, O., & Bossero, J. (2019). Selection of voice parameters for Parkinson´ s disease prediction from collected mobile data. In 2019 XXII Symposium on Image, Signal Processing and Artificial Vision (STSIVA) (pp. 1-3). IEEE.

[26] Giuliano, Mónica, Fernández, Luis, Pérez, Silvia Noemí. (2020). "Selección de Medidas de Disfonía para la Identificación de Enfermos de Parkinson". IEEE ARGENCON 2020.

[27] Pérez, S. N., Giuliano, M. (2019). Utilización de grabaciones con teléfonos móviles para la predicción de la enfermedad de Parkinson. Actas CONAIISI 2019.

.


 

 

 

Recibido: 2021-03-04

Aprobado: 2021-06-15

Hipervínculo Permanente: https://reddi.unlam.edu.ar/index.php/ReDDi

Datos de edición: Vol. 6 - Nro. 1 - Art. 1

Fecha de edición: 2021-07-27