TECNICAS DE PREPROCESAMIENTO DE DATOS EN MODELOS NO SUPERVISADOS APLICADOS AL ESTUDIO GENETICO DE LA RAZA ABERDEEN ANGUS
Resumen
Es sabido que la construcción de un buen modelo de minería de datos implica invertir la mayor parte del tiempo y esfuerzo en la fase de preprocesamiento de los datos de entrada.
Uno de los problemas centrales es identificar un conjunto representativo de características adecuadas y de buena calidad para construir el modelo de un caso particular.
En este artículo se explican las tareas de preprocesamiento llevadas a cabo para mejorar el conjunto de datos utilizado en la construcción de modelos no supervisados, mediante los cuales se buscan las características de los progenitores de terneros de la raza Aberdeen Angus con bajo peso al nacer.
A su vez se detallan y comparan los resultados previos y posteriores a la aplicación de estas tareas de preprocesamiento.
Debido a que el mayor obstáculo que se presenta en muchos proyectos de ciencias de datos es precisamente la cantidad y calidad de los datos de entrada, mediante este artículo se motiva a poner énfasis en las etapas iniciales de comprensión y preparación de dicho conjunto, por sobre la premura de interpretación y evaluación de los resultados.