Uso de Procesamiento de Lenguaje Natural para procesar respuestas abiertas de una encuesta de Opinión Pública
PDF

Palabras clave

Procesamiento de Lenguaje Natural
Opinión Pública
Machine Learning
Minería de Texto

Resumen

Este artículo revisa la utilidad de utilizar Procesamiento de Lenguaje Natural (PLN) para el análisis de las respuestas abiertas brindas a una encuesta de opinión pública. Se utilizan datos de una encuesta sobre percepción de la población costarricense respecto a diversos grupos migrantes y, a partir de ellos, se prueban diversos algoritmos, con el propósito de identificar cuál de ellos realiza una mejor clasificación de los datos. Se concluye que el algoritmo random forest es el que realiza una mejor clasificación automática de las respuestas, ayudando a disminuir la ambigüedad de la clasificación. El trabajo busca resaltar la utilidad que tiene el PLN para las investigaciones en Ciencias Sociales y, en especial, para el análisis de datos de preguntas abiertas aplicadas en estudios de opinión pública, ya que facilita la clasificación y análisis de gran cantidad de información no estructurada.

PDF