Inicio CIENCIA Un algoritmo para discernir el sentimiento en un texto

Un algoritmo para discernir el sentimiento en un texto

Autor: César Tomé López es un escritor científico y editor de Mapping Ignorance

Encontrar patrones en un texto puede resultar muy útil. Podría revelar si el texto ha sido escrito por una determinada persona o no, por ejemplo. Ir un paso más allá, encontrar sentimientos en un texto o un discurso también puede ser muy útil. Estas habilidades suelen aparecer en películas y series de televisión de procedimientos y espías. En estas obras de ficción suele ser un personaje humano inteligente el que encuentra el patrón; en otros, es un programa informático del descubridor. Pero lo que rara vez se encuentra en estas películas y series, sin embargo, es un programa de computadora que descifra sentimientos u opiniones basados ​​en emociones, en una palabra, sentimientos. Esta es un área de especialización humana exclusiva, ¿verdad? Porque, ¿podría un algoritmo matemático incluso aspirar a descifrar las emociones humanas ocultas en un texto o un discurso? Y si es así, ¿cómo podrían hacerlo?

Cuál es el objetivo del análisis de sentimientos

En realidad, el análisis de sentimientos es un subconjunto establecido de problemas de procesamiento del lenguaje natural. El objetivo del análisis de sentimientos es discernir y evaluar, de forma automatizada, opiniones del lenguaje escrito o hablado. Una opción común para lograrlo es calcular una representación basada en vectores de las palabras, o incrustaciones, para todas las palabras en una oración. Luego, los algoritmos de aprendizaje supervisado utilizan las incrustaciones para predecir la presencia o ausencia de una emoción en el texto.

Temas que te pueden interesar  ¿Si llueve en China no lloverá en países vecinos?

Los modelos de proceso gaussiano (GPM) son un ejemplo de métodos basados ​​en el núcleo que se han aplicado con éxito a la clasificación de emociones o sentimientos. La tarea general del análisis de patrones es encontrar y estudiar tipos generales de relaciones (por ejemplo, grupos, clasificaciones, componentes principales, correlaciones, clasificaciones) en conjuntos de datos. Para muchos algoritmos que resuelven estas tareas, los datos en representación sin procesar deben transformarse explícitamente en representaciones de vectores de características a través de un mapa de características especificado por el usuario: por el contrario, algunos métodos solo requieren una función de similitud sobre pares de puntos de datos en representación sin procesar, lo que se llama kernel.

Temas que te pueden interesar  Regiones humanas aceleradas: ¿Qué nos hace humanos?

GPM se basa en sólidas bases de inferencia bayesiana, lo que les permite actualizar cuando se revelan nuevas pruebas. En comparación con otros métodos de regresión, proporcionan no solo una predicción de una función determinada, sino también una estimación de la incertidumbre de esta predicción.

En todas las aplicaciones anteriores de GPM a problemas de procesamiento de lenguaje natural, la elección del kernel más apropiado se hizo a priori, entre algunas funciones conocidas del kernel. Si bien existe un repertorio de núcleos disponibles en la literatura, la selección del más adecuado para un problema dado no es sencilla. Además, los núcleos suelen tener algunos parámetros, los llamados hiperparámetros, que deben ajustarse, lo que dificulta aún más el problema de selección del núcleo.

Ahora, un equipo de investigadores propone 1 un método que no se basa en un kernel especificado a priori. Encontrar la expresión del kernel es parte del proceso de selección del modelo. Esta es la primera vez que se ha utilizado GPM evolucionado para un problema de objetivos múltiples.

Temas que te pueden interesar  ¿Es la ruta intranasal utilizada por el SARS-CoV-2 para llegar a la fortaleza del cerebro?

El algoritmo de aprendizaje basado en programación genética

El algoritmo de aprendizaje que se utiliza, basado en programación genética, es capaz de aprender la expresión del kernel, junto con un conjunto de los hiperparámetros correspondientes. Estos núcleos evolucionados mantienen la conveniente propiedad de poder estimar la incertidumbre de las predicciones. Al utilizar un enfoque multiobjetivo, el algoritmo de programación genética evalúa los núcleos utilizando tres criterios diferentes. Dos de ellos miden la precisión del kernel y el tercer criterio minimiza el tiempo de cálculo necesario, penalizando así indirectamente la complejidad.

Temas que te pueden interesar  La tabla periódica, la forma de ordenar los elementos químicos

Más allá del análisis de sentimientos, otras tareas de análisis semántico, como la predicción del esfuerzo posterior a la edición, podrían abordarse utilizando este enfoque.

Fuente: Mapping Ignorance

conectate
16,985FansMe gusta
9SeguidoresSeguir
2,458SeguidoresSeguir
61,453suscriptoresSuscribirte
Lee, lee y lee
Noticias relacionadas