Els bots de conversa tenen una llarga i venerable història que data de la dècada de 1960 i la famosa bot Eliza que va enganyar a algunes persones que van creure haver conversat amb un humà. Des de llavors, els programes informàtics parlants són cada vegada més avançats, capaços d'entendre el context i respondre de manera apropiada. Però la capacitat de reproduir la parla humana de manera convincent segueix sent un repte per aquests programes. En parlar amb un d'ells ningú triga a adonar-se que es tracta d'una màquina. Una de les raons és que els ordinadors són incapaços d'entendre el contingut emocional de les converses i empatitzar de manera adequada. Aquesta manca d'intel·ligència emocional acaba delatant inevitablement als bots de conversa.
Però això podria estar a punt de canviar gràcies a la feina de l'investigador de la Universitat Tsinghua a Pequín (Xina) Hao Zhou i diversos companys, que han desenvolupat un bot de conversa capaç d'avaluar el contingut emocional d'una conversa i respondre en conseqüència. El treball podria donar lloc a una nova generació de brossa de conversa amb coneixements emocionals. La investigació detalla:
"Pel que ens consta a nosaltres, aquest és el primer treball que aborda el factor emocional en la generació de conversa a gran escala".
Els psicòlegs solen classificar les emocions en sis categories bàsiques: alegria, tristesa, fàstic, ira, sorpresa i por. I els humans les transmetem amb paraules que tenen un significat emocional específic. La manera en què aquest significat canvia durant una conversa permet mesurar del contingut emocional. Per exemple, paraules com "riure" i "somriure" estan associades amb l'alegria, "depriment" i "plorar" amb la tristesa, i així successivament. De fet, els psicòlegs han generat enormes taules que descriuen la valència emocional de les paraules.
Aquest és precisament el tipus de base de dades que fan servir algunes apps per determinar si un tuit és positiu o negatiu, una tècnica coneguda com anàlisi de sentiment. De fet, els sociòlegs poden estudiar la manera en la qual canvia la càrrega emocional durant novel·les completes. Hao i el seu equip han emprat la mateixa tècnica per analitzar i controlar el contingut emocional de les converses. Aquesta tasca consta de dues parts.
La primera consisteix a analitzar el contingut emocional de la conversa de l'usuari humà amb tècniques similars a l'anàlisi de sentiment. Però la segona part és més complicada, ja que consisteix a generar respostes que resultin rellevants però també emocionalment apropiades.
El mètode de l'equip d'Hao és bastant senzill. Els investigadors van començar amb un conjunt de dades de 23.000 frases recopilades del servei del blog xinès Weibo i van anotar la seva càrrega emocional manualment per a la ira, el fàstic, l'alegria, la tristesa o una càrrega addicional associada amb alguna cosa que agradi a l'usuari. (Van ignorar la sorpresa i la por, que són relativament rares).
L'equip va emprar aquest conjunt de dades per entrenar un algoritme de aprenentatge profund per classificar frases d'acord al seu valor emocional.
Finalment, es va utilitzar un generador de bots de conversa convencional per produir respostes mentre l'algoritme d'aprenentatge profund garantia que les respostes tenien les emocions correctes. Han batejat al seu sistema com
Màquina de XAT Emocional.
Per exemple, per respondre a l'afirmació: "El pitjor dia de la meva vida. He arribat tard per culpa del trànsit", la Màquina de XAT Emocional pot generar diferents respostes, en funció de l'emoció requerida. Per l'alegria, respon: "Segueix somrient! Les coses milloraran". Enfront de la tristesa, respon: "Que depriment!". Al fàstic, diu: "A vegades la vida és un fàstic". I a la ira, respon: "El trànsit està fatal!" I per expressar gust, diu: "Sempre sóc aquí per recolzar-te".
És un treball interessant que podria tenir importants aplicacions. La capacitat d'empatitzar (o de donar la sensació d'empatia) és un important component de les comunicacions humanes. Diversos estudis han demostrat que els humans tenim moltes més probabilitats de tenir una reacció positiva a una conversa empàtica. I això, per descomptat, resultaria molt útil en contextos com els centres de trucades.
Font: MIT Technology Review