Cómo mejorar las decisiones en grupo gracias a la lingüística computacional

Cuando se pide a una persona que exprese su opinión sobre cualquier asunto es frecuente encontrarse con respuestas como "no está mal" o "está bastante bien". Pero, ¿qué significan exactamente estas expresiones? ¿Que ese algo es bueno, muy bueno o malo?

Artículo basado en resultados de investigación de Nuria Agell

Entender lo que alguien quiere decir con "no está mal" o "está bastante bien" puede parecer trivial. Sin embargo, en el campo de la investigación lingüística computacional, estas expresiones del lenguaje humano se definen, a nivel técnico, como conjuntos de doble jerarquía de términos lingüísticos difusos y dubitativos. Parece complicado, ¿verdad?

La lingüística computacional es un campo interdisciplinario dedicado al procesamiento del lenguaje natural que, a través de la computación, persigue mejorar la interacción entre el ser humano y las máquinas.

Las aplicaciones en este campo de investigación son amplias. El grupo de investigación Judgements and Decisions in the Marketplace, liderado por Nuria Agell, centra parte de su investigación en desarrollar herramientas matemáticas para analizar la complejidad de las expresiones lingüísticas que utilizan las personas responsables de tomar decisiones. El grupo, a través de estas herramientas lingüísticas, busca mejorar el nivel de consenso en la toma de decisiones grupales.

En su estudio Free double hierarchy hesitant fuzzy linguistic term sets, Agell expone la utilidad de este método a partir del análisis de un caso basado en la gestión turística de Barcelona.

Do Better: ¿Puede explicarnos qué son los conjuntos de doble jerarquía de términos lingüísticos difusos y dubitativos

Nuria Agell: Cuando las personas evalúan, por ejemplo, a un candidato que se presenta a una vacante, se expresan utilizando sus términos favoritos como, por ejemplo, "no está mal". El término "mal" es vago o difuso porque no tiene unos límites claros. Pero el conjunto de la expresión "no está mal" no solo es difuso, sino también dubitativo porque no indica claramente si la persona es "buena" o "muy buena".

El término "mal" es vago porque no tiene unos límites claros

La doble jerarquía implica utilizar expresiones adicionales –como "extremadamente buena"–  para ofrecer más precisión a la hora de analizar los datos. Volviendo al ejemplo del candidato, en nuestro modelo pedimos a los evaluadores que calificaran a los candidatos utilizando la escala de Likert en dos fases. Primero les pedimos que puntuaran a los candidatos utilizando términos de primera jerarquía (“malo”, “regular”, “bueno”, “perfecto”) y, posteriormente, que también los evaluaran con expresiones adicionales como “ligeramente”, “bastante”, “muy”, “inusualmente”, “extremadamente”, etc.

En modelos anteriores, los evaluadores solo podían expresarse utilizando los términos fijos que se les proporcionaban en lugar de expresiones con las que podrían sentirse más cómodos. En nuestro modelo utilizamos esta doble jerarquía para ofrecer a los evaluadores más opciones entre las que elegir. Esta ampliación permite capturar, con más precisión, las opiniones y evaluaciones de las personas responsables de la toma de decisiones.

¿Cómo puede aplicarse esta herramienta lingüística a la toma de decisiones en grupo?

Existe un método que se utiliza, con mucha frecuencia, en la toma de decisiones que implican criterios múltiples. El método, denominado TOPSIS, en nuestro ejemplo tendría como punto de partida a un candidato ideal. A través de este método se definirían unos parámetros: el candidato ideal tiene que hablar inglés con fluidez, ser hábil en las matemáticas, etc. Una vez definido el perfil se compararía este candidato ideal con las evaluaciones de grupo de los candidatos reales y se generaría una clasificación.

En nuestra investigación adaptamos el método TOPSIS para que pudiera utilizarse con los conjuntos de doble jerarquía de términos lingüísticos difusos y dubitativos. 

Nuestro método ofrece un resultado más preciso a la hora de calcular el nivel de consenso en las decisiones grupales

¿Qué significa esto a nivel práctico?

Implica que la clasificación que se genera a partir de los evaluadores mediante TOPSIS podría utilizarse en situaciones en las que los participantes empleen diferentes niveles de términos lingüísticos, un aspecto crucial cuando se usa el lenguaje natural. Nuestro método proporciona un resultado más preciso a la hora de calcular el nivel de consenso en las decisiones grupales. El sistema permite obtener una clasificación de las posibles alternativas y determinar el grado de consenso al que ha llegado el grupo de evaluadores en la puntuación de cada candidato.

La simulación descrita en el estudio aborda un tema muy actual: la relación entre los residentes de Barcelona y los turistas...

En nuestro análisis construimos una simulación basada en datos ficticios para determinar qué atracciones turísticas han adoptado mejores políticas de gestión. Analizamos cinco de los destinos turísticos más famosos de la ciudad –la Sagrada Familia, el Camp Nou, el barrio de Ciutat Vella, el Parque Güell y el Tibidabo–, combinando las distintas evaluaciones de cuatro expertos simulados:

  • un edil del ayuntamiento
  • un portavoz de una asociación de vecinos
  • un dirigente de un sindicato de agencias de turismo
  • un representante del sector servicios

Los criterios de evaluación de las políticas de gestión incluían precio, accesibilidad, ruido y afluencia. Después de aplicar nuestra herramienta descubrimos que la gestión del Parque Güell era la más eficaz, mientras que la Sagrada Familia y el barrio de Ciutat Vella debían esforzarse más para mejorar la relación entre turistas y residentes. 

Este método podría ayudar a resolver muchos debates.

Eso creemos, pero todavía queda mucho por hacer. Nuestro método también podría ser muy útil para la interacción entre personas y máquinas. Queremos que los asistentes personales, como Siri y Alexa, sean capaces de comprender distintos matices cuando los usuarios expresan opiniones como "esto no está mal".

¿Cuáles son sus futuras líneas de investigación?

Uno de los retos de nuestro método es cómo medir la indecisión. Las personas no siempre usamos más de un término, por lo que todavía debemos encontrar formas de cuantificar estos niveles de indecisión.

Nuestro siguiente paso es aplicar este método a un problema real para observar cómo el sistema mide la indecisión. Estamos entusiasmados porque, por primera vez, vamos a intentar adoptar un planteamiento experimental realizando pruebas reales en el Decision Lab de Esade.

Todo el contenido está disponible bajo la licencia Creative Commons Reconocimiento 4.0 Internacional.