La polisemia facilita la comunicación humana pero se atraganta en las máquinas[divider_flat]

[divider_flat] En un escenario de comunicación ideal no debería haber espacio para la ambigüedad. Cada palabra debería tener un significado y sólo uno. Así, sin los quebraderos de cabeza de la polisemia y otras ambigüedades, cabe imaginar que sería mucho más fácil entenderse. Pero este es un escenario que afecta sólo a las máquinas, que toleran muy mal la ambigüedad. En Google, la Wikipedia y otros artefactos que procesan el lenguaje, ante la primera encrucijada semántica lo primero que hay que hacer es eliminar la ambigüedad (desambiguation), algo que las personas hacemos de forma natural y sin esfuerzo mediante el contexto.

¿Por qué todas lenguas tienen tantas palabras con múltiples significados? Pensemos, por ejemplo, en el verbo “pasar”, en el adjetivo “bajo”, en el sustantivo “pie” y en tantas otras palabras con decenas de significados diferentes. Si tenemos lenguas tan ambiguas es, probablemente, porque esto es lo más eficaz para comunicarse. Al hablante le interesa ser lo más eficaz posible: comunicar con un mínimo de  palabras y de esfuerzo, mientras que el oyente pretende entender correctamente lo que le dice el hablante.

En la comunicación humana, la ambigüedad no sólo no representa ningún problema, sino que es una ventaja. Esto es lo que argumenta un grupo de investigadores en un trabajo recién publicado en la revista Cognition.  En su artículo The communicative function of ambiguity in language sostienen que la ambigüedad del lenguaje es lo permite utilizar y reutilizar las palabras más eficaces, es decir, aquellas que tienen menos sílabas y una pronunciación clara.

Las lenguas, o más bien los cerebros de los hablantes, saben muy bien lo que se hacen, y por eso es mucho más ambiguo el verbo “poner” que el verbo, pongamos por caso, “desvencijar”. Los autores del trabajo de Cognition (Steven Piantadosi, Harry Tily y Edward Gibson) han confirmado en corpus de tres lenguas diferentes (inglés, alemán y holandés) que, efectivamente, las palabras más cortas, más usadas y de más fácil pronunciación son las que tienen más probabilidades de ser ambiguas.

Cognitivamente resulta más económico inferir el significado a partir del contexto que gastar tiempo en largas y complicadas sentencias para precisar lo que se quiere decir. La ambigüedad del lenguaje parece ser, por tanto, una gran ventaja para comunicarse entre personas. El desafío está ahora en que las máquinas sean también capaces de lidiar con el contexto para dominar la ambigüedades del lenguaje.

Foto: kiwaja / Flickr