Si alguien en este siglo se ha tomado muy en serio las palabras de Juan Carlos Onetti, cuando en su novela El pozo escribió que “… los hechos son siempre vacíos, son recipientes que tomarán la forma del sentimiento que los llene” es un investigador de la joven y emotiva disciplina conocida por el nombre de análisis de sentimientos o análisis sentimental. Sin cursilería alguna de por medio, lo que le interesa a todo científico en esta área es encontrar los sentimientos que inundan en especial ese recipiente de hechos y deshechos que es internet y sus redes sociales y, sin ser escritor ni crítico literario, o al menos sin tener que serlo necesariamente, en años recientes la exploración de los sentimientos en la literatura, novelas como El pozo incluidas, ha pasado a ser también objeto de su afecto o, por lo menos, objeto de estudio.

El analista sentimental alimenta a su computadora favorita con un número grande de documentos electrónicos (como e-mails, comentarios en Facebook o tuits),1 y en un proceso descrito, muy apropiadamente, como minería de datos programa esta máquina para que encuentre en las opiniones, preguntas, conversaciones y en el resto de los textos presentes en estos documentos (en la jerga de los “computólogos”: para que extraiga la información requerida) todas las palabras relacionadas con emociones positivas y negativas (como ejemplos de unas y otras pensemos en la alegría y el miedo), toma su caja de herramientas estadísticas, aplica algunas pruebas y concluye cosas como que el producto Galaver, con base en las reacciones emotivas que genera, tal vez se vendería mejor como antidepresivo que como antiácido. Y ya que hablamos de reacciones indeseables, puede que sea oportuno aclarar que tiene razón el lector con conocimientos de psicología a quien le disguste el desparpajo en etiquetar como sentimientos lo que bien sabe que son emociones, por lo que estrictamente tendríamos que hablar de un análisis emocional. La culpa es de estos insensibles analistas, pues ambos términos son empleados indistintamente por ellos y, con la venia de los analistas sentimentales/emocionales (y, esperamos, con el perdón de los psicólogos) haremos lo mismo en lo que resta de este texto (salvo al hablar expresamente de las seis emociones básicas de Ekman).


Ilustración: Oldemar González

Que el análisis sentimental ha demostrado ser redituable en términos económicos lo evidencia la proliferación tanto de las empresas que ofrecen este servicio como de las empresas que hacen uso de él para determinar si un correo debe marcarse automáticamente como spam, si la opinión mayoritaria de quienes vieron El último Jedi es de enojo ante (alerta de spoilers) la muerte de Luke Skywalker o si es mejor no impugnar la Ley de Protección y Trato Digno a los Animales que prohíbe las corridas de toros en Coahuila… no vaya a ser que el análisis sentimental arroje que los animalistas del resto del país se pondrían bravos y, en una de esas, hasta nos dejan sin fiesta ídem.

Que el análisis sentimental, como parte de las a veces llamadas humanidades digitales, pueda enriquecer a los estudios literarios de una forma original y trascendente, es lo que está actualmente a prueba. En defensa de esta hipótesis necesitamos tomar en cuenta que los estudios en este campo son bastante recientes e imposibles sin la existencia de internet y de los avances en la capacidad de memoria y velocidad de las computadoras en este siglo.

La polivalencia emocional de Shakespeare

Yago: Señor, sabéis que os aprecio.
Otelo: Así lo creo. Y, como sé que te mueve la amistad y la honradez y que mides las palabras antes de decirlas, esos titubeos me asustan mucho más…

—William Shakespeare, Otelo

La cronología futura del análisis sentimental como línea de investigación no podrá omitir un estudio de Eric T. Nalisnick y Henry S. Baird sobre los sentimientos exhibidos por los personajes de las obras de William Shakespeare.2 Nalisnick y Baird crearon un algoritmo (una receta de programación) para que, a partir del lexicón AFINN,3 determinara la intensidad de los sentimientos —clasificados únicamente como positivos o negativos— que, por ejemplo, despiertan en Hamlet el fantasma de su padre (8, comparado con el máximo de 31 de su querido amigo Guildenstern o el mínimo de -27 del odiado de su tío Claudio). El algoritmo también permitió a sus creadores visualizar mediante gráficas cómo cambiaban los sentimientos de cada personaje respecto a cada uno de los restantes con quienes interactúa a medida que se desarrolla la obra.

Así, únicamente con base en las gráficas generadas con este análisis por computadora, en el caso de los sentimientos entre Hamlet y su madre, la reina Gertrudis, se observa un punto de inflexión en el acto III, escena IV: alrededor de la línea dos mil 250 del original en inglés, la valencia de los sentimientos de Hamlet hacia su madre cambia de negativa a positiva (pasa de un despreciable -1 a un valor de 22, casi el triple que su respuesta emocional ante el fantasma de su padre, pero todavía bastante lejos del que se merece Guildenstern) y pasa lo opuesto con relación a los sentimientos de la reina hacia su hijo (se hunden de un valor de 1, que tampoco era como para considerarla un ejemplo de madre amorosa, hasta un pozo de -19). La computadora, por supuesto, no tiene inteligencia artificial que le permita entender que este cambio se debe a que ésa es la escena en la que Hamlet se da cuenta de que su madre nunca sospechó que el padre de Hamlet hubiese sido envenenado ni estuvo involucrada en este asesinato. Y, ¿a quién puede extrañarle que los sentimientos de una madre por su hijo se vean negativamente afectados al ver que éste asesina a un inocente (Polonio) y se pone a hablar con el aire (el fantasma de su esposo, a quien Gertrudis no puede ver)?

Una dinámica gráficamente muy distinta es la resultante del análisis sentimental de Romeo y Julieta: la valencia positiva de los sentimientos de ambos no hace más que aumentar desde que se conocen y hasta alcanzar cimas con valores mayores a 70. Ateniéndonos sólo a esto, el amor romántico en Shakespeare sobrepasa, por mucho, al amor filial y a la amistad.

Dinámicas sentimentales de otras parejas shakesperianas, como Otelo y Desdémona (Otelo) y Petruchio y Catalina (La fierecilla domada), no hacen más que validar lo que todo lector de Shakespeare sabe sobre los cambios que experimentan estos personajes durante cada obra, pero Nalisnick y Baird advierten que el análisis sentimental es incapaz de evidenciar la naturaleza verdadera de los sentimientos entre personajes como Yago y Otelo, en las que debemos “leer entre líneas” para comprender que es el odio en realidad el que se esconde detrás de las hipócritas palabras de aprecio de Yago. Las computadoras (aún) no entienden las ironías.

Miedo y asco en las novelas

Las imágenes talladas de estos shogoths nos llenaron a Danforth y a mí de horror y repulsión.
—H. P. Lovecraft, En las montañas de la locura

Pasando del teatro a las novelas, la automatización por computadora del análisis de los cambios en los sentimientos dentro de éstas puede evitar errores bochornosos a, entre otros, libreros que no pueden (ni quieren) leer todo el material que venden y que a veces no saben en qué sección de su librería colocarlo: ¿En el tiempo de las mariposas es una obra de divulgación o de ficción?, y en este último caso, ¿es de misterio, ciencia ficción, histórica o de qué otro género?

Spyridon Samothrakis y Maria Fasli analizaron tres mil 403 novelas en inglés, que forman parte de la biblioteca digital disponible gratuitamente en el Proyecto Gutenberg (www.gutenberg.org) y calcularon con un algoritmo el contenido emocional de cada oración del texto de cada novela con base en los valores de la lista provista por el lexicón Wordnet-Affect (este paso es equivalente al realizado por Nalisnick y Baird con el lexicón AFINN).4 De esta manera, los autores pudieron graficar para toda novela los cambios en la intensidad de las emociones; éstas se definen de forma similar a las valencias sentimentales en el estudio sobre Shakespeare, con la diferencia de que sólo toman valores positivos y son estimadas para cada una de las seis emociones básicas propuestas por el psicólogo Paul Ekman: ira, asco, tristeza, sorpresa, felicidad y miedo.

Si bien uno podría esperar que los promedios de los valores de diferentes emociones estuvieran asociados con diferentes géneros, los científicos determinaron que esto ocurría sólo en casos excepcionales, como con el miedo y las novelas de terror; fue precisamente este género el que tuvo mayor “contenido emocional” (valores más altos de la mayoría de las emociones y, sí, en especial en el miedo y sobre todo hacia la parte final de esas novelas), en tanto que las más bajas en emociones fueron las de ciencia ficción. Comparada con las emociones restantes, fue la alegría la que prevaleció en todas las novelas. Pero el resultado menos esperado fue que la emoción cuyos cambios y valores permiten distinguir de manera más clara entre distintos géneros es el miedo.

De la montaña rusa al carrusel: Los arcos emocionales de las historias

Las computadoras ahora pueden jugar ajedrez entonces no sé por qué no podrían asimilar esta curva tan difícil que ahora voy a dibujar para ustedes y sucede que ésta es la historia más popular en nuestra civilización occidental…
—Kurt Vonnegut

Es posible que el estudio más citado sobre análisis emocional sea el publicado por Andrew J. Reagan y sus colaboradores en junio de 2016, cuya conclusión se enuncia en el título: los arcos emocionales de las historias están dominados por seis formas básicas. Seis curvas, seis gráficas distintas que describen los cambios emocionales en casi toda la literatura universal.5 Es posible también que la historia detrás de este estudio ayudara a su popularidad, pues está inspirado en la intuición de Kurt Vonnegut de que las historias tienen formas que pueden ser graficadas sin mayor problema por una computadora (o por él mismo en un pizarrón, lo que uno puede ver en YouTube),6 hipótesis de lo que Vonnegut pretendía sería su tesis de maestría en antropología, de no haber sido rechazada de inicio por los miembros de su comité.

Haciendo suyas las palabras de Vonnegut cuando afirma que “No hay razón por la cual las formas simples de las historias no puedan ser alimentadas en las computadoras, son formas hermosas”, Reagan y su equipo reinterpretaron los cambios en Infortunio-Gran Fortuna (de los protagonistas) y Principio-Fin (de las historias) de los ejes de las gráficas del autor de Desayuno de campeones como Nivel de Felicidad que cambia y depende del porcentaje de cada historia analizada.

Ya en la tercera línea de la introducción a su artículo Reagan y colaboradores exhiben su creatividad al bautizar a nuestra especie como Homo narrativus (o, haciendo justicia taxonómica a nuestra relación con chimpancés y bonobos, con quienes tendríamos que compartir género, como Pan narrativus), pero incluso mucho antes que este estudio Roger y sus colegas habían nombrado como hedonómetro a su algoritmo para calcular en la computadora el nivel de felicidad obtenido con un análisis sentimental como los ya descritos al inicio de esta emotiva columna. La escala de su hedonómetro va de 1 a 9, equivaliendo 1 a una experiencia extremadamente negativa, 5 a una neutral y 9 a una extremadamente positiva. En todos los estudios de estos científicos la mayoría de los textos analizados con esta escala presentan valores hedonométricos entre 5 y 7 y una de sus gráficas más impresionantes es la que muestra la felicidad promedio diaria de los usuarios angloparlantes de Twitter de 2009 a la fecha, en la que el mínimo (5.77) corresponde al tiroteo masivo de Las Vegas del 2 de octubre de 2017 y los máximos (6.25 y 6.26) a las navidades de 2016 y 2017. La elección de Trump fue también un día triste en Twitter, con un valor promedio de 5.87 en la escala del hedonómetro.7

A semejanza de la gráfica hedonométrica diaria interanual de tuits, un libro típico, como Harry Potter y las reliquias de la muerte, puede asemejar una montaña rusa emocional, con numerosos máximos y mínimos, que dista mucho de las “formas sencillas” propuestas por Vonnegut, más parecidas al movimiento de los caballitos de un carrusel. Para lograr esto último Reagan y su equipo midieron la felicidad promedio de cada segmento de 10 mil palabras de texto de mil 327 historias de ficción en inglés, con una extensión de entre 20 mil y 100 mil palabras provenientes de la ya para nosotros familiar biblioteca del Proyecto Gutenberg, y con el fin de fortalecer sus conclusiones los científicos emplearon tres herramientas matemáticas distintas mediante las cuales llegaron, de manera independiente, a los mismos resultados. Lo que encontraron fue que la hipótesis de Vonnegut era correcta y que alguno de los seis arcos emocionales está presente en entre 80% y 94% de todas las historias estudiadas y que, adoptando algunos de los nombres propuestos por el novelista, clasificaron como: 1) “Harapos a riquezas” (aumento en el nivel de felicidad); 2) “Tragedia” o “Riquezas a harapos” (disminución en el nivel de felicidad); 3) “Hombre en un hoyo” (disminución-aumento); 4) “Ícaro” (aumento-disminución); 5) “Cenicienta” (aumento-disminución-aumento); 6) “Edipo” (disminución-aumento-disminución).

Para quienes, en el mundo de las letras, consideran que el análisis sentimental no tiene mayor aplicación, puede ser que otra de las conclusiones de este estudio sea de su interés: con base en el número de descargas de libros de los usuarios del Proyecto Gutenberg los tres arcos emocionales más exitosos son “Ícaro”, “Edipo” y “Hombre en un hoyo”. Por desgracia, son también los analistas sentimentales quienes nos advierten que conocer el arco emocional de una historia no nos da ninguna información sobre el argumento de ella y, mucho menos, de todo lo que hace que obras como Retrato del artista adolescente de James Joyce sea más, mucho más, que otra historia del tipo “Hombre en un hoyo”.8

 

Luis Javier Plata Rosas
Doctor en oceanografía por la Universidad de Guadalajara. Sus más recientes libros son: La ciencia y los monstruos. Todo lo que la ciencia tiene para decir sobre zombis, vampiros, brujas y otros seres horripilantes y El océano tiene onda. Una obra de ciencia ficción.


1 Entendiéndase por grande un volumen mayúsculo que contagia a este adjetivo y lo transforma en Grande, como en el original en inglés de Big Data y que se traduce no sólo en tamaño sino en velocidad con que se genera y almacena esta información. Pensar en grande en estos casos significa considerar, por ejemplo, todos (sí, todos) los tuits que Trump —nuestro villano favorito— y el mundo entero envían cada segundo de cada hora de cada uno de los 365 días de un año.

2 Nalisnick, E.T. y H.S. Baird, “Character-to-character sentiment analysis in Shakespeare’s plays”, Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, 2013, pp. 479-483.

3 Una lista en inglés de palabras relacionadas con sentimientos y calificadas con un entero entre -5 y +5 (lo que los psicólogos conocen como valencia emocional). Este lexicón fue creado entre 2009 y 2011 por el especialista en neurociencia y ciencias computacionales Finn Årup Nielsen.

4 Samothrakis, S. y M. Fasli, “Emotional sentence annotation helps predict fiction genre”, Plos One, e0141922, 2015, 10 pp.

5 Reagan, A.J., L. Mitchell, D. Kiley, C.M. Danforth y P.S. Dodds, “The emotional arcs of stories are dominated by six basic shapes”, EPJ Data Science, 5(31), 2016, 12 pp.

6 Kurt Vonnegut on the Shapes of Stories, visto más de un millón de veces desde su llegada a este sitio en octubre de 2010.

7 Esta gráfica puede consultarse en: www.hedonometer.org

8 Según el análisis de Matthew L. Jockers. Jockers no ha publicado aún este y otros resultados relacionados con la forma de los arcos emocionales en ninguna revista científica, pero proporciona a todo interesado el algoritmo que ha utilizado desde 2015 para analizar más de 40 mil novelas en: www.matthewjockers.net