En un texto con este título y un pie en las ciencias y otro en las humanidades (sí, es verdad, a veces, más que pie, pezuña; pero mejor no pisar de más estas arenas movedizas metatextuales), es encomiable el escepticismo de todo aquel que quiera escribir un libro exitoso —dicho esto en términos, en extremo banales pero empíricamente medibles, de ejemplares vendidos— y que, en su dualidad lector/escritor bisoño, desconfíe de consejos más propios de un taller literario de cuarta que de una revista como nexos.

La misma ciencia que ha logrado avances deslumbrantes e inútiles (en la percepción de más de uno), ha mostrado por fin que, cuando algunos de sus practicantes dejan de pensar en la luna y en cómo (no) fotografiar un agujero negro, o en osos polares y cambio climático, o en maravillas cuánticas y nanotecnología, cuando finalmente reúnen todas sus neuronas y todos los Big Data pertinentes, y se concentran en hacer ciencia para el máximo bienestar social de escritores y editoriales (baby steps: el progreso será gremio por gremio, industria por industria… o no será), a veces lo consiguen.

Ilustración: Oldemar González

Es así como, en los próximos párrafos (en este no, pero no desesperen) el lector encontrará varios consejos provenientes de modelos matemáticos que permiten predecir si el libro que tiene en mente —o que ya está escribiendo— se convertirá en un best seller. Y todo gracias (que los autores de estos modelos tampoco esperen una ovación de pie) a la aplicación de herramientas estadísticas inútiles por más de cuatro siglos para cualquier escritor de no ficción que no tenga en sus miras escribir un libro de divulgación sobre el tema o una biografía sobre Gauss, o para cualquier escritor de ficción más interesado en narrar la relación otoñal, sorpresiva y cuestionable (son Me Too Times) entre un(a) maestro escritor(a) y su alumno(a), que en (re)imaginar la vida real de un profesor complejo (chiste tonto matemático: un número complejo tiene una parte real y otra imaginaria).

Quizás la mayor de las grandes ventajas tecnológicas que este siglo ofrece al escritor posmoderno sea internet y su infinita capacidad para mantener en contacto a cada autor con sus fans, que así pueden seguirlo en su gira de presentaciones por ferias de libros y otros eventos masivos de interacción in vivo. Y es que, cuando de redes sociales se trata, por fortuna no todo en la red es Twitter y Facebook. Los escritores cuentan también con Goodreads… y con los científicos interesados en determinar cómo el comportamiento de los usuarios de esta comunidad virtual puede servir para pronosticar si estamos o no en presencia de un autor de altos vuelos (lo que, como ya dijimos, significa un libro de altas ventas).

Como las ciencias de la computación ignoran lo que es austeridad en el almacenamiento y tratamiento de la información (¿quién quiere limitarse tan sólo a una muestra, por grande y representativa que sea, toda vez que se cuente con la totalidad de los datos y con computadoras para analizarlos?), Suman Kalyan Maity y sus colegas en este campo capturaron todos los datos sobre autores, libros y lectores disponibles públicamente en Goodreads y correspondientes a un periodo de nueve años (de 1995 a 2016), lo que se traduce en más de 300 mil autores y más de medio millón de libros. Estos investigadores recolectaron también las listas anuales de best sellers de Amazon, junto con 2000 reseñas y calificaciones relativas a estos títulos.

Maity y su equipo tomaron en préstamo a los físicos el concepto de entropía (una medida del grado de desorden de un sistema), adaptándolo a terrenos literarios para definir a la entropía de puntaje como una medida de qué tan variables son las calificaciones que los usuarios de Goodreads dan a cada libro. De los biólogos tomaron en préstamo el concepto de diversidad, redefiniéndolo como diversidad de estantería, cuyo valor aumenta a medida que lo hace el número de “estantes” virtuales (que son tres: “leído”, “leyendo” o “por leer”) en que son colocados los libros por cada usuario. Ambos préstamos son indicadores de la popularidad de la que goza una obra, y Maity y su equipo determinaron que los best sellers de Amazon tienen una entropía de puntaje y una diversidad de estantería mucho mayores que aquellos libros que no cumplieron con las expectativas de ventas.

Al añadir 15 características del estatus de cada usuario (como la velocidad media de lectura y número de lectores actualizando su estatus), estos científicos de la estadística literaria pueden predecir con una exactitud de casi el 90% si, tomando como base su popularidad entre los lectores de la comunidad de Goodreads, una obra alcanzará el paraíso amazónico de las superventas.

Dado que es seguro que más de un lector/escritor desee que su ingreso al club de los best sellers se deba más a la calidad literaria de su libro que a que éste comparta características más cercanas a Los siete hábitos del novelista altamente efectivo y obras por el estilo, puede que sea de su interés un estudio de los científicos computacionales Vikas G. Ashok, Son Feng y Yejin Choi, quienes se basaron en elementos estilísticos para predecir el éxito de una novela. Para ello se valieron de cinco mil de los más de 40 mil los libros digitalizados que forman parte del proyecto Gutenberg y que están disponibles de manera gratuita en la red.

Ashok y colaboradores consideraron por lo menos 50 de los libros más exitosos (en términos del número de veces que han sido descargados) y 50 de los menos exitosos en cada uno de ocho géneros literarios (entre éstos: misterio, ciencia ficción y aventuras). Dado que la gran mayoría de las obras del proyecto Gutenberg no son novedades literarias, los científicos asumieron que el número de descargas indicaba éxito basado en calidad literaria, y no en popularidad exenta de calidad.

En cada género fue posible distinguir las clases de palabras más usadas por libros exitosos de aquellas empleadas por libros no exitosos. En el género de aventuras, por ejemplo, los libros menos exitosos empleaban más aquellos verbos que describen explícitamente acciones o emociones (por ejemplo, tomar, querer y llorar) y palabras que son casi un cliché (como amor), mientras que los más exitosos favorecían verbos que describen procesos mentales (por ejemplo, recordar y reconocer) y usaban más frecuentemente conectivos y preposiciones.

De manera general, los libros más exitosos se caracterizan por tener un mayor porcentaje de preposiciones, nombre, pronombres, determinantes y adjetivos, y los menos exitosos por un mayor porcentaje de verbos, adverbios y palabras en otros idiomas. Y, de manera inesperada para los autores del estudio, hubo una asociación inversa entre legibilidad y éxito literario: entre menos legible, más exitoso, lo que no quiere decir que lo segundo sea consecuencia de lo primero y que, para alcanzar el éxito, debamos pensar en una novela cuya lectura sea sólo factible si es parte de un proyecto de investigación con beca. Para Ashok y sus colegas, la razón de este, en apariencia, sorpresivo resultado, es que la complejidad conceptual de obras de alta calidad y éxito literario requiere a su vez de una alta complejidad sintáctica, lo que juega en contra de su legibilidad, y qué mejor ejemplo de ello que Joyce y su Finnegans Wake.

Al considerar todas las características descritas, el modelo estilométrico de Ashok & Co. permite predecir el éxito literario con una exactitud de más del 80%, con una que otra excepción… El fracaso más notorio es el caso de Hemingway y El viejo y el mar, pues su estilo minimalista, con un 70% de oraciones simples provoca que sea arrojado humillante y falsamente entre los menos exitosos.

Quienes alcancen las alturas de las listas de best sellers no deben confiarse; aunque como logro per se es envidiable por algunos hermanos de letras —y reconocible, a veces, por muchos menos—, las ventas anuales varían bastante dependiendo de si se está cómodamente enlistado varios meses o si, por el contrario, se trató de una aparición fugaz de una(s) semana(s).

En busca de una fórmula que permita predecir cuántos ejemplares se venderán una vez que un libro se convierte en best seller, físicos y científicos computacionales (estos últimos han dominado literal y literariamente este texto), encabezados por Burcu Yucesoy, identificaron la dinámica de los casi cinco mil títulos que formaron parte de la lista semanal de The New York Times entre agosto de 2008 y marzo de 2016: qué géneros literarios fueron los más vendidos, cuántas semanas apareció cada título y sus ventas totales, las diferencias de ventas entre ficción y no ficción y en distintas temporadas vacacionales y el género de los autores más vendidos en cada género literario, entre otras características.

Con esta información, Yucesoy y su equipo encontraron que las ventas de todos los best sellers siguen un patrón universal, cuyo comportamiento es descrito por una ecuación alimentada con tres parámetros definidos por estos científicos: 1) el fitness de la obra, que es el valor que el lector da al libro y que depende de factores como el prestigio y el estilo de escritura del autor, el esfuerzo de mercadeo y hasta la calidad de la portada del libro; 2) el apego preferencial, que es el efecto que un libro que se vende bien tiene de atraer aún más ventas, y que está en función de las recomendaciones y reseñas de amigos, críticos y celebridades; y 3) el añejamiento, hasta las mejores obras tienen que abandonar la mesa de novedades y van perdiendo su notoriedad entre el público con una tasa de decaimiento que varía con el tiempo con una rapidez exponencial y que determina la longevidad del libro (su permanencia) en la lista de best sellers.

El poder predictivo de la fórmula estadística de Yucesoy y compañía es tal que, una vez determinados los tres parámetros con base en las ventas de un best seller en sus primeras semanas, es posible calcular con exactitud el número total de ejemplares que de ese libro se venderán en los próximos meses, lo que por supuesto es de gran utilidad para las editoriales. En contraste, una limitante del modelo —que, sin embargo, puede jugar a favor del autor de un futuro best seller— es que no puede considerar eventos inesperados —como el ser llevado al cine o mencionado por algún famoso o influencer— que lo manden directo a los más vendidos o lo regresen o mantengan ahí por más tiempo.

Una vez armados con estos modelos estadísticos, no queda más que desear el éxito a todos los que tienen un libro en la cabeza o bajo el brazo.

Nos vemos en la próxima lista de best sellers.

 

Luis Javier Plata Rosas
Doctor en oceanografía por la Universidad de Guadalajara. Sus más recientes libros son: La ciencia y los monstruos. Todo lo que la ciencia tiene para decir sobre zombis, vampiros, brujas y otros seres horripilantes y El océano tiene onda. Una obra de ciencia ficción.