Un estudio realizado entre 20 grandes autores en español concluye cuáles han enriquecido más su vocabulario con la madurez
¿Hasta qué punto existen diferencias entre los primeros libros de los escritores consagrados, publicados en su juventud, con sus últimas obras? ¿Qué cambios se producen en su manera de escribir tras una vida dedicada a la creación literaria? ¿De qué modo evoluciona su estilo y el uso que hacen del lenguaje?
Para responder a estas cuestiones, el portal Definicion.de, en colaboración con investigadores especializados en lingüística, ha analizado la evolución del uso del vocabulario en 20 de los más célebres escritores en español, desde Gabriel García Márquez e Isabel Allende hasta Julio Cortázar o Gabriela Mistral.
El objetivo era investigar si la diversidad léxica de estos escritores aumenta o disminuye a medida que desarrollan sus carreras literarias. Mediante el uso de novedosas herramientas de inteligencia artificial y procesamiento del lenguaje natural, se analizaron 40 libros de estos autores, en cada caso una obra temprana y otra de su etapa madura, con resultados sorprendentes.
La madurez enriquece el uso del lenguaje literario
Para la elaboración del primer estudio de este tipo mediante la IA, se creó una base de datos que incluía un total de 3.103.274 palabras procedentes de los 40 libros seleccionados. Con la finalidad de medir la diversidad léxica, se aplicó un proceso de lematización, que agrupa las palabras en sus lemas base, lo cual reduce la influencia de las variaciones de palabras usadas en sus diferentes formas.
El análisis revela que la mayoría de los autores analizados aumentó la riqueza léxica en sus obras más recientes, en comparación con sus primeros libros. De los 20 escritores estudiados, 13 mostraron un aumento en la diversidad léxica en sus últimas obras, lo que representa el 65 %. Es el caso de autores como Javier Marías o Paulo Coelho, que entre sus primeras y últimas obras incrementaron en más de un 10 % la variedad del vocabulario empleado.
En contraste, 7 autores presentaron una mayor diversidad léxica en sus primeras obras, lo que constituye el 35 % del total. El autor cuya puntuación de diversidad léxica más disminuyó con el tiempo es el mexicano Carlos Fuentes, cuya riqueza de vocabulario se redujo un 10 % de sus obras de juventud a sus últimos libros.
De todas formas, los responsables del estudio han aclarado que la riqueza de vocabulario no siempre equivale a una mayor calidad literaria o éxito con el público. Un ejemplo es la novela «El alquimista» de Pablo Coelho, que pese a registrar el menor índice de diversidad léxica del estudio, es una obra con más de 85 millones de copias vendidas en todo el mundo.
“Esta investigación abre nuevas perspectivas para el estudio de la literatura mediante las modernas herramientas tecnológicas. Permitirá a los lingüistas y estudiosos de otras disciplinas entender mejor las obras de los grandes autores de todos los tiempos, la evolución de su escritura y, sobre todo, plantearnos nuevas preguntas de gran interés sobre el proceso de creación literaria”, explica Julián Yanover, creador de Definicion.de y responsable del estudio.
¿Qué autores hacen un uso más rico del vocabulario?
El estudio arroja otros datos de interés para el análisis literario, como el hecho de que la extensión de los primeros libros de estos autores apenas varía respecto a la de sus últimas obras. Por otro lado, escritores como la española Almudena Grandes mantuvieron altos niveles de diversidad léxica entre el principio y el final de su carrera literaria, mientras que en el caso de escritores como Javier Marías se observan importantes variaciones entre el primer y el último libro analizado.
La cubana Zoé Valdés (98,4 %), el español Arturo Pérez-Reverte (96,8 %) y el argentino Jorge Luis Borges (96,4 %) son los escritores que obtienen las máximas puntuaciones en cuanto a riqueza léxica en el estudio realizado por Definicion.de.