El índice de concordancia: ¿origen de las humanidades digitales?.

El Padre Busa trabajando con ordenadores IBM

Leo a Bravo Ramón recordando que una de las primeras manifestaciones de las humanidades digitales ocurre en 1949, cuando el sacerdote italiano, Padre Busa solicita el apoyo a IBM, para elaborar un índice de concordancia (lista ordenada y clasificada por frecuencia de los términos que aparecen en un corpus de obras) de las obras completas de Santo Tomás de Aquino de más de 11 millones de palabras. Este índice, denominado como Index Thomisticus comenzó a ser elaborado (registrado sería mejor término) en tarjetas perforadas (las fichas Hollerith que todos estudiábamos en Informática en los años 80 y que ahora parecen antediluvianas).

Lo cierto es que al Padre Busa le hicieron caso en IBM, la empresa que monopolizó prácticamente todos los desarrollos informáticos desde que se construyó la primera máquina que podría llamarse "ordenador" (Mark I, de IBM, fue el primer ordenador electromecánico, utilizado en la II Guerra Mundial y posteriormente enviado a Harvard en 1944; tenía 760.000 ruedas y 800 kilómetros de cable y se basaba en la máquina analítica de Charles Babbage, de la que tenemos noticia gracias a una gran mujer, Lady Ada Lovelace, prácticamente la madre de la informática).

tarjeta perforada Hollerith

El registro en tarjetas perforadas pasó casi treinta años después a plasmarse en un CD-ROM y hoy es accesible en internet. La elaboración de un índice de concordancia tiene un nombre en Lingüística,lematizar,proceso que significa determinar la forma de una palabra que se constituye en lema" y que viene a ser elegir el tema que "representa" a las distintas formas en la que se puede presentar una palabra (números, géneros, etc.).

Curiosamente, los primeros sistemas de recuperación de información utilizaban procesos de lematización para construir sus índices que sirvieran de apoyo en las búsquedas. Esto se hacía porque la potencia de esos ordenadores era muy escasa y se necesitaba optimizar la extensión de esos índices con el objeto de aminorar el tiempo de búsqueda. Si bien esto ha evolucionado mucho, estas estructuras de índices también fueron utilizadas por los primeros motores de búsqueda en internet. Esta línea de pensamiento nos lleva a plantearnos que las Humanidades Digitales no son tan "actuales" como puede parecer, se lleva trabajando en ello muchos años (prácticamente los mismos que la Informática puede considerarse una ciencia) propiciando desarrollos posteriormente aplicados en otros muchos ámbitos y que han llegado a ser de uso común sin que "el pueblo" llegara a saberlo (eso es i+d+i pero sin "bata").