Lo que nos enseñó el catálogo de la muerte de la tarjeta sobre la migración de datos la nueva pila

Cuando pasamos a una nueva tecnología, ¿perdemos metadatos valiosos? ¿Se podrían introducir errores en el proceso de transferencia de datos de un medio a otro? Es un problema que la sociedad ya ha tenido que enfrentar —cuando las bibliotecas del mundo pasaron a catálogos digitales y en línea de sus sistemas antiguos basados en tarjetas de papel.

Tal vez haya algunas lecciones que aprender mirando este punto esencial de la transición de la forma física a la digital.

Este libro de abril Chronicle publicó The Card Catalog: Books, Cards, and Literary Treasures , un vistazo a los medios de almacenamiento de antaño. El Washington Post lo llama “un antídoto embriagador para la tecnofilia que amenaza nuestra cultura”, señalando que en 1969 la Biblioteca del Congreso estaba imprimiendo 79 millones de tarjetas de papel cada año. El New Yorker calculó una vez que en 1968 la Biblioteca del Congreso estaba distribuyendo “alrededor de mil tarjetas por minuto, por alrededor de cinco centavos por tarjeta”.

Pero a medida que las generaciones avanzaban, las cosas cambiaban.

Durante siglos, los catálogos de tarjetas eran la forma esencial en que las bibliotecas mantenían un registro de sus libros y del contenido de esos libros. Cada libro tenía su propia tarjeta, que detallaba —a veces manuscrita— el autor, la fecha publicada y otros datos pertinentes.

En 1986, otro artículo de Nueva York recordó ese “bleak” día de invierno cuando la Biblioteca Pública de Nueva York cerró su sala de catálogo de tarjetas para que pudiera reemplazar los 8.000 cajones de catálogo de tarjetas de roble con un elegante conjunto de 32 terminales de computadoras. Y una nueva cuenca se alcanzó hace menos de dos años cuando el Centro de Bibliotecas de Computadoras en Línea (OCLC) imprimió su última tarjeta de catálogo. Los había estado produciendo desde 1971, enviando hasta ocho toneladas de tarjetas de catálogo cada semana — y a lo largo de los años había impreso más de 1.900 millones de tarjetas. Pero con las bibliotecas que se trasladaban a catálogos en línea, ya no había suficiente demanda de tarjetas de papel impreso.

Pero el OCLC también había jugado un papel importante en la realización de esa transición, según este artículo de 1994 en el New Yorker del autor Nicholson Baker, ya que la organización sin fines de lucro también había estado transfiriendo viejas tarjetas de catálogo de la biblioteca a “forma legible por máquina” por una pequeña cuota. Baker había encontrado 60 personas trabajando ajetreadamente en colecciones de tarjetas de catálogo de 40 bibliotecas diferentes, incluyendo las bibliotecas públicas en Los Ángeles, San Francisco y Cincinnati.

Nicholson Baker se lamentaba de que las bibliotecas compraran “software reparador destinado a corregir el hash que las tecnologías anteriores han hecho de la información una vez almacenada de forma segura en el papel”.

“Las bibliotecas nos están confiando la historia de su colección de bibliotecas”, dijo Maureen Finn, de OCLC, quien dirigió el programa. En 1994, el programa había estado funcionando desde la década de 1970, y “En diecisiete años, nunca hemos perdido una tarjeta”.

Pero, ¿qué pasó con todas esas tarjetas antiguas, con todas sus notas adicionales y referencias “Ver también” dirigiendo a los clientes a otras partes de las colecciones de una biblioteca? Finn le dijo al neoyorquino que “la mayoría de los gerentes de bibliotecas con los que hablo dirán: ‘Los estamos almacenando porque hace que el personal se sienta bien, y nos desharemos de ellos’”.

Para 1994, millones de tarjetas estaban siendo destruidas cada año. Algunas bibliotecas incluso las convirtieron en papel rayado. Los catálogos de temas ya habían desaparecido en Dartmouth, Kent State, y la Universidad de Boston. El artículo también informó que “Una empresa de reciclaje llamada Earthworm, Inc., cargó la mayor parte de las tarjetas del MIT en 1989”. La historiadora Helen Rand Parish se quejó de que todo era comparable a quemar la Biblioteca de Alejandría.

Obviamente había un caso de uso para la transición a digital. Los catálogos en línea son más baratos, se puede acceder a distancia, y, señaló el neoyorquino, no cultivan moho, a diferencia del catálogo de tarjetas dañadas por el agua en una biblioteca de ingeniería en la Universidad de Toronto. Los catálogos en línea también eran más fácilmente accesibles para las personas en sillas de ruedas, y —tal vez lo más importante— había fondos gubernamentales para la conversión.

Sí, un estudio encontró que los preadolescentes tenían más problemas usando los catálogos en línea.

“La desafortunada verdad es que, en la práctica, los catálogos de tarjetas congeladas existentes… suelen ser reemplazados por bases de datos locales llenas de nuevos errores, son mucho más difíciles de navegar de manera eficiente, son menos ricos en referencias cruzadas y títulos de temas, carecen de carácter local, no agrupan títulos relacionados y autores de manera particularmente buena, y en muchos casos se les despoja de clases enteras de información histórica específica (por ejemplo, el precio original del libro, su fecha de adquisición, su fecha de catalogación original, su número de adhesión, las propias iniciales del catalogador original, el registro de cualquier copia que se haya retirado, y si se trataba de un regalo o una compra) que existía gratuitamente, sin utilizar espacio en disco o electricidad de sala de computadoras, sin necesidad de actualizaciones de software de precio o copias de seguridad diarias o llamadas de servicio de hardware…”

La OCLC —la organización sin fines de lucro que produce muchos de estos catálogos digitalizados— había ofrecido beneficios y descuentos especiales a los bibliotecarios que habían presentado nuevas entradas para libros que aún no estaban en su base de datos principal. El New Yorker consideró que esto incentivaba a los bibliotecarios del mundo a estar “comprometidos en la creación de una especie de comunidad virtual mucho antes de que hubiera cosas tales como Usenet y listservs, para bombear la creciente base de datos… una colaboración altamente democrática y omnidireccional entre cientos de miles de documentalistas aislados”.

En 1994 la base de datos de OCLC contenía 30 millones de registros — aproximadamente el 25 por ciento de la Biblioteca del Congreso, pero “la mayoría era obra de casi siete mil bibliotecas miembros”. Pero la calidad no siempre era perfecta — endemoniada por los listados adicionales superfluos para diferentes formas de indicar, por ejemplo, Tennyson o Alejandro Magno. Y en los primeros días, el engorroso proceso para corregir errores realmente requería una carta estampada enviada a través del servicio postal.

OCLC luego implementó una limpieza automatizada a través de su software de “Detección y Resolución Duplicada”, según Martin Dillon, director de la División de Gestión de Recursos de Bibliotecas de OCLC. “Cuando las bases de datos llegan a ser tan grandes como la nuestra la contribución de los humanos individuales está severamente limitada. La tarea es tan grande que ningún número práctico de humanos podría manejarla”.

Pronto otras compañías habían creado programas de corrección de errores para catálogos de bibliotecas digitales, lo que llevó a un estado que el Baker se lamentaba como bibliotecas que compraban “software correctivo destinado a corregir el hash que las tecnologías anteriores han hecho de la información una vez almacenada de forma segura en papel.”

El artículo ve un mundo que sufre de la “pérdida aleatoria de miles de libros como resultado de errores clerical cometidos al desmontar cada catálogo de tarjetas, clasificar y boxear y etiquetar sus tarjetas, y convertirlas en masa a forma legible por máquina —una especie de quema de libros incidental que no tiene llamas ni multitudes y, lo más extraño de todo, sin motivo… cada catalogador y persona técnica-servicios le pregunté admitió que ahora hay libros en su biblioteca que, debido a inevitables deslizamientos de una clase u otra, no están en el catálogo en línea que se supone que le ayudará a encontrarlos.”

Bibliotecas y creadores

Es muy fuerte leer ese artículo hoy, pero me ha dejado pensando que tal vez estos son el tipo de problemas que siempre surgen en el camino a más información que es más fácilmente accesible. Mi biblioteca pública local ahora tiene un catálogo en línea que no sólo me puede decir el número de llamada de un libro, pero si el libro está en realidad en los estantes. Y si no es así, el listado en línea también me puede decir qué otras sucursales pueden tener una copia. Incluso puedo pedir que tengan el libro para mí — todo en línea. Puedo hacer todo esto desde la comodidad de mi propia casa.

Open Nerd Nite SF: “¿A dónde fue el catálogo de la tarjeta? Bibliotecas y bibliotecarios del culo de hoy” por Sarah Houghton, 18/12/13 en Vimeo.

Houghton recordó al público que las bibliotecas de hoy en día son más que libros: “Las bibliotecas son una de las primeras instituciones que realmente abrazan de todo corazón el movimiento del fabricante”. Ofrecen impresoras 3D y equipos de producción de vídeo, y muchas ofrecen clases de electrónica. Algunos te permiten revisar todo, desde herramientas hasta semillas, instrumentos musicales, juguetes e incluso obras de arte. Las bibliotecas también organizan eventos para la comunidad — la Biblioteca Pública de San Francisco en realidad celebró un evento de “citas rápidas literarias”.

Tal vez lo último es que al final del día, los datos sólo existen como una herramienta para una misión más grande.

“Nuestra moneda es información”, dijo Houghton a su audiencia. “Así que si hay una tecnología que facilita la obtención de información, eso hace que nuestro trabajo sea mejor.

“Y ustedes son los beneficiarios de eso porque obtienen información más rápido y más fácil”.

  • La protesta pública hace que Microsoft revoque la sentencia de muerte por su software MS Paint, de 32 años.
  • ¿Puede salvarse el control de la misión del Apolo de aterrizaje lunar mediante una campaña de Kickstarter?
  • IEEE Spectrum lanza una lista interactiva definitiva sobre la popularidad de los lenguajes de programación.
  • Formación de una red neuronal para generar nombres británicos para las ciudades.
  • DeepMind IA de Google se enseña a sí mismo cómo caminar.
  • Advertencias sobre “El lavado de la IA“: el software que reclama tiene capacidades de inteligencia que no lo hace.
  • Cómo un evento de Pokémon Go en vivo fue arruinado por una red sobrecargada.

Video: Lo que nos enseñó el catálogo de la muerte de la tarjeta sobre la migración de datos La nueva pila