DOI: ¿Sí o no?

Priscilla Caplan

"DOI: ¿Sí o no?"
The Public-Access Computer Systems Review 9, No. 1
(1998)

Escribí este artículo en diciembre pasado, pero llevó tanto tiempo fijar la fecha de su publicación que tuve que actualizarlo y entregarlo otra vez para el número siguiente. Esto nos indica dos cosas: que el tiempo de procesamiento de las revistas electrónicas todavía es más largo de lo que quisiéramos y que las cosas cambian rápido en el mundo del DOI.

DOI significa Digital Object Identifier (Identificador de Objet Digital Object Identifier (Identificador de Objetos Digitales), que no es sólo un identificador sino un sistema completo para asignar, mantener, resolver y utilizar identificadores permanentes. (Como existe la posibilidad de una confusión semántica, trataré de hacer una distinción entre el “sistema DOI” y el “identificador DOI”.) El sistema fue desarrollado originariamente para la Association of American Publishers por R.R. Bowker y la Corporation for National Research Initiatives (CNRI), pero ahora lo administra la International DOI Foundation, una organización con membresía sin fines de lucro con sede en Nueva York y Ginebra. El objetivo es facilitar el comercio digital manteniendo lazos permanentes con el titular de los derechos de un objeto digital.

Una de las cosas engorrosas de los URL es que cambian cuando se mueve un documento. Si el URL aparece en cientos de referencias de páginas Web o registros de catálogos, hay que cambiar todas esas referencias o incurrir en el temido mensaje "404 File not found" (No se encontró el archivo buscado) del navegador. Sin embargo, si se utiliza algún otro identificador en todas esas referencias y si ese identificador lleva a un directorio que mapea desde el identificador al URL del documento, el problema se reduce notablemente. Cada vez que se mueve el documento, sólo hay qumueve el documento, sólo hay que localizar y cambiar la única entrada del directorio y no todas las referencias hacia él. Todos los proyectos para ofrecer continuidad, desde los PURL a los URN, se basan en esta idea de mapear desde identificadores arbitrarios a ubicaciones reales. El mapeo se llama “indirección” y el acto de obtener otros datos (como un URL) a cambio de un identificador se llama “resolución”. (Ver el glosario al pie para la identificación de las siglas.)

Quiero tomar tu... información

Como está instrumentado actualmente, el DOI depende del software Handle System de CNRI para mantener el directorio y proveer resolución. Básicamente, cuando se le da un identificador al Handle System, éste incluye en la respuesta algún dato más. En el sistema DOI, el resultado depende de la editorial que registró el identificador. Puede ser el URL del objeto, de un formulario de pedido del objeto o de una pantalla de información sobre derecho de autor. Esto puede ser confuso porque tenemos que distinguir entre el objeto al cual se refiere el identificador DOI (el objeto en sí) y el resultado de una búsqueda, que en teoría podría ser cualquier otro dato asociado con el objeto.

El identt>

El identificador es una cadena alfanumérica con un prefijo y un sufijo, separados por una barra. El prefijo tiene dos elementos separados por un punto. El primer elemento identifica al “Administrador de Directorios” o autoridad de direccionamiento y el segundo al editor o agente responsable del sufijo. Este es esencialmente arbitrario mientras sea único, aunque se está diseñando un estándar para formatear sufijos. En el ejemplo mencionado en la home page del DOI, el identificador completo es "10.1002/[ISBN]0-471-58064-3". El Administrador de Directorios es "10", el agente que asigna el sufijo es "1002" y el sufijo es "[ISBN]0-471-58064-3". Aunque el propósito original era instrumentar un sistema distribuido de directorios, los planes actuales requieren un solo Administrador de Directorios. Se están llevando a cabo negociaciones para que ISBN International asuma esta función, que incluye administrar el directorio y supervisar la distribución de prefijos.

La iniciativa DOI, por supuesto, tiene como fin algo más que simplemente proveer continuidad. Si eso fuera todo, los editores podrían haber instalado un servidor PURL con mucho menos trabajo. La International DOI Foundation espera construir un sistema completo para administrar los permisos y cuenta con grupos de trabajo que est&aacut con grupos de trabajo que están abordando varios aspectos relacionados con el tema, tales como políticas, solicitudes, metadatos descriptivos y metadatos para la administración de derechos.

Así que no tiren nada y empiecen a asignar identificadores DOI a todos los documentos que tienen en el servidor Web: este es un pedido especial para las editoriales y los titulares de derechos. Antes de solicitar un prefijo hay que inscribirse en la International DOI Foundation y aceptar las cláusulas y condiciones, como asignar solamente un DOI a los objetos sobre los cuales tienen derechos electrónicos y que residen en los servidores que Uds. controlan. No es gratuito: el prefijo cuesta U$S1000, con un arancel anual adicional basado en el número de identificadores registrados para ese prefijo en el sistema DOI.

La importancia de llamarse “URN”

Entonces, ¿el identificador DOI es un URN? Buena pregunta. El grupo de trabajo URN del Internet Engineering Task Force definió una arquitectura para la resolución de nombres y un conjunto de requisitos sintácticos mínimos para un identificador. Además, le corresponde a las distintas comunidades que utilizan Internet definir los identificadores dentro de sus propios espacios de nombres. Clifford Lynch, enacios de nombres. Clifford Lynch, entre otros, demostró que -con los prefijos apropiados- los ISBN, ISSN, SICI y otros identificadores bibliográficos estándar pueden adaptarse al marco URN. (Véase "Cómo obtener más información" a continuación.) Supuestamente, el identificador DOI también puede hacerlo. La mayoría de los que critican este sistema consideran que el DOI es una implementación del URN, pero algunos miembros del Grupo de Trabajo URN dudan acerca de si el Handle System de base es totalmente compatible. Sería bueno que alguien que conozca acerca de los Handles y los URN hiciera esta evaluación y nos comunicara los resultados.

¿El DOI es un identificador estándar? Si la pregunta es si el DOI es el estándar oficial de una organización nacional o internacional de estándares -como el ISSN, ISBN o SICI-, la respuesta es no. No obstante, se está creando un comité de estándares NISO con el fin de definir una sintaxis para el DOI, para que éste se convierta finalmente en un Estándar Nacional Estadounidense. De ser así, sólo se aplicará a los identificadores DOI dentro del sistema DOI, y no a todos los identificadores para objetos digitales.

¿Por qué no utilizar los iquest;Por qué no utilizar los identificadores estándar existentes? Otra buena pregunta. La sintaxis del DOI probablemente fomente el uso de los SICI y de otros números estándar dentro de la cadena DOI cuando sea aplicable. Pero los números estándar actuales no sirven para todo el material. Por un lado, pueden no ser aplicables al nivel necesario de granularidad. Se le puede asignar un DOI a un trabajo (ej., un artículo), a una parte de un trabajo (ej., una foto en un artículo) o a una colección (ej., el número de una revista); es decir, a cualquier objeto al que se le quiera controlar los permisos en forma separada. Por otro lado, tal vez se necesite controlar los derechos a los objetos que no están publicados todavía o que no se adaptan a otros números estándar.

Así que, ¿de qué se trata todo este escándalo? Si ya escucharon hablar del DOI, es probable que sepan que da lugar a muchos debates interesantes. Creo que hay algunas cosas que nos preocupan un poco -no demasiado como para no dormir tranquilos-, pero que nos hacen meditar.

En primer lugar, como una comunidad de usuarios de Internet, esperamos que la primera implementación amplia y fundamentada de la resolución distribuida de nombres sea compatible con la arquitecturbres sea compatible con la arquitectura y los principios del URN. Necesitamos verificar si el sistema DOI es compatible o si puede llegar a ser compatible. En segundo lugar, a diferencia de los identificadores SICI y BICI, los DOI no se pueden obtener de la información bibliográfica sobre la pieza. La única manera de saber si hay un identificador DOI es que lo diga la editorial, lo cual no tendría que ser un problema considerando que las editoriales quieren que tengamos la información sobre los derechos. No obstante, los identificadores también son valiosos para los servicios de indización y resúmenes de terceros, y es posible que las editoriales de bases de datos independientes tengan que pagar por los identificadores o incluso que se les niegue el acceso a ellos. Esto dificultaría las cosas (y las haría más costosas) para todos los que luchamos por sistemas de información más abiertos.

En tercer lugar, todos los modelos del sistema DOI que he visto toman un universo muy limitado donde hay sólo una copia de cada objeto dado, y éste, sus metadatos y los servicios relacionados con él están todos controlados por el editor. Esto no se parece mucho al mundo en que vivo, donde puedo conseguir un artículo de una editorial y Uds. pueden obtenerlo de UMI o del OCLC y Juan P&eobtenerlo de UMI o del OCLC y Juan Pérez del servidor de su biblioteca local. Creo que el modelo falla en cuanto a esta complejidad desde un principio, no porque los diseñadores quieran pasar a un entorno más cerrado.

Imaginemos otro nombre

Por último, hay un problema de expectativas erróneas y creo que se debe en gran parte al nombre "DOI". Si éste fuera "Publishers' Rights Management Identifier" (Identificador de Gestión de los Derechos de las Editoriales), podríamos concentrarnos en el significado de esta aplicación. Lamentablemente, el término Identificador de Objetos Digitales es tan genérico que la gente sólo puede suponer que responde a sus necesidades de, bueno, un identificador de objetos digitales.

Si Uds. están digitalizando fuentes originales de sus archivos u ofrecen el servicio de hosting de un sitio Web para trabajos de investigación, probablemente este DOI no les sirva. Así que les sugiero que comencemos a llamarlo "Identificador de Objetos Digitales de las Editoriales" cuando hablamos o escribimos al respecto.

Las editoriales tienen derecho de diseñar sistemas e identificadores que respondan a sus necesidades y, en lugar de criticarlos, deberíamos aplaue criticarlos, deberíamos aplaudir su iniciativa. Asimismo, tendríamos que comprometernos a desarrollar un sistema identificador abierto y de aplicación amplia que satisfaga las necesidades de la biblioteca digital nacional emergente. ¿Por qué no nos juntamos todos los de la comunidad bibliotecaria y sacamos nuestro propio sistema y nuestros estándares para lograr una resolución y un direccionamiento permanente, un verdadero Identificador Digital Estándar Internacional?

Cómo obtener más información

Hay muchísima bibliografía sobre los identificadores en general y, en particular, sobre el DOI. A continuación, figuran algunas direcciones:

1. La home page del DOI es: <URL:http://www.doi.org//>.

2. "In Search of the Unicorn: The Digital Object Identifier from a User Perspective", Mark Bide. (Londres: Book Industry Communication, Febrero 1998.) Véase <URL: http://www.bic.org.uk/bic/unicorn2.pdf>. Relatos de la vida real y numerosas referencias a otras fuentes útiles.

3. "Identifiers and their Role in Networked Information Applications", Clifford Lynch. ARL: A Bimonthly Newsletter of Research Library Issues antter of Research Library Issues and Actions 194 (Octubre 1997.) Véase <URL:http://www.arl.org/newsltr/194/identifier.html>. Dos reglas de oro: Nunca jugar a las cartas con un hombre llamado Doc y averiguar siempre qué opina Clifford Lynch sobre un boletín.

4. "Using Existing Bibliographic Identifiers as Uniform Resource Names"; Clifford Lynch, Cecilia Preston y Ron Daniel, Jr. (IETF, Febrero 1998). Véase <URL:
ftp://ds.internic.net/rfc/rfc2288.txt>. El trabajo al que se hace referencia más arriba.

5. Sandra Payette, "Persistent Identifiers on the Digital Terrain", RLG DigiNews 2 (15 de abril de 1998). Véase <URL: http://http://www.bibnal.edu.ar/www.rlg.org/preserv/diginews/diginews22.html#Identifiers>. Me encanta este artículo breve escrito por alguien que evidentemente se mantiene al tanto del tema.

Siglas

Mis editores siempre me piden que escriba entre paréntesis el significado de las siglas. Suelo pensar que las siglas técnicas son como los nombres de las calles de Boston: conocer el nombre no ayuda si no sconocer el nombre no ayuda si no sabemos cuáles son. Así que, por compromiso, incluí el siguiente glosario.

* ANSI (American National Standards Institute). El banco de datos nacional para el desarrollo voluntario de estándares en los EE.UU.
* BICI (Book Item and Contribution Identifier). Un estándar que está desarrollando la NISO actualmente.
* IETF (Internet Engineering Task Force). La rama de desarrollo e ingeniería de protocolos de Internet.
* ISBN (Intentional Standard Book Number). En WaldenBooks no se vende nada que no tenga este número.
* ISSN (International Standard Serial Number)
* NISO (National Information Standards Organization). La organización de estándares ANSI encargada de los servicios de información, editoriales y bibliotecas.
* PURL (Persistent Uniform Resource Locator). Un URL redireccionado por un servidor PURL, un paquete de software desarrollado por OCLC.
* SICI (Serials Item and Contribution Identifier). NISO Z39.56. Un identificador de estándares para números de revistas o partes de revistas, como por ejemplo artículos.ejemplo por como>
* URL (Uniform Resource Locator). La información que necesita el navegador para llegar a un recurso.
* URN (Uniform Resource Name). Un sistema para el direccionamiento y la resolución de nombres definido por la IETF.

Acerca del autor

Priscilla Caplan, Subdirectora de Library Systems, University of Chicago Library, 1100 E. 57th Street Chicago, IL 60637. Internet: p-caplan@uchicago.edu.

Acerca de la revista

La home page de The Public-Access Computer Systems Review en la World Wide Web brinda información detallada sobre la revista y acceso a los archivos de los artículos: <URL:http://info.lib.uh.edu/pacsrev.html>.

Derecho de autor

Traducido con la correspondiente autorización de los autoresización de los autores.
Departamento de Informática y Sistemas.

Facilitado por la Biblioteca Nacional de la República Argentina