Priscilla Caplan
"DOI: ¿Sí o no?"
The Public-Access Computer Systems Review 9, No. 1
(1998)
Escribí este artículo en diciembre pasado, pero
llevó tanto tiempo fijar la fecha de su publicación que tuve que actualizarlo
y entregarlo otra vez para el número siguiente. Esto nos indica dos cosas:
que el tiempo de procesamiento de las revistas electrónicas todavía es
más largo de lo que quisiéramos y que las cosas cambian rápido en el mundo
del DOI.
DOI significa Digital Object Identifier (Identificador de Objet Digital Object Identifier (Identificador de Objetos Digitales), que no es sólo un identificador sino un sistema completo para asignar, mantener, resolver y utilizar identificadores permanentes. (Como existe la posibilidad de una confusión semántica, trataré de hacer una distinción entre el “sistema DOI” y el “identificador DOI”.) El sistema fue desarrollado originariamente para la Association of American Publishers por R.R. Bowker y la Corporation for National Research Initiatives (CNRI), pero ahora lo administra la International DOI Foundation, una organización con membresía sin fines de lucro con sede en Nueva York y Ginebra. El objetivo es facilitar el comercio digital manteniendo lazos permanentes con el titular de los derechos de un objeto digital. Una de las cosas engorrosas de los URL es que cambian cuando se mueve un documento. Si el URL aparece en cientos de referencias de páginas Web o registros de catálogos, hay que cambiar todas esas referencias o incurrir en el temido mensaje "404 File not found" (No se encontró el archivo buscado) del navegador. Sin embargo, si se utiliza algún otro identificador en todas esas referencias y si ese identificador lleva a un directorio que mapea desde el identificador al URL del documento, el problema se reduce notablemente. Cada vez que se mueve el documento, sólo hay qumueve el documento, sólo hay que localizar y cambiar la única entrada del directorio y no todas las referencias hacia él. Todos los proyectos para ofrecer continuidad, desde los PURL a los URN, se basan en esta idea de mapear desde identificadores arbitrarios a ubicaciones reales. El mapeo se llama “indirección” y el acto de obtener otros datos (como un URL) a cambio de un identificador se llama “resolución”. (Ver el glosario al pie para la identificación de las siglas.) Quiero tomar tu... información Como está instrumentado actualmente, el DOI depende del software Handle System de CNRI para mantener el directorio y proveer resolución. Básicamente, cuando se le da un identificador al Handle System, éste incluye en la respuesta algún dato más. En el sistema DOI, el resultado depende de la editorial que registró el identificador. Puede ser el URL del objeto, de un formulario de pedido del objeto o de una pantalla de información sobre derecho de autor. Esto puede ser confuso porque tenemos que distinguir entre el objeto al cual se refiere el identificador DOI (el objeto en sí) y el resultado de una búsqueda, que en teoría podría ser cualquier otro dato asociado con el objeto.
El identt>
El identificador es una cadena alfanumérica con
un prefijo y un sufijo, separados por una barra. El prefijo tiene dos
elementos separados por un punto. El primer elemento identifica al “Administrador
de Directorios” o autoridad de direccionamiento y el segundo al
editor o agente responsable del sufijo. Este es esencialmente arbitrario
mientras sea único, aunque se está diseñando un estándar para formatear
sufijos. En el ejemplo mencionado en la home page del DOI, el identificador
completo es "10.1002/[ISBN]0-471-58064-3". El Administrador de Directorios
es "10", el agente que asigna el sufijo es "1002" y el sufijo es "[ISBN]0-471-58064-3".
Aunque el propósito original era instrumentar un sistema distribuido
de directorios, los planes actuales requieren un solo Administrador
de Directorios. Se están llevando a cabo negociaciones para que ISBN
International asuma esta función, que incluye administrar el directorio
y supervisar la distribución de prefijos.
La iniciativa DOI, por supuesto, tiene como fin
algo más que simplemente proveer continuidad. Si eso fuera todo, los
editores podrían haber instalado un servidor PURL con mucho menos trabajo.
La International DOI Foundation espera construir un sistema completo
para administrar los permisos y cuenta con grupos de trabajo que est&aacut
con grupos de trabajo que están abordando varios aspectos relacionados
con el tema, tales como políticas, solicitudes, metadatos descriptivos
y metadatos para la administración de derechos.
Así que no tiren nada y empiecen a asignar identificadores
DOI a todos los documentos que tienen en el servidor Web: este es un
pedido especial para las editoriales y los titulares de derechos. Antes
de solicitar un prefijo hay que inscribirse en la International DOI
Foundation y aceptar las cláusulas y condiciones, como asignar solamente
un DOI a los objetos sobre los cuales tienen derechos electrónicos y
que residen en los servidores que Uds. controlan. No es gratuito: el
prefijo cuesta U$S1000, con un arancel anual adicional basado en el
número de identificadores registrados para ese prefijo en el sistema
DOI.
La importancia de llamarse “URN”
Entonces, ¿el identificador DOI es un URN? Buena
pregunta. El grupo de trabajo URN del Internet Engineering Task Force
definió una arquitectura para la resolución de nombres y un conjunto
de requisitos sintácticos mínimos para un identificador. Además, le
corresponde a las distintas comunidades que utilizan Internet definir
los identificadores dentro de sus propios espacios de nombres. Clifford
Lynch, enacios de nombres. Clifford Lynch, entre otros, demostró que
-con los prefijos apropiados- los ISBN, ISSN, SICI y otros identificadores
bibliográficos estándar pueden adaptarse al marco URN. (Véase "Cómo
obtener más información" a continuación.) Supuestamente, el identificador
DOI también puede hacerlo. La mayoría de los que critican este sistema
consideran que el DOI es una implementación del URN, pero algunos miembros
del Grupo de Trabajo URN dudan acerca de si el Handle System de base
es totalmente compatible. Sería bueno que alguien que conozca acerca
de los Handles y los URN hiciera esta evaluación y nos comunicara los
resultados.
¿El DOI es un identificador estándar? Si la pregunta
es si el DOI es el estándar oficial de una organización nacional o internacional
de estándares -como el ISSN, ISBN o SICI-, la respuesta es no. No obstante,
se está creando un comité de estándares NISO con el fin de definir una
sintaxis para el DOI, para que éste se convierta finalmente en un Estándar
Nacional Estadounidense. De ser así, sólo se aplicará a los identificadores
DOI dentro del sistema DOI, y no a todos los identificadores para objetos
digitales.
¿Por qué no utilizar los iquest;Por qué no utilizar
los identificadores estándar existentes? Otra buena pregunta. La sintaxis
del DOI probablemente fomente el uso de los SICI y de otros números
estándar dentro de la cadena DOI cuando sea aplicable. Pero los números
estándar actuales no sirven para todo el material. Por un lado, pueden
no ser aplicables al nivel necesario de granularidad. Se le puede asignar
un DOI a un trabajo (ej., un artículo), a una parte de un trabajo (ej.,
una foto en un artículo) o a una colección (ej., el número de una revista);
es decir, a cualquier objeto al que se le quiera controlar los permisos
en forma separada. Por otro lado, tal vez se necesite controlar los
derechos a los objetos que no están publicados todavía o que no se adaptan
a otros números estándar.
Así que, ¿de qué se trata todo este escándalo?
Si ya escucharon hablar del DOI, es probable que sepan que da lugar
a muchos debates interesantes. Creo que hay algunas cosas que nos preocupan
un poco -no demasiado como para no dormir tranquilos-, pero que nos
hacen meditar.
En primer lugar, como una comunidad de usuarios
de Internet, esperamos que la primera implementación amplia y fundamentada
de la resolución distribuida de nombres sea compatible con la arquitecturbres
sea compatible con la arquitectura y los principios del URN. Necesitamos
verificar si el sistema DOI es compatible o si puede llegar a ser compatible.
En segundo lugar, a diferencia de los identificadores SICI y BICI, los
DOI no se pueden obtener de la información bibliográfica sobre la pieza.
La única manera de saber si hay un identificador DOI es que lo diga
la editorial, lo cual no tendría que ser un problema considerando que
las editoriales quieren que tengamos la información sobre los derechos.
No obstante, los identificadores también son valiosos para los servicios
de indización y resúmenes de terceros, y es posible que las editoriales
de bases de datos independientes tengan que pagar por los identificadores
o incluso que se les niegue el acceso a ellos. Esto dificultaría las
cosas (y las haría más costosas) para todos los que luchamos por sistemas
de información más abiertos.
En tercer lugar, todos los modelos del sistema
DOI que he visto toman un universo muy limitado donde hay sólo una copia
de cada objeto dado, y éste, sus metadatos y los servicios relacionados
con él están todos controlados por el editor. Esto no se parece mucho
al mundo en que vivo, donde puedo conseguir un artículo de una editorial
y Uds. pueden obtenerlo de UMI o del OCLC y Juan P&eobtenerlo de
UMI o del OCLC y Juan Pérez del servidor de su biblioteca local. Creo
que el modelo falla en cuanto a esta complejidad desde un principio,
no porque los diseñadores quieran pasar a un entorno más cerrado.
Imaginemos otro nombre
Por último, hay un problema de expectativas erróneas
y creo que se debe en gran parte al nombre "DOI". Si éste fuera "Publishers'
Rights Management Identifier" (Identificador de Gestión de los Derechos
de las Editoriales), podríamos concentrarnos en el significado de esta
aplicación. Lamentablemente, el término Identificador de Objetos Digitales
es tan genérico que la gente sólo puede suponer que responde a sus necesidades
de, bueno, un identificador de objetos digitales.
Si Uds. están digitalizando fuentes originales
de sus archivos u ofrecen el servicio de hosting de un sitio Web para
trabajos de investigación, probablemente este DOI no les sirva. Así
que les sugiero que comencemos a llamarlo "Identificador de Objetos
Digitales de las Editoriales" cuando hablamos o escribimos al respecto.
Las editoriales tienen derecho de diseñar sistemas
e identificadores que respondan a sus necesidades y, en lugar de criticarlos,
deberíamos aplaue criticarlos, deberíamos aplaudir su iniciativa. Asimismo,
tendríamos que comprometernos a desarrollar un sistema identificador
abierto y de aplicación amplia que satisfaga las necesidades de la biblioteca
digital nacional emergente. ¿Por qué no nos juntamos todos los de la
comunidad bibliotecaria y sacamos nuestro propio sistema y nuestros
estándares para lograr una resolución y un direccionamiento permanente,
un verdadero Identificador Digital Estándar Internacional?
Cómo obtener más información
Hay muchísima bibliografía sobre los identificadores
en general y, en particular, sobre el DOI. A continuación, figuran algunas
direcciones:
1. La home page del DOI es: <URL:http://www.doi.org//>.
2. "In Search of the Unicorn: The Digital Object
Identifier from a User Perspective", Mark Bide. (Londres: Book Industry
Communication, Febrero 1998.) Véase <URL: http://www.bic.org.uk/bic/unicorn2.pdf>.
Relatos de la vida real y numerosas referencias a otras fuentes útiles.
3. "Identifiers and their Role in Networked Information
Applications", Clifford Lynch. ARL: A Bimonthly Newsletter of Research
Library Issues antter of Research Library Issues and Actions 194 (Octubre
1997.) Véase <URL:http://www.arl.org/newsltr/194/identifier.html>.
Dos reglas de oro: Nunca jugar a las cartas con un hombre llamado Doc
y averiguar siempre qué opina Clifford Lynch sobre un boletín.
4. "Using Existing Bibliographic Identifiers
as Uniform Resource Names"; Clifford Lynch, Cecilia Preston y Ron Daniel,
Jr. (IETF, Febrero 1998). Véase <URL: 5. Sandra Payette, "Persistent Identifiers on
the Digital Terrain", RLG DigiNews 2 (15 de abril de 1998). Véase <URL:
http://http://www.bibnal.edu.ar/www.rlg.org/preserv/diginews/diginews22.html#Identifiers>.
Me encanta este artículo breve escrito por alguien que evidentemente
se mantiene al tanto del tema.
Siglas
Mis editores siempre me piden que escriba entre
paréntesis el significado de las siglas. Suelo pensar que las
siglas técnicas son como los nombres de las calles de Boston: conocer
el nombre no ayuda si no sconocer el nombre no ayuda si no sabemos cuáles
son. Así que, por compromiso, incluí el siguiente glosario.
* ANSI (American National Standards Institute).
El banco de datos nacional para el desarrollo voluntario de estándares
en los EE.UU. Acerca del autor
Priscilla Caplan, Subdirectora de Library Systems,
University of Chicago Library, 1100 E. 57th Street Chicago, IL 60637.
Internet: p-caplan@uchicago.edu.
Acerca de la revista
La home page de The Public-Access Computer
Systems Review en la World Wide Web brinda información detallada
sobre la revista y acceso a los archivos de los artículos: <URL:http://info.lib.uh.edu/pacsrev.html>.
Derecho de autor
Copyright © 1998 Priscilla Caplan. Todos los
derechos reservados.
The Public-Access Computer Systems Review.
Copyright © 1998 University Libraries, University of Houston. Todos
los derechos reservados. Traducido con la correspondiente autorización
de los autoresización de los autores. |