Trvalé identifikátory

Trvalý identifikátor je dlhodobý odkaz na digitálny zdroj.

Identifikátor je „štítok“, ktorý sa používa na jedinečné pomenovanie a spoľahlivé označenie niektorých položiek  – digitálnych entít (online alebo offline): osoby, miesta alebo veci.  

Prečo potrebujeme trvalé identifikátory?

Používanie PID sa v otvorenej vede (open science) stáva bežným, požadovaným štandardom. 

Keď publikujeme online, ľudia k obsahu pristupujú prostredníctvom url adresy/odkazu. Ak ale odkaz nefunguje, obsah sa stane nedostupným. Každý má nejakú osobnú skúsenosť s tým, že klikne na odkaz na webovej stránke a dostane odpoveď, ako napr. „chyba HTTP 404“.

My však nechceme, aby odkaz fungoval iba pár mesiacov, naopak, očakávame, že sa ľudia dostanú k našim veciam za päť rokov rovnako, ako za päť dní.

Inštitúcie sa snažia udržiavať výstupy výskumu online, takže odkazy na výstupy by sa nemali meniť, či už ide o nespracované údaje alebo publikácie. Výstupy však nezostávajú na jednom mieste, majú svoj životný cyklus, ktorý zahŕňa aj pohyb v sieťovom prostredí. V každej fáze sa môže zmeniť adresa na prístup k údajom, a niekto, kto používa starú URL adresu, sa nemusí dostať k novým údajom. V ideálnom prípade, ak už obsah nie je online, kliknutím na odkaz, by ste sa mali dostať k nejakým užitočným informáciám o tom, čo tam bývalo.

Na rozdiel od URL adries, ktoré môžu byť časom nefunkčné, môžu „sa pokaziť“, trvalý identifikátor spoľahlivo odkazuje na digitálnu entitu aj po zmene jej umiestnenia. Malo by byť zaručené, že trvalý identifikátor bude spravovaný a aktualizovaný počas definovaného časového obdobia, teda, že spojenie s objektom nebude prerušené, a že odkaz vždy bude fungovať.

Identifikátor sa teda používa širšie ako adresa URL.

Aby sa identifikátory dali rozlíšiť na webe, musia byť kompatibilné s adresami URL a zvyčajne sa uverejňujú vložené do adries URL. Samotná adresa URL môže byť tiež trvalým identifikátorom – pokiaľ zostane rovnaká počas životného cyklu objektu, kdekoľvek objekt skončí. Nemôže to byť iba „vyhľadávač“ údajov.

Príkladom trvalého identifikátora je:

  • ORCID ID (Open Researcher and Contributor IDentifier) https://orcid.org/ – pre osobu. ORCID úzko spolupracuje s Web of Science, Scopus a mnohými ďalšími organizáciami PID pri budovaní dôveryhodných spojení medzi svojim ID a inými identifikátormi, napr. Researcher ID (PUBLONS), Author ID (Scopus);
  • DOI (Digital Object Identifier) – trvalý identifikátor vecí alebo entít, ako sú napr. články v časopisoch, knihy a súbory údajov. Crossref a DataCite sú hlavnými organizáciami, ktoré prideľujú DOI na účely digitálnej vedeckej komunikácie;
  • ROR (Research Organization Registry) https://ror.org/ pre výskumné inštitúcie – nový, komunitne vedený projekt na vývoj otvoreného, udržateľného, použiteľného a jedinečného identifikátora pre každú výskumnú organizáciu na svete.

Perzistencia nie je len záležitosťou technológie, ale i dobrej politiky; bez nej nemá používanie identifikátorov zmysel. Politika by mala zahŕňať:

  • čo bude identifikované a čo má zmysel trvalo identifikovať;
  • zodpovednosť za udržiavanie rôznych aspektov identifikátora: IT podpora je zodpovedná za udržiavanie chodu systému, ale poskytovateľ údajov (výskumný pracovník) je zodpovedný za poskytovanie jasných a aktuálnych informácií o tom, čo sa identifikuje;
  • pracovné postupy na interakciu s objektmi tak, aby sa minimalizovalo akékoľvek narušenie ich identifikátorov: používateľ by mal byť schopný sa dostať k objektu pomocou trvalého identifikátora bez ohľadu na to, aký druh upgradu alebo zmien sa realizuje na pozadí;
  • záložný plán, ak sa objekt prepne do režimu offline alebo ho hostiteľská inštitúcia už nemôže udržiavať online: v takom prípade musí vlastník aktualizáciou linku identifikátora zaručiť informácie o novom stave objektu a alternatívnych spôsoboch prístupu k nemu (napríklad kontaktovaním vlastníka).