Internet Archive’s Fatcat und Internet Archive Scholar

Aaron Tay

Deutsche Übersetzung des Punktes 6 des Beitrages More cutting edge — Research tools for researchers — Oct 2020 von Aaron Tay mit geringfügigen Anpassungen

Internet Archive’s Fatcat und Internet Archive Scholar

https://fatcat.wiki/

Die meisten von uns kennen das Internet Archive (zumindest die Wayback Machine), aber wussten Sie, dass “the Internet Archive has been working on a Mellon-funded grant aimed at collecting, preserving and providing persistent access to as much of the open-access academic literature as possible.”

Tatsächlich tun sie dies schon eine ganze Weile, aber der kürzlich erschienene Preprint „Open is not forever: a study of vanished open access journals“ beleuchtete die Problematik, dass Zeitschriften aus dem Internet verschwunden sind, die aber nicht sicher langzeitarchiviert wurden (nicht alle Zeitschriften fallen unter LOCKSS oder ähnliche Programme).

Dieser Blogbeitrag beschreibt den Top-Down-Prozess, der im Ergebnis zu Fatcat führte.

Top-Down: Using the bibliographic metadata from sources like CrossRef to ask whether that article is in the Wayback Machine and, if it isn’t trying to get it from the live Web. Then, if a copy exists, adding the metadata to an index.

Außerdem wird ein Bottom-up-Ansatz beschrieben, der mich (Aaron Tay, Anm. d. Übers.) daran erinnert, wie Google Scholar es tut. Dies ist natürlich sehr schwierig.

Bottom-up: Asking whether each of the PDFs in the Wayback Machine is an academic article, and if so extracting the bibliographic metadata and adding it to an index.

Ich (Aaron Tay, Anm. d. Übers.) habe noch keine vollständige Überprüfung von Fatcat durchgeführt, aber es ist im Wesentlichen eine

versioned, publicly-editable catalog of research publications: journal articles, conference proceedings, pre-prints, blog posts, and so forth. The goal is to improve the state of preservation and access to these works by providing a manifest of full-text content versions and locations.

Neben anderen Features wird auf Datei/Element-Ebene verfolgt, ob der Artikel bereits ordnungsgemäß archiviert wird, egal, ob dies über ein geschlossenes Archiv wie (LOCKSS) oder eine offnes Archive (z.B. Hathitrust, durch das Internet Archive selbst) erfolgt, indem die Daten von Websites wie Keepers Registery herangezogen werden etc.

Neben Fatcat, dem Internet Archive gibt es auch ein Internet Archive Scholar (zurzeit unter https://scholar-qa.archive.org/).

Wie unterscheidet sich dieses vom Fatcat? Im wesentlichen listet Fatcat all Beiträge auf, auch wenn diese nur Metadaten enthalten, während das Internet Archive Scholar nur Volltexte anzeigt.

https://scholar-qa.archive.org/

Ich frage mich (Aaron Tay, Anm. d. Übers.), ob es eine gute Idee wäre, Ihre Google Scholar-Suchanfragen damit zu ergänzen, um festzustellen, ob Sie etwas nicht gefunden haben.