Internet Archive’s Fatcat und Internet Archive Scholar

Aaron Tay

Deutsche Übersetzung des Punktes 6 des Beitrages More cutting edge — Research tools for researchers — Oct 2020 von Aaron Tay mit geringfügigen Anpassungen

Internet Archive’s Fatcat und Internet Archive Scholar

https://fatcat.wiki/

Die meisten von uns kennen das Internet Archive (zumindest die Wayback Machine), aber wussten Sie, dass “the Internet Archive has been working on a Mellon-funded grant aimed at collecting, preserving and providing persistent access to as much of the open-access academic literature as possible.”

Tatsächlich tun sie dies schon eine ganze Weile, aber der kürzlich erschienene Preprint „Open is not forever: a study of vanished open access journals“ beleuchtete die Problematik, dass Zeitschriften aus dem Internet verschwunden sind, die aber nicht sicher langzeitarchiviert wurden (nicht alle Zeitschriften fallen unter LOCKSS oder ähnliche Programme).

Dieser Blogbeitrag beschreibt den Top-Down-Prozess, der im Ergebnis zu Fatcat führte.

Top-Down: Using the bibliographic metadata from sources like CrossRef to ask whether that article is in the Wayback Machine and, if it isn’t trying to get it from the live Web. Then, if a copy exists, adding the metadata to an index.

Außerdem wird ein Bottom-up-Ansatz beschrieben, der mich (Aaron Tay, Anm. d. Übers.) daran erinnert, wie Google Scholar es tut. Dies ist natürlich sehr schwierig.

Bottom-up: Asking whether each of the PDFs in the Wayback Machine is an academic article, and if so extracting the bibliographic metadata and adding it to an index.

Ich (Aaron Tay, Anm. d. Übers.) habe noch keine vollständige Überprüfung von Fatcat durchgeführt, aber es ist im Wesentlichen eine

versioned, publicly-editable catalog of research publications: journal articles, conference proceedings, pre-prints, blog posts, and so forth. The goal is to improve the state of preservation and access to these works by providing a manifest of full-text content versions and locations.

Neben anderen Features wird auf Datei/Element-Ebene verfolgt, ob der Artikel bereits ordnungsgemäß archiviert wird, egal, ob dies über ein geschlossenes Archiv wie (LOCKSS) oder eine offnes Archive (z.B. Hathitrust, durch das Internet Archive selbst) erfolgt, indem die Daten von Websites wie Keepers Registery herangezogen werden etc.

Neben Fatcat, dem Internet Archive gibt es auch ein Internet Archive Scholar (zurzeit unter https://scholar-qa.archive.org/).

Wie unterscheidet sich dieses vom Fatcat? Im wesentlichen listet Fatcat all Beiträge auf, auch wenn diese nur Metadaten enthalten, während das Internet Archive Scholar nur Volltexte anzeigt.

https://scholar-qa.archive.org/

Ich frage mich (Aaron Tay, Anm. d. Übers.), ob es eine gute Idee wäre, Ihre Google Scholar-Suchanfragen damit zu ergänzen, um festzustellen, ob Sie etwas nicht gefunden haben.

Semantic Scholar verbessert die „Zitiert durch“-Suche

Aaron Tay Deutsche Übersetzung des Punktes 3 des Beitrages More cutting edge — Research tools for researchers — Oct 2020 von Aaron Tay mit geringfügigen Anpassungen

Semantic Scholar verbessert die „Zitiert durch“-Suche

Semantic Scholar
Verbesserte „Zitationsanzeige“ in Semantic Scholar

Die „Zitiert durch“-Suche bei Google Scholar ist IMHO (Aaron Tay, Anm. d. Verf.) eines der stärksten Features der Suchmaschine. Sie erlaubt die Einrichtung einer automatischen Benachrichtigung, und was noch wichtiger ist, sie ermöglicht Ihnen die „Suche in zitierenden Artikeln“, eine sehr leistungsstarke Funktion zum schnellen Herausfiltern von interessanten Zitationen, wenn es Tausende von Zitationen für ein bahnbrechendes Paper gibt.

Google Scholar

Ein Teil der Gründe, warum die „Suche innerhalb der zitierenden Artikel“ in Google Scholar so leistungsfähig ist, ist dass Google Scholar in den meisten Fällen den Volltext besitzt, sodass Sie 1.000+-Artikel nach einem ziemlich spezifischen Begriff durchsuchen können, etwas, dass Sie in den meisten anderen Suchmaschinen aufgrund des fehlenden Volltextes nicht tun können. Allerdings verfügen andere Suchrivalen wie Semantic Scholar über mehr Metadaten. Dieses neue Charakteristikum ermöglicht es Ihnen ebenfalls innerhalb von Zitaten zu suchen, erlaubt Ihnen aber auch, nach

  1. Datenbereichen,
  2. Zitationsart (allen Zitationen, Zitationshintergrund, Zitationsmethode, Zitationsergebnis),
  3. Art der Veröffentlichung (Buch, Zeitschriftenartikel etc.),
  4. Titel der Zeitschrift/Konferenz,
  5. Studiengebiet (z.B. Kunst, Biologie),
  6. Autor,
  7. und mehr

zu filtern.

Ich (Aaron Tay, Anm. d. Verf.) probiere es immer noch aus, aber ich vermute, dass Nr. 2 Zitationstyp und Nr. 5 Studiengebiete die interessanteste Filter sein können, wenn Sie eine Menge Zitationen durchgehen müssen. Allerdings ist es etwas frustrierend, dass, während die anderen Filter nur Optionen anzeigen, die mindestens ein Element haben, die „Studiengebiete“ alle aufgelistet werden, und wenn Sie auf einige davon klicken, erhalten Sie keine Ergebnisse.

Filteroptionen Semantic Scholar

Dieser Blogbeitrag ist Teil der der Adventskalender Blogparade 24 Tools aus dem Netz im Einsatz für Bibliotheken #netzadvent2020:
Logo von Netzwerkeln mit Weihnachtsmütze