Philipp Zumstein – netzwerkeln

Informationen zu einer ISBN auf einen Blick mit malibu

21.12.2020

7:00

1 Kommentar zu Informationen zu einer ISBN auf einen Blick mit malibu

adventskalender2020, bestandsabgleich, buchinformationen, isbn, sacherschließung

malibu ist ein online Tool, welches ich vor ca. 6 Jahren angefangen habe zu entwickeln. Der Name „malibu“ passt gut zu PalMA, ein anderes Softwareprojekt von uns, und steht für Mannheim library utilities. Meine Motivation damals war die relevanten Informationen für ein Buch mit einer ISBN auf einer Seite zusammen zu sammeln um über die mögliche Erwerbung effizient entscheiden zu können. Neben der Erwerbungsauswahl hilft malibu auch bei der sachlichen Erschließung sowie beim Bestandsabgleich. Die Entwicklung des Tools geschieht transparent als Open Source auf GitHub und verschiedene Kolleg*innen haben mich dabei mit Ideen oder Anpassungen unterstützt. Im Folgenden sollen drei Anwendungsfälle von malibu für die bibliothekarische Praxis beschrieben werden.

Anwendungsfall 1: Informationen zu einem neu erschienen Buch

Häufig habe ich als Fachreferent die Aufgabe neue Bücher für die Bibliothek zu erwerben. Wenn ich nach der ersten Durchsicht bei einem potentiell interessanten Buch mehr Informationen erfahren möchte, dann gebe ich in malibu einfach die ISBN ein und es werden im Hintergrund Informationen dazu zusammen gesucht und auf einer Seite angezeigt:

Screenshot von malibu bei der Suche nach einer ISBN — *Abb. 1:* Suche nach der ISBN 978-3-8233-8452-6 in malibu

Auf einen Blick sieht man hier für das Buch den Klappentext, das Coverbild, eine Preisinformation und soweit vorhanden und auffindbar Bewertungen. Zudem werden für den SWB-Verbund die verschiedenen Ausgaben aufgelistet mit einer kurzen Bestandsangabe mit Bibliothekssigel. Desweiteren sind an verschiedenen Stellen Links für weiterführende Information eingefügt und auch am Ende der Seite sind nochmals weitere Links etwa zum Inhaltsverzeichnis angeführt.

Wenn ich dann einen Titel interessant finde und für die Bibliothek erwerben möchte, dann klicke ich auf den Button „Bestell Info“ um die wichtigsten Angaben in die Zwischenablage zu kopieren und schicke diese dann in einer E-Mail unter Angabe eines zu verwendenden Etats an die Kolleg*innen zum Bestellen weiter.

Anwendungsfall 2: RVK-Stellen und Verschlagwortung von einem Titel suchen

Bei der Sacherschließung lohnt es sich die bereits vorhanden Informationen zu verwenden. Teilweise ist in einem anderen Bibliotheksverbund bereits eine RVK-Stelle oder ein Schlagwort vergeben worden, oder aber es wurde eine DDC-Stelle für den Titel vergeben. Durch entsprechende Mappings und der hervorragender API des coli-conc Projektes kann man teilweise auch aus einer DDC-Stelle wieder direkt eine entsprechende RVK-Stelle bekommen, was insbesondere für englischsprachige Literatur interessant ist.

Screenshot von malibu — *Abb. 2:* Sacherschließungsinformationen bei der Suche nach der ISBN 978-3-540-71582-5 in malibu

Die aggregierte Baumansichten hier bei den RVK- und DDC-Stellen sind noch relativ neu und über einen Klick des Icons in der entsprechenden Spaltenüberschrift umschaltbar. Die beschreibenden Informationen aus dem oberen Teil (vgl. erster Anwendungsfall) helfen bei der Sacherschließung ebenfalls häufig mit und können teilweise eine Autopsie am gedruckten Buch ersetzen (z.B. kann ich meistens die RVK-Stellen für die Aufstellung in der Bibliothek bereits bei der Bestellung mit angeben).

Anwendungsfall 3: Bestand von mehreren ISBNs prüfen

Bei jeder Suche nach einer einzelnen ISBN sieht man auch den Bestand der UB Mannheim speziell hervorgehoben, da ich das Tool hauptsächlich für uns entwickelt habe. Hierbei wird die SRU-Schnittstelle von unserer Alma-Instanz abgefragt. Prinzipiell kann man dies aber für andere Bibliotheken über entsprechende Schnittstellen ähnlich machen bzw. auch einfach die Bestandsinformationen in den Verbunddaten diesbezüglich auswerten. Zudem werden immer häufiger Bücher in ganzen Paketen gekauft insbesondere bei E-Books, so dass ein Bestandsabgleich einer Liste interessant ist. Genau für diesen Zweck gibt es den generischen Bestandsabgleich (Variante A) zusätzlich zu einem speziell für Mannheim:

Abb. 3.a und 3.b: Bestandsabgleich für die ULB Münster inkl. aller Institutsbibliotheken von einer Liste von ISBNs mit malibu

In Abbildung 3 sieht man das Resultat für eine Liste von 11 ISBNs mit einem Bestandsabgleich im HBZ-Verbund gefiltert nach dem Bibliothekssigel von der ULB Münster (6) sowie allen Institutsbibliotheken (6/.*). Ein passender regulärer Ausdruck zum Filtern zu finden ist dann etwas Übungssache. Aus dem Resultat kann man sich beispielsweise die nicht vorhandenen Titel genauer ansehen oder auch diejenigen Titel, welche nur in den Institutsbibliotheken vorhanden sind.

Bei E-Book-Paketen bekommt man vom Verlag häufig eine Liste (z.B. als Excel-Datei) der enthaltenen E-Books meist auch mit den entsprechenden ISBNs. Den Inhalt dieser ISBN-Spalte kann man dann kopieren, beim Bestandsabgleich einfügen und durchlaufen lassen. Das Resultat kann dann auch wieder zurück in die Tabelle kopiert werden als Anreicherung um damit etwa in Excel auch Filterungen nach den lokalen Bestandsinformationen machen zu können. Dies kann hilfreich sein bei der Gesamtbeurteilung eines E-Book-Paketes oder auch um einzelne noch nicht vorhandene E-Books aus Pick-and-Choose-Paketen auszuwählen.

Bei größeren Mengen empfiehlt sich ggf. eine Aufteilung in kleinere Teile zum Prozessieren, da man ansonsten eventuell die SRU- oder Z39.50-Schnittstellen der Verbünde etwas stärker belastet.

Adaption und Ausblick

Ein paar weitere Ideen für neue Features oder einen Ausbau gibt es, aber es ist wahrscheinlicher, dass in nächster Zeit eher der Stand wie bisher fortgeführt wird mit nur kleinen Anpassungen. Auf jeden Fall bin ich immer an Feedback und Ideen interessiert.

Man kann malibu direkt online über die URL https://data.bib.uni-mannheim.de/malibu/ nachnutzen oder aber auch, da es Open Source ist, selbst aufsetzen und etwas an die lokalen Bedürfnisse weiter anpassen, wie es beispielsweise der Kollege aus Saarbrücken gemacht hat. Ebenfalls möglich ist es malibu als API für Batchabfragen zu nutzen, auch wenn dies eher ein Nebenprodukt von der bisherigen Entwicklung für die genannten Anwendungsfälle anzusehen ist. Nach- bzw. Mitbenutzung von malibu ist jederzeit erwünscht!

Dieser Blogbeitrag ist Teil der der Adventskalender Blogparade 24 Tools aus dem Netz im Einsatz für Bibliotheken #netzadvent2020:
Logo von Netzwerkeln mit Weihnachtsmütze

Wissensgraphen bei Discovery Services

by Philipp Zumstein

14.12.2020

6:00

Kommentare deaktiviert für Wissensgraphen bei Discovery Services

Adventskalender

adventskalender2020, discover service, netzadvent2020, netzwerkvisualisierung, wissensgraph

Deutsche Übersetzung des Punktes 7 des Beitrages More cutting edge — Research tools for researchers — Oct 2020 von Aaron Tay mit geringfügigen Anpassungen

Wir sehen ständig neue Forschungsinstrumente im Zusammenhang mit Discovery Services, hier sind einige weitere, denen ich begegnet bin. Ich werde sie mit nur wenigen Kommentaren versehen

EBSCO’s Concept Map für den Discovery Service:

https://youtu.be/pW7NO9BtJaU

EBSCO’s Concept Map – Tutorial (https://youtu.be/pW7NO9BtJaU)

Der Open Knowledge Research Graph unterscheidet sich auf dem Papier nicht sehr von anderen Wissenschaftsgraphen da draußen wie etwa der OpenAire Knowledge Graph, der Project Freya PID Graph. Der Kernpunkt ist aber meiner Meinung nach, dass der Open Knowledge Research Graph nicht nur Metadaten des Papiers erfassen wie z.B. Titel, Autor, DOI, Zeitschriftentitel, sondern auch den Beitrag („contribution“) des Papiers, die Methodologie usw.

Dies ermöglicht interessante Funktionen wie die automatische Generierung von Vergleichstabellen:

Interessanterweise scheint erwartet zu werden, dass Menschen den Beitrag entsprechend auszeichnen. Dahingegen verfolgen Startups, die wie Scholarcy um maschinelles Lernen herum aufgebaut sind, den Ansatz, die meiste Arbeit mit Maschinen zu erledigen.

Dies ist bis zu einem gewissen Grad in Analogie zu der von Crossref geleisteten Arbeit, im Gegensatz zu den Ansätzen von Google Scholar und Microsoft Academic, die sich eher auf die maschinelle Extraktion verlassen.

Zu guter Letzt ist die sehr ausgefallene https://www.orion-search.org/ zu erwähnen. Die Visualisierungsoberfläche erinnert mich daran, ein 4X-Weltraum-Strategiespiel zu spielen, bei dem man im 3D-Raum schwenken und zoomen kann.

Orion hat auch eine ungewöhnliche Metrik mit den Achsen Forschungsvielfalt („research diversity“) und Geschlechtervielfalt („gender diversity“).

Zu beachten ist, dass die Orion-Demo auf eine bestimmte Anzahl von Arbeiten beschränkt ist und nicht als disziplinübergreifende Datenbank verwendet werden kann.

Dieser Blogbeitrag ist Teil der der Adventskalender Blogparade 24 Tools aus dem Netz im Einsatz für Bibliotheken #netzadvent2020:
Logo von Netzwerkeln mit Weihnachtsmütze

Die Zitationsdatenbank scite mit Visualisierungen und Referenz-Checker

by Philipp Zumstein

10.12.2020

6:00

Kommentare deaktiviert für Die Zitationsdatenbank scite mit Visualisierungen und Referenz-Checker

Adventskalender

adventskalender2020, dokumentenanalyse, netzadvent2020, netzwerkvisualisierung, retractions, scite, zitationsdatenbank, zitationskontext

Deutsche Übersetzung der Punkte 1 und 2 des Beitrages More cutting edge — Research tools for researchers — Oct 2020 von Aaron Tay mit geringfügigen Anpassungen

Klassifikation von Zitationen und Suchmöglichkeiten

scite ist eine interessante Zitationsdatenbank, welche Zitationen mit Hilfe von maschinellem Lernen danach klassifiziert, ob sie den Artikel unterstützen („support“), anfechten/ablehnen („dispute“) oder nur erwähnen („mention“).

Aktuell hat scite die Abdeckung der Publikationen erheblich erweitert und ist auf 700 Millionen „intelligente Zitate“ angewachsen. Ein Vergleich mit traditionellen Zitationsdatenbanken ist schwierig, aber ich denke, dass die Core Collection des Web of Science üblicherweise auf etwa 1 Milliarde geschätzt wird, also rücken wir näher.

scite war während der Zeit von COVID-19 geschäftig, z.B. haben sie sich schnell an die Arbeit gemacht, um COVID-19-bezogene Forschungsartikel einschließlich Preprints zu analysieren. Ob ein Preprint unterstützend oder ablehnend zitiert wird oder gar zurückgezogen wurde, kann man jetzt schnell identifizieren.

Was die Funktionen betrifft, so hat scite eine Reihe von Features hinzugefügt. Einige (auch einfache) sehen für mich recht nützlich aus. Zum Beispiel erweiterte Suchfilter, Facetten und Sortieroptionen vereinfachen es, das Gesuchte zu finden. Sie haben auch damit begonnen, den Retraction-Status aufzunehmen, wobei ich mir nicht sicher bin, um welche Quelle es sich handelt und wie genau diese ist.

Citation Alerts und ORCID-Integration in scite sind ebenfalls nette Features.

Bei den von scite angepriesenen Badges und Journal-Dashboards in scite hingegen sind einige besorgt über die Auswirkungen der Verwendung einer weiteren neuen und nicht so gut verstandenen Metrik, die für die Auswertung verwendet wird, mit der zusätzlichen Komplikation des maschinellen Lernens.

Visualisierung von Zitationsnetzwerken

Meine persönliche Meinung ist, dass es zwar verfrüht wäre, scite für Bewertungsmetriken zu verwenden, aber wahrscheinlich ist es eher vertretbar, scite für die Untersuchung von Literatur zu verwenden. Zugegeben, es gibt unklare Verzerrungen, die sich aus der Verwendung von scite dafür ergeben könnten, aber ich würde behaupten, dass es nicht viel schlimmer ist, als Papiere mit anderen zitationsbasierten Methoden zu betrachten oder sich auf Black-Box-Algorithmen von Suchmaschinen zu verlassen.

Daher sehe ich der Einführung von Visualisierungsmöglichkeiten in scite mit großem Interesse entgegen. Das Versprechen hier ist, dass man die Literatur erkunden kann, indem man die Knotenpunkte danach erweitert, ob ein Papier unterstützende, bestreitende oder auch nur erwähnende Zitate zum ersten Startpapier hat, mit dem man beginnt.

Ich persönlich fand die Benutzeroberfläche anfangs nicht allzu intuitiv, aber als ich mir das obige YouTube-Video ansah, wurde sie klarer und bald schon zur Selbstverständlichkeit.

Man klickt auf „show visualization“ (Visualisierung anzeigen) und standardmäßig werden das ausgewählte Papier und die unterstützenden Zitate (in grün) und die widersprechenden Zitate (in orange) angezeigt. Standardmäßig werden erwähnende Zitate nicht angezeigt, aber man kann sie hinzufügen.

Klickt man dann auf einen Knoten, dann wird er im linken oberen Bereich angezeigt. Mit einem Klick auf das kleine Plus-Symbol daneben kann man den Knoten erweitern.

An diesem Punkt grüble ich noch darüber nach, wie man dies am besten nutzen kann.

Literaturverzeichnis prüfen

Ein weiteres interessantes Feature ist der Referenz-Checker von scite. [TODO Das funktioniert bei mir gerade nicht, wieso?]

Die Idee dabei ist, dass man jedes beliebige Papier hochladen kann, beispielsweise ein Manuskript, das noch nicht veröffentlicht wurde, und scite erstellt einen Bericht ähnlich wie bei den scite-Einträgen für veröffentlichten Papieren in cite selbst.

Referenz-Checker von scite — Hochladen eines Preprints, eines Manuskripts um die Verarbeitung von scite zu erhalten

Die Verarbeitung von scite bedeutet, dass die Referenzen im Literaturverzeichnis auf Retractions geprüft werden und es sichtbar gemacht wird, wie jede Referenz zitiert wurde.

Ich kann mir vorstellen, dass dies nützlich sein kann, wenn man als Gutachter*in schnell einen Überblick darüber erhalten möchte, was und wie zitiert wurde, oder wenn man selbst als Autor*in vor der Einreichung bei einer Zeitschrift einen solchen Überblick haben möchte.

Ein ziemlich interessantes Tool, das zusammen mit diesem verwendet werden kann, ist das Scholarcy Preprint Healthcheck API, das ich in einem anderen Post erwähne. Es extrahiert Affiliationen, zeigt Schlüsselergebnisse auf, berechnet eine fachliche Zuordnung, Statistiken und versucht, Abschnitte zur Datenverfügbarkeit, ethics statement usw. zu identifizieren. Einige Überschneidungen gibt es insofern, als auch auf Retractionen geprüft wird. Was die Literaturangaben anbelangt, so werden sie extrahiert und mit verschiedenen Whitelists oder Quellen wie DOAJ und Crossref verglichen, was meiner Meinung nach nützlich sein kann, wenn man Literaturangaben nach dem Ansehen der Quelle filtern möchte.

Dieser Blogbeitrag ist Teil der der Adventskalender Blogparade 24 Tools aus dem Netz im Einsatz für Bibliotheken #netzadvent2020:
Logo von Netzwerkeln mit Weihnachtsmütze

M	D	M	D	F	S	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Cookie	Typ	Dauer	Beschreibung
cookielawinfo-checkbox-necessary/cookielawinfo-checkbox-non-necessary	session	1 h	This cookie is set by GDPR Cookie Consent plugin. It records the default button state of the corresponding category. It works only in coordination with the primary cookie. - This cookie stores no personal Data.
viewed_cookie_policy	persistent	1 year	This cookie is set by GDPR Cookie Consent plugin. The primary cookie that records the user consent for the usage of the cookies upon ‘accept’ and ‘reject.’ It does not track any personal data and is set only upon user action (accept/reject).
wordpress_test_cookie	session	till browser session closed	WP+Cookie+check