CollectiveAccess-basierte Sammlungsdatenbank

Gezeigt wird ein Blatt mit historischer Schrift auf dem Scanner.
Scanvorgang, Foto: Deutsches Auswandererhaus, Ilka Seer, CC BY 4.0

Überblick

Information und Dokumentation

GitHub
Ergebnisse auf GitHub

Verwandte Ergebnisse

Rubrik
Anwendungsbereich
Zielgruppe
Technologie
Nachnutzung

Im Rahmen des Verbundprojektes wurde am Deutschen Auswandererhaus (DAH) als Basisinfrastruktur eine Sammlungsdatenbank mit der Open Source Software CollectiveAccess erstellt. Dieser Bericht gibt einerseits einen Einblick in den Entscheidungsfindungsprozess, der zu dieser Software geführt hat. Anderseits behandelt er das Aggregation Toolset, das hierfür programmiert wurde. Dieses ermöglicht das Abrufen von Daten aus einer CollectiveAccess-Datenbank, das Zwischenspeichern in MongoDB und das Bereitstellen über eine GraphQL-API. Ziel ist es, die Größe und Komplexität der Daten so weit zu reduzieren, wie es für bestimmte Nutzungen in entkoppelten Systemen notwendig ist. Das Tool kann auch verwendet werden, um alle relevanten Daten in einem weitgehend softwareunabhängigen Format zu speichern, um den Lock-in-Effekt zu minimieren, der mit der Auswahl eines Datenbankmanagementsystems verbunden ist.

Bibliographische Angaben

Institution
Deutsches Auswandererhaus Bremerhaven
Teilprojekt
Migrationsgeschichte digital erleben
Autor*innen
Birgit Burghart, Manon Krause
Veröffentlicht
10.07.2023
Lizenz der Publikation
CC BY-NC-ND 4.0
Kontakt
Deutsches Auswandererhaus Bremerhaven
Deutsches Auswandererhaus Bremerhaven
info@dah-bremerhaven.de

Entwicklung

Bei der Suche nach einer geeigneten Sammlungsdatenbank ging es zunächst darum, den Bedarf, der sich aus den Eigenheiten der spezifischen Sammlung ergibt, sowie den Bedarf des Hauses in Bezug auf die Nutzung der Daten (zu wissenschaftlichen Recherchezwecken, für Ausstellungsprojekte, für Anfragen von Externen und die Öffentlichkeitsarbeit etc.) zu erfassen und in ein Anforderungsprofil für die Datenbank zu übersetzen. Basierend darauf wurden verschiedene Datenbanksysteme recherchiert, getestet und im Gespräch mit Vertreter*innen anderer Museen deren jeweilige Erfahrungen bzgl. Vor- und Nachteilen erhoben. Auch Aspekte wie Kosten für einmalige Programmierung respektive laufende Kosten im Betrieb sowie die Möglichkeit, museumsseitig bei Bedarf selbst kleine Anpassungen vornehmen zu können, wurden in den Blick genommen und waren entscheidungsrelevant. Bei Open Source Software, wie CollectiveAccess, stellt sich außerdem die Frage, wie groß und aktiv die Entwicklercommunity ist, ob man etwa davon ausgehen kann, dass auch in Zukunft Personen die Software pflegen und man Fachleute finden kann, die mit der Software vertraut sind.

Inhaltliches Konzept

Die Sammlungsbestände des DAH lassen sich als heterogen beschreiben und beinhalten materielle und immaterielle Objekte. Dazu gehören insbesondere Ein- und Auswander*innenbiografien sowie Oral-History-Interviews und zugehörige Objekte. Die Sammlungsdatenbank soll eine zielgerichtete Inventarisierung und Dokumentation der Museumssammlung durch kontrollierte Vokabulare, Normdaten, Metadaten, Ontologien und Linked Open Data ermöglichen. Es sollen auch qualitative Verknüpfungen zwischen Biografien, Interviews und Objekten geschaffen werden. Die Datenbank soll in der Lage sein, verschiedene Mediadateien wie Audio- und Videodateien, Scans sowie Transkriptionen in Textform zu verwalten, abzuspielen und in Kombination mit einem Datensatz innerhalb der Datenbank zu importieren und zu verknüpften. Die Findbarkeit innerhalb der Datenbank ist von großer Wichtigkeit. Bei der Konzeption der Datenbank wurde zudem berücksichtigt, dass eine Onlinepräsentation von ausgewählten Sammlungsinhalten zukünftig geplant ist.

Technisches Konzept

Entscheidungsfindungsprozess Datenbanksystem:

Bei der Recherche nach einem geeigneten Datenbanksystem sah sich das DAH sowohl nach Open Source als auch nach lizenzbasierten Systemen um. Es wurde eine Nutzwertanalyse (siehe Anhang) erstellt, um die Eignung verschiedener Systeme einander gegenüberzustellen. Neben objektzentrischen Systemen wie MuseumPlus (zetcom) und Adlib (Axiell) richtete das DAH seinen Blick auf Systeme wie Argus (Lucidea), Daphne (robotron), The Museum System (TMS) (Gallery Systems) und Collective Access (Whirl-i-Gig) als frei konfigurierbares Open Source Produkt. Die Ausrichtung des Systems sollte sich insbesondere auf die Recherche, die speziellen Inventarisierungsanforderungen, wie beispielsweise flexible Anpassungsmöglichkeiten der Metadatenfelder, und eine übersichtliche und gut verständliche Benutzeroberfläche beziehen.

Das DAH ließ sich die verschiedenen Systeme demonstrieren und holte ergänzend Erfahrungsberichte von anderen Institutionen ein, die die Software bereits nutzen.

Argus beschrieb sich als flexible konfigurierbar in seinen Datenmasken und einfach nachzuvollziehen. Nach einem Webinar und einem anschließenden Blick in die preislichen Gegebenheiten, schied Argus aus Kosten- und Supportgründen aus.

Bei der Softwarelösung Daphne konnte das DAH eine Demoversion erproben. Problematisch erschien insbesondere, dass Änderungen am Quellcode stets über die Software-Firma erfolgen müssten und das DAH selbst keine schnellen Anpassungen, z. B. bei Metadatenfeldern, vornehmen könnte. Solche Änderungen wären natürlich auch mit Kosten verbunden.

Die Präsentation der Software TMS (The Museum System) als lizenzbasierter Variante machte deutlich, dass dies ein umfangreiches System ist. In den Erfahrungsberichten sprach gegen TMS ein überlastet wirkender deutscher Support, von dem beide befragten Einrichtungen berichteten. Daneben gibt es Restriktionen bei der Gestaltung, da beispielsweise ein später angedachtes Frontend für eine Onlinepräsentation nur an TMS in Form von Wünschen weiterkommuniziert, aber nicht selbst entworfen und umgesetzt werden könnte. Zudem wurde in den Gesprächen deutlich, dass es einiges an Einarbeitung braucht, bevor eine selbstständige Anpassung der Metadatenfelder möglich wäre. Dazu ergab sich aus dem angeforderten Kostenvoranschlag, dass auch Mitarbeiter*innen, die die Datenbank nur zwecks Recherche- bzw. Lese-Einsicht nutzen, eine eigene Lizenz für das Programm benötigen würden.

Der Entschluss für CollectiveAccess, einer Software zum Katalogisieren und Veröffentlichen von Museums- und Archivsammlungen, ergab sich letztlich aus mehreren Komponenten: Als Open Source Softwarelösung, der eine agile Entwicklergemeinde zugrunde liegt, passt dieses sehr gut zum Tonus des Projektes museum4punkt0. Die Erfahrungen, die sich aus den Gesprächen mit anderen Nutzer*innen herausfiltern ließen, waren sehr positiv, mit dem Hinweis, sich frühzeitig mit der Organisation von Metadatenfeldern und der Struktur zu beschäftigen, um eine optimale Nutzung des Programmes zu erreichen. Da CollectiveAccess die Möglichkeit bietet, auf die Wünsche des Nutzers anpassungsfähig zu reagieren, lässt es zukünftig Raum für Innovation und die Chance mit dem Museum mitzuwachsen. Es ist dazu in der Lage, umfangreiche Objektbeziehungen (siehe Anhang) herzustellen und ist für heterogene Sammlungen sehr gut geeignet. Thesauri können frei importiert und selbst erstellt werden. Es verfügt über umfangreiche Möglichkeiten, Medien wie Audio-, Video- und Bilddateien zu verknüpfen und in Datensätzen unterzubringen. Auch besteht die Möglichkeit multilingual zu arbeiten und sensible Daten und Nutzungsrechte anzugeben und zu regulieren. Ebenso sind Linked Open Data mit CollectiveAccess umsetzbar. Verschiedene Standards wie beispielsweise Spectrum (The UK Museum Documentation Standard) können integriert werden. CollectiveAccess bietet somit die nötige Unabhängigkeit, um das Deutsche Auswandererhaus in seiner Sammlungstätigkeit und einer späteren Präsentation von Sammlungsinhalten zielgerichtet zu unterstützen.

Aggregation Toolset:

Das programmierte Aggregation Toolset ermöglicht das Abrufen von Daten aus einer CollectiveAccess-Datenbank, das Zwischenspeichern in MongoDB und das Bereitstellen über eine GraphQL-API. Das Toolset besteht aus einem Express.js basierten CollectiveAccess Data Aggregator und einer Express.js basierten GraphQL-API mit MongoDB Atlas als Datenbank. Der Zweck des Aggregation Toolsets besteht darin, Daten aus der nativen CollectiveAccess-API vorzuverarbeiten und die Datenaggregation von der Endbenutzerinteraktion zu entkoppeln. Artikelbeziehungen können denormalisiert und alle relevanten Daten in ein einziges Dokument eingebettet werden. Mit GraphQL ist es möglich, sehr spezifische Anfragen einfach auszuführen und Underfetching (nachfolgende Anfragen notwendig) oder Overfetching (zu viel Ballast an unnötigen Daten) zu vermeiden. Die Verwendung des Toolsets als mittlere Ebene macht es bequemer, CollectiveAccess als Headless-Sammlungsdokumentationssystem zu verwenden.

Der Data Aggregator bietet dabei eine leichtgewichtige Middleware, die Daten aus einer CollectiveAccess-REST-API aggregiert, verarbeitet und in einer MongoDB-NoSQL-Datenbank speichert. Die Aggregation erfolgt unabhängig von der Datennutzung durch ein Frontend oder eine öffentliche API, also z.B. durch Auslösen einer URL oder periodisch über einen Cronjob.

Implementierung und Inbetriebnahme

Eine Herausforderung bei der Konzeption der Struktur der Datenbank und der verschiedenen Eingabemasken und Metadatenfelder lag insbesondere darin, ein gutes Maß zu finden zwischen einer sehr detaillierten Erfassung der Objekte und dem damit verbundenen noch vertretbaren Zeitaufwand. Es bedurfte einiger Zeit und Nachdenkens, um zusammen mit dem Programmierer hierfür eine systemlogische und praktisch umsetzbare Lösung zu finden. 

In technischer Hinsicht war eine wesentliche Erkenntnis bei der Anpassung der Datenbank an die spezifischen Bedarfe der Museumssammlung, dass es doch nicht in jedem Fall so einfach und intuitiv ist, herauszufinden, wie sich diese vornehmen lassen.

Nachnutzung und Weiterentwicklung

In der Anlage befindet sich eine Nutzwertanalyse verschiedener Datenbanksysteme, die das DAH näher in Betracht gezogen hatte, sowie eine Übersicht über Verknüpfungsmöglichkeiten in CollectiveAccess, also die Möglichkeiten, Beziehungen zwischen Datensätzen herzustellen.

Bereitstellung der Nachnutzung

Die Quelldateien mitsamt technischer Dokumentation steht anderen Kultureinrichtungen zum Download und zur individuellen Anpassung auf GitHub zur Verfügung. Weitere Elemente der Nachnutzung finden Sie im Anhang dieser Publikation.

Anhang: Nachnutzbare Elemente

Weitere Ergebnisse im Teilprojekt

Bild zum Ergebnis: CollectiveAccess-basierte Sammlungsdatenbank
Digitale Vermittlungstools

CollectiveAccess-basierte Sammlungsdatenbank

Deutsches Auswandererhaus Bremerhaven

Am Deutschen Auswandererhaus (DAH) wurde als Basisinfrastruktur eine Sammlungsdatenbank mit der Open Source Software CollectiveAccess erstellt.
Bild zum Ergebnis: Biographien-Portal
Digitale Vermittlungstools

Biographien-Portal

Deutsches Auswandererhaus Bremerhaven

Die interaktive Plattform erlaubt durch Objekte, Fotos, Videos und Texte einen vielschichten Zugang zu Migrationsgeschichten.

Impulse & Tools für die digitale Kulturvermittlung

workbook entdecken!
Consent Management Platform von Real Cookie Banner