RESEARCH DATA MANAGEMENT

E-LEARNING PLATFORM

Modul 8

Tools

Beginnt man sich mit Forschungsdatenmanagement auseinander zu setzen, stellen sich schnell viele praktische Fragen. Meist beginnen diese bereits in der Phase des aktiven Forschungsdatenmanagements. Welche Daten und Dokumente, die im Laufe des Forschungsprozesses anfallen, gehören zu den Forschungsdaten? Wie kann ich diese erheben und verwalten? Welche Tools stehen mir für den Forschungsprozess zur Verfügung?

Im ersten Teil des Moduls beschäftigen wir uns mit verschiedenen Tools, die der Unterstützung des geisteswissenschaftlichen Forschungsprozesses dienen.

Der zweite Teil des Moduls ist den Repositorien gewidmet. Diskutiert wird die Frage, wie die Daten wo verwaltet und archiviert werden können. Zu diskutieren gilt es die Rolle, die die Bibliotheken im Forschungsdatenmanagement übernehmen können.

All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.

  35 min

Lernziele

  • Die TeilnehmerInnen haben die Erfahrungen, die mit der Forschungsinfrastruktur für Digital Humanities in Deutschland, TextGrid in den letzten Jahren gemacht worden sind, reflektiert.
  • Sie kennen einige generische Tools, die in zahlreichen Digital Humanities Projekten nützlich sein können.
  • Sie haben reflektiert, ob ihre Bibliothek (z.B. eine Fachbereichsbibliothek), Tools zur Unterstützung der Forschenden zur Verfügung stellen soll.
  • Sie wissen, wo die Daten gespeichert werden können.

SCENARIO

Jonas arbeitet in einer Institutsbibliothek. Er ist sich bewusst, dass Forschungsdatenmanagement in nächster Zeit enormen Bedeutungszuwachs erfahren wird und dass die  Bibliothek letztlich die Daten verwalten und zur Verfügung stellen muss. Er weiss aber auch, dass die Forschenden in seinem Institut noch kaum Schritte in diese Richtung unternommen haben. In der Literatur hat er auch gelesen, dass gerade Forschende der Digital Humanities oft nicht zu motivieren sind, ihre Daten aufzubereiten und zu teilen.

Daher fragt er sich, welche Dienste er den Forschenden zur Verfügung stellen kann, so dass diese Daten vielleicht eher abliefern und den Nutzen des Datenteilens erkennen.

Eine grosse Frage ist für ihn aber auch, wo er die Daten schliesslich – wenn er sie einmal erhalten hat – verwalten könnte. Das Projekt für den Aufbau eines nationalen Datenzentrums für die Digital Humanities wird erst in einigen Jahren zur Verfügung stehen. Was kann er bis dahin anbieten?

Folie 1

Folie 2

Dieses Modul ist in vier Teile untergliedert.

Folie 3

TextGrid ist ein Forschungsverbund mit dem Ziel, eine virtuelle Forschungsumgebung für Geistes- und Kulturwissenschaftler zu schaffen. Insbesondere für digitale Editionsprojekte soll Informationstechnologie zur Verfügung gestellt werden. Laufzeit des Projekts war 2005 – 2015.
DARIAH-de ist Teil eines europäischen Forschungsprojekts, in dem digitale Tools und Dienste für die Kultur- und Geisteswissenschaften entwickelt und zur Verfügung gestellt werden.
Die Erfahrungen, die hier zusammengetragen sind, basieren auf:

  1. Bender, Forschungsumgebungen in den Digital Humanities, Berlin/Boston 2016

Workshop Adaptive Deinstleistungen zur Unterstützung von Science 2.0, München 10.-11. Sept 15 http://www.ub.tum.de/workshop-science-2.0

Öffentlicher Abschlussbericht von Badenwürttemberischen Forschungsdatenmanagement-Communities bwFDM-Communities, Wissenschaftliches Datenmanagement an den Universitäten Baden-Württembergs: http://bwfdm.scc.kit.edu/downloads/Abschlussbericht.pdf

Folie 4

Oft wird in der Literatur darauf hingewiesen, dass die Forschenden ihre Daten nicht teilen wollen und dass dies eines der grossen Hindernisse für das Forschungsdatenmanagement sei. Das ist nicht zu bestreiten. Es zeigt sich aber auch, dass die Forschenden selbst mit der aktuellen Situation nicht zu frieden sind. Zu sehr sind sie sich selbst überlassen und müssen für sich Lösungen erarbeiten.

Aus dem Abschlussberichts vom bwFDM-Communities (http://bwfdm.scc.kit.edu/downloads/Abschlussbericht.pdf) lässt sich folgern, dass die Forschenden wohl Vorbehalte gegen ein strukturiertes (will wohl heissen: verordnetes)  Datenmanagement haben, doch sehr wohl Unterstützung für das Managen der Daten der eigenen Forschung wünschten und insbes. Möglichkeiten zur Verknüpfung von Daten und Publikationen und zur Langzeitarchivierung der eigenen Daten sehr schätzen würden. Dies könnten neue Aufgaben für Bibliotheken sein.

Folie 5

Folie 6

Folie 7

Oben hat sich gezeigt, dass viele Forschende dankbar wären für Hinweise auf Tools und allenfalls unterstützende Einführungen. Die aufgeführten Beispiele bieten zumindest einen ersten Einstieg in die ausgesprochen vielfältige Welt der unterschiedlichen Tools.

Eine Bibliothek kann darüber hinaus noch weitere Unterstützung bieten, so dass die Forschenden ihre Daten einfacher verwalten können. Z.B. indem sie den Zugang zur Software gewährt oder auch Empfehlungen für Schulung zu einzelnen Tools abgibt. Hinweise auf MOOCS oder Schulungsvideos sind klassische bibliothekarische Dienste, die wesentlich dazu beitragen könnten, dass die Forschenden einen Einstieg in das Forschungsdatenmanagement finden können.

Folie 8

Zweifellos bearbeiten Forschende je unterschiedliche Fragestellungen. Oft wird daher vorgebracht, dass jedes Projekt seine je eigenen Tools benötigt. Das trifft in Vielem sicher zu. Doch es gibt auch Aufgaben, die in sehr vielen Projekten auftreten. Die obige Liste enthält einige solcher generischen Aufgaben, die sich sehr oft stellen.

Im Folgenden sei auf einige wenige Dienste aufmerksam gemacht. Alle sind sie dem Angebot von DARIAH.de entnommen.

https://dmptool.org/plans/19207.pdf

Folie 9

Georeferenzierung kann sehr oft eine erste Form der Visualisierung sein, die Spannendes zu Tage fördert. Der Geo-Browser von DARIAH-DE erlaubt es, mit einem einfachen Tool Daten in einem Editor zu erfassen, Koordinaten von Ortschaften zu ermitteln und schliesslich die Daten auf historischen wie auch aktuellen Karten darstellen zu lassen. Im Bild die Publikationsorte von Texten von Franz Kafka.

https://geobrowser.de.dariah.eu/edit/index.html#id=404651

Folie 10

Das zweite Beispiel ist ein Personendatenrespositorium. Das Personendatenrespositorium erlaub es, Daten zu Personen einfach zu erfassen.  Wenn die Forschenden eines Institut gemeinsam einen Corpus von Personendaten pflegen, ergeben sich ev. viele neue Bezüge.

https://de.dariah.eu/personendatenrepositorium

Folie 11

Das dritte Beispiel eines generischen Tools ist ein einfaches Werkzeug zur Analyse von Worthäufigkeiten in einem Textkorpus.

http://voyant-tools.org/

Folie 12

Als viertes Beispiel sei ein Tool erwähnt, das das kollaborative Arbeiten erleichtern kann. Werkzeuge, die diese Funktion übernehmen sind aktuell sehr viele erhältlich. Die Aufgabe der Bibliothek könnte es sein, die Auswahl eines solchen Kollaborationswerkzeugs zu unterstützen.

http://etherpad.org/

Folie 13

Mit den wenigen Beispielen sollte aufgezeigt werden, dass es notwendig ist, den Forschenden Orientierung zu den vielen Angeboten zu liefern. Vorstellbar ist, dass die Forschenden eines Instituts mit ähnlichen Methoden an unterschiedlichen Gegenständen forschen. Da kann die Bibliothek, wenn sie die Nutzung von Tools unterstützt, dazu beitragen, dass Forschungsdaten systematischer erfasst werden. Durchaus möglich ist es, dass in einem Institut der Aufbau eines gemeinsamen Korpus von Texten oder Personendaten Neue Perspektiven eröffnet.

Folie 14

Folie 15

Folie 16

In den Digital Humanities kommt der Dokumentation des Entstehungsprozesses der Forschungsdaten vielleicht eine noch grössere Bedeutung zu als in andern Disziplinen. Der ‘Throuput’ stellt selbst Forschungsdaten dar. Die Dokumentation des Entstehungsprozesses ist unzuverlässiger, wenn dazu verschiedene Instrumente verwendet werden. Die Führung eines sog. ‘Laborjournals’ drängt sich auf.

In der Life Science-Industrie sind kommerzielle Digitale Laborjournale (ELN) etabliert. Demgegenüber kennen die digital Humanities diese Werkzeuge noch weniger. Gute Dienste können hier aber auch generische Kollaborationstools, wie SharePoint oder Confluence leisten.

Folie 17

Allerdings sind SharePoint oder Confluence sehr mächtige Werkzeuge, die ihr Potential nur entfalten können, wenn sie richtig implementiert worden sind. Dies ist eine Hochschulaufgabe. Wird die Implementation nicht systematisch vorgenommen, versagen die Instrumente schnell du die Forschenden arbeiten mit andern Tools.

Folie 18

Niederschwellige Alternativen zu den erwähnten Kollaborationtools stellen EverNote oder OneNote etc. dar, die ebenfalls für die Zusammenarbeit genutzt werden können. Diese basieren aber auf Cloudlösungen, was ein gewisses Sicherheitsrisiko für die Daten bedeutet. Aufgabe der Bibliothek kann es sein, auf solche Tools aufmerksam zu machen, über Chancen und Gefahren derselben zu informieren – allenfalls auch darauf hinzuarbeiten dass alle Forschenden dasselbe Tool verwenden, was die Verwaltung der Forschungsdaten bereits erheblich erleichtern würde.

Folie 19

Jedes Projekt erfordert auch Projektmanagement. Das Kanbanboard ist heute eine weit verbreitete Möglichkeit zur agilen Projektplanung. Trello ist ein Tool, das ein Kanbanboard repräsentiert und Notizen und Anhänge verwalten kann – eine von vielen Möglichkeiten, die Dokumentation der Entstehung von Forschungsdaten zu  erleichtern.

Folie 20

Folie 21

Folie 22

Die Kultur- und GeisteswissenschafterInnen wollen Nachnutzung und Sichtbarkeit erhöhen und erhoffen sich dazu von fachspezifischen Repositorien den grössten Gewinn. Solange solche – wie in der Schweiz – noch nicht zur Verfügung stehen, gilt es Zwischenlösungen zu realisieren.

Mögliche Ansätze:

Aufbau eines eigenen institutionellen Repository

Nutzung eines bestehenden Repository – die Übersicht: http://www.re3data.org/

Folie 23

Schliesslich sei noch auf eine Alternative aufmerksam gemacht, die besonders interessant ist, da sie die Möglichkeit bietet, Daten und Publikationen zusammen abzulegen. Allerdings handelt es sich hier um eine proprietäre Lösung – mit allen Nachteilen, die das mit sich bringt.

Folie 24

Folie 25

LOOK

Überblick Tools

Weitere nützliche Tools sind zu finden unter:

https://wiki.de.dariah.eu/display/TextGrid/Subject-specific+Tools+and+Services

Eingehendere Darstellungen der Möglichkeiten mit den TextGrid tools und Erfahrungen finden sich in:

Neuroth, Heike, Rapp, Andrea, Söring, Sibylle (Hrsg.), TextGrid: Von der Community – für die Community. Eine Virtuelle Forschungsumgebung für die Geisteswissenschaften, 2015: https://univerlag.uni-goettingen.de/bitstream/handle/3/Neuroth_TextGrid/TextGrid_book.pdf

Übung: Elektronisches Laborjournal
  • Wissen Sie, mit welchen Tools die Forschenden ihre Prozesse dokumentieren?
  • Steht den Forschenden ein gemeinsames Laufwerk / DMS zur Verfügung, mit dem sie die wichtigsten Dokumente / Daten verwalten könnten?
  • Kann die Bibliothek den Forschenden ein elektronisches Laborjournal zur Verfügung stellen?
  • Bietet die Bibliothek bereits Schulungen für Literaturverwaltungstools an? Kann im Rahmen dieser Schulungen auch ein elektronisches Laborjournal propagiert werden?
Übung: Was tun, bis ein nationales Repository für DH-Forschungsdaten steht?

Die Übung besteht aus 2 Teilen.

In einem ersten Teil suchen Sie nach Repositorien, die ähnliche Daten enthalten, wie sie in ihrem Institut entstehen. Repositorien, die solche Daten enthalten, könnten ev. als Alternative zu einem nationalen fachspezifischen Repositorium in Frage kommen. Suchen Sie u.a. unter: http://www.re3data.org/

Um zu evaluieren, ob die gefundenen Repositorien in Frage kommen könnten, stellen sie sich folgende Fragen:

    • Sind die Daten genügend beschrieben / brauchbar?
    • Finden Sie die Daten mit einer Suchmaschine oder über einen Metakatalog?
    • Wie können die Forschenden hier publizierte Daten finden?

Im zweiten Teil der Übung überlegen Sie sich, ob sich diese Repositorien auch zur Publikation der Daten ihres Instituts eignen. Stellen sie sich dazu die folgenden Fragen:

    • Sind die Daten genügend beschrieben / brauchbar?
    • Finden Sie die Daten mit einer Suchmaschine?
    • Könnten Sie die ermittelten Repositorien den Forschenden ihres Instituts für die Publikation eigener Daten empfehlen?
    • Falls Sie noch in Zweifel sind, fragen sie nochmals, wie wichtig der nationale wirklich ist. Wäre es allenfalls möglich, die Daten auf TextGrid Rep zu publizieren?

Ist fachspezifisches Repository zwingend? Sonst könnte Zenodo interessant sein.

Übung: Mit kleinen Schritten eine grosse Aufgabe angehen?

Diskutieren Sie:

  • Wie steigen sie in das Forschungsdatenmanagement ein?
  • Können sie die bibliothekarische Kernaufgabe (Zugang zu Daten gewährleisten) erfüllen?
  • Wo können sie die Daten bereitstellen?
  • Können sie gewährleisten, dass der Throughput erfasst wird?
  • Können sie den Forschenden Hilfestellung zur Verwaltung des Throughput bieten?
  • Stellen sie Tools für die Datenproduktion zur Verfügung?
  • Wie verändern obige Massnahmen die Beziehung Bibliothek – Forschende?

Halten Sie auf einem Flipchart fest was Sie Morgen machen

TAKEAWAYS

Takeaways

Im Rahmen der Projekte TextGrid und DARIAH-DE sind zahlreiche Tools entwickelt worden, die Forschenden der Digital Humanities guten Dienste erweisen können. Bibliotheken könnten den Ort darstellen, wo – ähnlich wie auf Literaturverwaltungsprogramme – auch auf solche Tools aufmerksam gemacht wird. Die Bibliotheken hätten so die Möglichkeit, noch intensiver mit den Forschenden zusammen zu arbeiten und so dazu beizutragen, dass die Produktion und Verwaltung der Forschungsdaten systematischer werden könnte.

Noch gibt es kein nationales Fachrepositorium für Daten der Digital Humanities in der Schweiz. Es existieren jedoch bereits verschiedene Angebote zur Verwaltung und Archivierung von Forschungsdaten. Die ersten Schritte können heute in Angriff genommen werden.

Bitte zitieren als
STETTLER, Niklaus. Modul 8: Tools. In: MASTRANDREA, Elena, PRONGUÉ, Nicolas, SCHNEIDER, René und STETTLER, Niklaus, Kursbuch Forschungsdaten [online]. HTW Chur – HEG Genève, 2017. Verfügbar unter: https://campus.hesge.ch/researchdatamanagement/?page_id=4762