Digitale Sammlungen
Handlungsfeld
Die zunehmende Verfügbarkeit von Quellen für Daten und Texte in digitaler Form erlaubt es, vormals unzugängliche Forschungsfragen zu bearbeiten ebenso wie Software-Lösungen für neue Anwendungsbereiche (z.B. Sprachverständnis, Navigation im physischen Raum, intelligente Websuche) zu schaffen. Unverzichtbare Grundlage dafür ist die Verfügbarkeit von wohlgepflegten Datensammlungen und geeignet kuratierten Textkorpora mit passendem fachlichen Inhalt, angemessener Qualität und Aktualität und nachvollziehbaren Prozessen ihres Zustandekommens. Der Nutzen, den moderne, oftmals mit erheblichen Hoffnungen bezüglich Wirtschaftsentwicklung und wissenschaftlichem Potential gehandelten Analysemethoden wie Machine Learning (ML), Text und Datamining (TDM) und Künstlicher Intelligenz (KI) stiften können, hängt von der Verfügbarkeit geeigneter Datensammlungen und Textkorpora auf denen sie angewendet werden ab. Datensammlungen und Textkorpora sind dabei nicht nur Grundlage von Forschung, sondern auch im Rahmen öffentlich geförderter wissenschaftlicher Arbeit wie kommerzieller Anstrengungen entstehendes, für Forschung und Wirtschaft gleichermaßen wichtiges Endprodukt.
Schwerpunkte 2018 bis 2022
Wesentlich ist die Beförderung des Zugangs zum digitalen und digitalisierten kulturellen Erbe aus Bibliotheken, Archiven und Museen (wie Primärliteratur, Archivmaterial, Objekten und Artefakten), zu digitalen Forschungsdaten (einschließlich hochwertigen ausgezeichneten Daten für KI-Trainingszwecke) sowie zu Gebrauchs- und Funktionsdaten, die außerhalb des Forschungsprozesses entstanden sind, die aber für die Forschung interessant sind. Bedeutend für die wissenschaftliche Evaluation ist die freie Zugänglichkeit und Verwendbarkeit von Zitations- und Referenzdaten ebenso wie die Verfügbarkeit von Datensammlungen für alternative Metriken (altmetrics). Darüber hinaus soll die Verbreitung von Daten nach den Prinzipien Auffindbarkeit, Zugänglichkeit, Interoperabilität und Nachnutzbarkeit (FAIR Data Principles) befördert werden. Methodisch sollen insbesondere die Möglichkeiten des Text- und Dataminings (TDM) nutzbar gemacht werden. Rechtliche Fragen, z.B. im Zusammenhang mit TDM, werden in Zusammenarbeit mit dem Handlungsfeld „Recht für Wissenschaft im digitalen Zeitalter“ bearbeitet.
Arbeitsgruppe
Kontakt:
Name | Benannt durch |
---|---|
Alexander Geyken | Deutsche Forschungsgemeinschaft |
Patrick Sahle | Deutsche Forschungsgemeinschaft |
Andrea Wuchner | Fraunhofer-Gesellschaft |
Christian Langenbach | Helmholtz-Gemeinschaft |
Nina Weisweiler | Helmholtz-Gemeinschaft |
Phillip Cimiano | Hochschulrektorenkonferenz |
Gerhard Heyer | Hochschulrektorenkonferenz |
Thomas Stäcker | Hochschulrektorenkonferenz |
Peer Trilcke | Hochschulrektorenkonferenz |
Reiner Mauer | Leibniz-Gemeinschaft |
Jana Hoffmann | Leibniz-Gemeinschaft |
Torsten Roeder | Leopoldina |
Margit Palzenberger | Max-Planck-Gesellschaft |
Friederike Kleinfercher |
Max-Planck-Gesellschaft |
Thomas Zastrow | Max-Planck-Gesellschaft |
Olaf Hering | Bibliotheken der Ressortforschungseinrichtungen des Bundes (BRB) (Gast) |