Direkt zum Inhalt
Computer Codes

«Computer Codes». Quelle: unsplash.com

Open-Media-Studies-Blog

Wir müssen reden. Über das Verhältnis von Forschungsdaten und Medienwissenschaft.

Dietmar Kammerer und Kai Matuszkiewicz zum Auftakt der Sonderreihe Forschungsdaten in der Medienwissenschaft

1.11.2021

Terra incognita? Medienwissenschaft und Forschungsdaten

Forschungsdaten spielen aktuell in der Wissenschaftspolitik eine große Rolle und sind mittlerweile nicht nur in den empirisch-quantitativ arbeitenden Disziplinen, sondern auch in den Geisteswissenschaften angekommen. Die Medienwissenschaft hingegen scheint sich noch nicht einig zu sein, wie sie zu Forschungsdaten steht und was genau darunter zu verstehen ist.1 Es ist somit an der Zeit, die Frage erneut und anders zu stellen: Nicht was Forschungsdaten sind, sondern: Was sie für die Medienwissenschaft sein können, muss diskutiert werden. Dieser Diskurs muss breit geführt werden, da er einerseits unterschiedliche Akteur_innen (Wissenschaftler_innen, Verlage, Bibliotheken, Förderinstitutionen u. a. mehr) betrifft und andererseits die gesamte wissenschaftliche Praxis berührt. Es geht, mit anderen Worten, aus unserer Sicht um deutlich mehr als nur darum, neue (Daten-)Kompetenzen («Wie erstelle ich einen Datenmanagementplan?2 Welches Metadatenschema sollen wir verwenden?») zu akkumulieren. Forschungsdaten sind eine (mögliche) Perspektive auf die Transformation (geistes-)wissenschaftlicher Praxis unter den Bedingungen der Digitalisierung. Das mitunter vorgebrachte Argument, die Medienwissenschaft erzeuge als geisteswissenschaftliche Disziplin, die kaum empirisch und hauptsächlich qualitativ arbeite, keine Forschungsdaten, geht daher am Kern der Sache vorbei.3

Medienwissenschaftler_innen, die sich trotz aller Unwägbarkeiten in das unbekannte Land der Forschungsdaten begeben, müssen schnell feststellen, dass auch die bestehenden Informationsangebote, die eine dezidiert geisteswissenschaftliche Perspektive auf Forschungsdaten einnehmen, zu wenig auf die konkreten, fachspezifischen Bedarfe der Medienwissenschaft eingehen.4 Denn letztlich bestimmen die Spezifika der Forschungsgegenstände einer jeden Disziplin, was innerhalb dieser als «Forschungsdatum» gelten darf und nach welchen Standards dieses behandelt werden sollte. Was (und wozu) medienwissenschaftliche Forschungsdaten eigentlich sind, kann (und muss) die Medienwissenschaft nur selbst beantworten.5 Derartige Fragestellungen lassen sich adäquat einzig in einem breiten fachlichen und in jederlei Hinsicht offenen Diskurs aushandeln.

Ziele

Wir wollen mit dieser Sonderreihe keine allgemeine Einführung in Forschungsdaten und Forschungsdatenmanagement vorlegen, die erklärt, was FAIR Data Principles 6sind oder ein Datenlebenszyklus. Wir wollen einen intrinsisch motivierten, nicht lediglich auf Fördermaßgaben reagierenden Fachdiskurs initiieren, der wissenschaftsgetrieben zu einem Forschungsdatenmanagement führt, das der medienwissenschaftlichen Wissenschaftspraxis angemessen und nützlich ist. Hierfür möchten wir alle beteiligten Institutionen und Akteur_innen, wie auch Teildisziplinen, Forschungstraditionen und Vorkenntnisstände in ihrer Heterogenität für eine ergebnisoffene Diskussion berücksichtigen. Idealerweise führt dies nicht nur zu einer offeneren internen Wissenschaftskommunikation,7 sondern auch zu offeneren Forschungsdaten, welche wiederum Anschlussprojekte ermöglichen.

Auch wenn wir mit der Sonderreihe keine allgemeine Einführung bieten wollen, so möchten wir diesen Beitrag dennoch nutzen, um – orientiert am Datenlebenszyklus – einen thematischen Einstieg anhand ausgewählter Stationen sowie einzelner Forschungsgegenstände und -produkte vorzunehmen. Dieser kursorische Blick lässt freilich mehr aus, als er einschließt, sollte deshalb lediglich als Überblicksdarstellung verstanden werden, die zentrale Problemstellungen im Kontext von Forschungsdaten tangiert. Abgeschlossen wird der Text von konkreten Angeboten zu Diskussion und Mitwirkung. 

Forschungsdaten erheben

Als eines der größten sozialen Netzwerke ist Twitter ein wichtiger Untersuchungsgegenstand und so geraten städtische Twittersphären ebenso in den Blick wie Twitter als vermeintliches Stimmungsbarometer oder die Rolle, die das Netzwerk im Kontext des gegenwärtigen politischen Populismus-Diskurses spielt. Besondere Herausforderungen im Hinblick auf Forschungsdaten und das Forschungsdatenmanagement liegen hierbei im rechtlichen und im technischen Bereich. Die öffentliche Zugänglichmachung von Forschungsdaten kann erschwert werden, wenn es sich hierbei um sensible personenbezogene Daten handelt, die in einem Netzwerk mit strikten Richtlinien erhoben werden. Mitunter kann dies dazu führen, dass Datensätze nicht öffentlich zugänglich gemacht werden und entsprechend weder auffindbar noch nachnutzbar sind. Derartige Probleme können aber umgangen oder abgemildert werden mit einer sorgsamen Planung und Dokumentation. Dies gilt insbesondere für medienethnografische oder nethnografische Forschungsvorhaben, die zudem eine stärkere Fokussierung auf forschungsethische Belange verlangen.8

Aufgrund des ephemeren Charakters von Twitter und der Tweets ist zudem eine langfristige technische Sicherung der erhobenen bzw. bearbeiteten Datenbestände essentiell. Forschungspublikationen, die sich mit Tweets als Erscheinungsform reziproker kommunikativer Handlungen von Nutzer_innen befassen, können teilweise nur im Kontext von Forschungsdatensätzen nachvollzogen werden. Wie umfangreich die Dokumentation von Tweets sein kann, lässt sich an der Erfassung der zugehörigen Metadaten verdeutlichen, die korrelierende Betrachtungen erlauben.9

Forschungsdaten anreichern

Wer Gegenstände durch Metadaten beschreibt, sieht sich rasch vor die Frage gestellt, welche Form diese Beschreibung annehmen soll: Welche Begriffe sollen verwendet werden? Welche Restriktionen gelten für die Beschreibung? Damit Metadaten sinnvoll genutzt werden können, sind klar definierte Schemata und eine einheitliche Verwendung von Begriffen unumgänglich. Eine Schlagwortliste oder kontrolliert-strukturierte Vokabulare sind ein erster Schritt, ihre Nützlichkeit reicht aber nur so weit, wie das verwendete Vokabular nicht nur projektintern, sondern (mindestens) auch innerhalb der Fachcommunity anerkannt wird (idealerweise noch darüber hinaus). Während andere Disziplinen (etwa die Soziologie oder die Gender Studies) gemeinsame Standards der Beschreibung von Ressourcen entwickeln, fehlt es in der Medienwissenschaft bislang an solchen Initiativen.

Ein anderes Problem stellt der Mangel an Normdaten dar, über die unter anderem Personen, Werke, Orte oder Institutionen eindeutig referenzierbar gemacht werden können. Die Gemeinsame Normdatei (GND) hat weniger als 6.000 Filmwerke in ihrem Verzeichnis. Sucht man nach Fernsehserien oder Games, sieht das Ergebnis noch deutlich schlechter aus. Auch hier sollten Kooperationen gebildet und Verfahren entwickelt werden, die GND für unser Fach nutzbarer zu machen; zumal Normdaten die Voraussetzung sind, um Datensätze als Linked Open Data verknüpfbar zu machen.

Forschungsdaten (langzeit-)archivieren

Ein Blick auf die Geschichte der Videospiele verdeutlicht die Notwendigkeit einer konsequenten Langzeitarchivierungsstrategie für Forschungsvorhaben mit komplexen digitalen Objekten als Forschungs(primär)daten. Etliche Spiele aus den 1940er und 1950er Jahren sind nur noch in Erzählungen überliefert und auch ihre Medienträger (zumeist Großrechner an US-Hochschulen) sind nicht mehr vorhanden. Dieses kulturelle Erbe adäquat zu sichern, ist ein aufwändiges (nicht nur) technisches Unterfangen. Viele Infrastrukturanbieter betreiben die Langzeitarchivierung von Daten mittels Bitstream Preservation oder ggf. durch Formatmigration. Videospiele hingegen können als komplexe Objekte angemessen nur via Emulation gesichert werden. Dies ist technisch anspruchsvoll und aus Perspektive des Urheberrechts nicht unproblematisch. Neben diesem Konflikt zwischen rechtlichen Bestimmungen und dokumentarisch-konservatorischem Auftrag können aber selbst Emulationen nur einen Teil des ursprünglichen Rezeptionskontextes bereitstellen, da z. B. die Hardware-Schnittstelle nicht nachgebildet werden kann. Eine wichtige Ressource für die Erforschung von Videospielen stellt etwa die Datenbank der Internationalen Computerspielesammlung dar.

Um die notwendige Expertise für Forschungsprojekte mit komplexen digitalen Objekten zu versammeln, bietet es sich an, auch informationsfachliche Kolleg_innen zu beteiligen, wie es z. B. im Projekt diggr.link geschehen ist. Projekte wie dieses unterstreichen ferner die besondere Bedeutung, die der Entwicklung von Workflows in diesem Kontext zukommt. Ebenso sind die Metaverdatung und Zitation bei komplexen digitalen Objekten gesondert zu betrachten. Für den Zugang zu bereits archivierten digitalen Objekten als medienwissenschaftlichen Forschungsdaten spielen Kooperationen mit GLAM-Institutionen (Galleries, Libraries, Archives, Museums) eine entscheidende Rolle, weshalb Konsortien wie NFDI4Culture bewusst Hochschulen und GLAM-Institutionen miteinander verbinden.

Forschungsdaten publizieren

Um Forschungsdaten zu sammeln, zu verwalten und zu veröffentlichen, ist in der Regel eine Datenbank die beste Wahl. Das heißt nicht nur, aus einer riesigen Auswahl die Entscheidung für ein konkretes Datenbankmanagementsystem (DBMS) treffen zu müssen. Ebenso schwierig sind Entscheidungen über Aufbau und Design der Datenbank selbst: Wie sollen die Daten modelliert, mit welchem Schema sollen sie erfasst werden? Wie kann man eine Datenbank so gestalten, dass sie auch nachträglich Veränderungen zulässt? Wie wird die Erhebung der Daten am besten dokumentiert? Und andere Fragen mehr. Mit Abschluss des Forschungsprojektes stellt sich schließlich die Frage nach der Veröffentlichung: Sollen die Daten zugänglich gemacht werden? Wenn ja, unter welcher Lizenz? Welche Institution kann die Daten langfristig zugänglich machen und sichern? Über welche Schnittstellen sollen die Daten zugänglich gemacht werden?

Ein möglicher Weg der Zugänglichmachung sind Repositorien für Forschungsdaten, ein anderer –  als Alternative oder als Ergänzung – ist es, die Daten auf einer eigenen Website vorzustellen. Hierbei ist bekanntlich das drängendste (und weitgehend ungelöste) Problem das der langfristigen Aufrechterhaltung und Erreichbarkeit der Website und der Funktionalität der Datenbank.

Forschungsdaten erklären

Ein Data Paper beschreibt einen oder mehrere veröffentlichte Datensätze. Forscher_innen können auf diese Weise den von ihnen erstellten Forschungsdaten höhere Sichtbarkeit in ihrer Fachcommunity verschaffen. Im Vergleich zu Aufsätzen oder Beiträgen in Sammelbänden sind Data Papers in der Regel kürzer und stärker strukturiert. Sie dienen ausdrücklich nicht dazu, Forschungsergebnisse zu präsentieren oder Thesen zu diskutieren. Sie referenzieren den Datensatz, beschreiben den Kontext der Entstehung (Forschungsfragen, beteiligte Institutionen und Personen), die Methoden der Datenerhebung sowie die dabei verwendeten Quellen und den Zeitraum. Auch die Datenmodelle und andere ggf. eingesetzte Standards – Metadaten-Schemata, kontrollierte Vokabulare, Normdaten, Schnittstellen, im Projekt entwickelte Definitionen der Felder u. a. mehr – werden erläutert. Auf diese Weise werden Datensätze für Nutzer_innen verständlicher und leichter nachnutzbar. Ein Data Paper erläutert und diskutiert zudem detailliert mögliche Einschränkungen oder Verzerrungen (bias) in den verwendeten Quellen oder erhobenen Daten, was deren Auswahl, Zugänglichkeit, Zuverlässigkeit oder Repräsentativität betrifft. Das erhöht die Vertrauenswürdigkeit der Forschungsdaten, vor allem, wenn das Data Paper selbst ein Peer Review-Verfahren durchlaufen hat. Ein Data Paper kann zudem weitere denkbare Forschungsfragen skizzieren, die an die veröffentlichten Daten künftig gestellt werden könnten.

Alle genannten Aspekte – Sichtbarkeit, Verständlichkeit, Nutzbarkeit und Vertrauenswürdigkeit – erhöhen die Wahrscheinlichkeit, dass die erhobenen Daten für Anschlussforschungen genutzt werden. Zugleich adressieren Data Papers das Problem der fehlenden Anerkennung für die Produktion und Freigabe von Forschungsdaten. Data Papers erscheinen häufig in Datenjournalen. Während in den MINT-Fächern eine hohe Zahl an spezialisierten Publikationsorganen zur Auswahl steht, ist die Auswahl für die Geistes- und Kulturwissenschaften überschaubar.10

Anlaufstellen zu medienwissenschaftlichen Forschungsdaten

Die technischen und rechtlichen Implikationen der Erhebung von Forschungsdaten, deren Metaverdatung, (Langzeit-)Archivierung sowie Zugänglichmachung oder Honorierung in der Medienwissenschaft sind Aspekte eines unbekannten Landes, das es in großen Teilen erst noch abzustecken gilt. Umso wichtiger sind Anlaufstellen, die beratend und unterstützend zur Seite stehen, die aber auch die Möglichkeiten zur Mitwirkung und Mitgestaltung einräumen wie NFDI4Culture oder media/rep/:

NFDI4Culture ist das Konsortium innerhalb der Nationalen Forschungsdateninitiative (NFDI), das sich mit Forschungsdaten zu materiellen und immateriellen  Kulturgütern befasst. Unter Beteiligung von Fachgesellschaften, Universitäten, Akademien und Kulturerbe-Institutionen ist es das Ziel von NFDI4Culture, bedarfsgerechte  Dienste und Angebote für Forschungsdaten aus der Architektur-, Kunst- und Musik-, Theater-,  Tanz-, Film- und Medienwissenschaft zu schaffen.11

media/rep/ ist das Open-Access-Fachrepositorium der Medienwissenschaft. Bislang nimmt das Projekt vor allem Zweitveröffentlichungen auf und macht diese frei und dauerhaft zugänglich. Gegenwärtig wird zudem ein Forschungsdatenrepositorium entwickelt, das ab 2022 medienwissenschaftliche Forschungsdaten fachbezogen aufnehmen soll. Hierdurch lassen sich sowohl die Sichtbarkeit der Forschungsdaten innerhalb des Faches erhöhen, als auch diese mit anderen Datenbeständen oder den Publikationen im Repositorium verknüpfen, wodurch sich weitreichende Nachnutzungsmöglichkeiten eröffnen.

media/rep/ und NFDI4Culture kooperieren dabei in enger Abstimmung, um Dienste und Angebote für Forschungsdaten in der Medienwissenschaft zu entwickeln.

Einladung zur (Fach-)Diskussion

Was folgt aus dem Ausgeführten? Wie kann es weiter gehen? Im Namen von media/rep/ und NFDI4Culture laden wir – nicht zuletzt auch in unserer Funktion als deren Koordinatoren – dazu ein, sich auf eine oder beide der folgenden Weisen an der Diskussion um Forschungsdaten in unserem Fach zu beteiligen:

  1. Teilnahme am Forum Medienwissenschaft in der NFDI4Culture. Dieses Forum dient dem Austausch zu grundsätzlichen Fragen, aber auch zu konkreten praktischen Anliegen. Projekte, die mit Forschungsdaten arbeiten, sollen sich hier miteinander austauschen, wertvolle Erfahrungen teilen können. Die Diskussion zu einzelnen Aspekten (z. B. Datenpublikation, Anerkennung als wissenschaftliche Leistung, Förderrichtlinien usw.) kann hier vertieft geführt werden. Das Forum realisiert sich über konkrete Treffen und Veranstaltungen, aber auch als Diskussionskanal im Team-Chat-Dienst RocketChat. Wer daran teilnehmen will, schickt bitte eine Mail an: dietmar.kammerer@staff.uni-marburg.de
  2. Verfassen von Beiträgen für die Sonderreihe. Das Anliegen der Sonderreihe, die mit diesem Beitrag eröffnet wird, ist es einerseits, ein vertieftes Bewusstsein und eine größere Sensibilität für das Thema zu schaffen und andererseits einen Diskurs anzustoßen sowie Diskussionsplattform zu sein, wobei das Fach in seiner thematischen und methodischen Vielfalt berücksichtigt werden soll. Wer Interesse hat, im Open-Media-Studies-Blog an dieser für die offene Medienwissenschaft essentiellen Diskussion teilzunehmen, ist herzlich eingeladen, Proposals an info@mediarep.org zu schicken. Weitere Informationen zum Open-Media-Studies-Blog sind bitte der entsprechenden Seite zu entnehmen. Ein konkreter Call for papers folgt Anfang 2022.

Bevorzugte Zitationsweise

Kammerer, Dietmar; Matuszkiewicz, Kai: Wir müssen reden. Über das Verhältnis von Forschungsdaten und Medienwissenschaft.. Dietmar Kammerer und Kai Matuszkiewicz zum Auftakt der Sonderreihe Forschungsdaten in der Medienwissenschaft. In: Zeitschrift für Medienwissenschaft, ZfM Online, Open-Media-Studies-Blog, , https://zfmedienwissenschaft.de/online/open-media-studies-blog/wir-muessen-reden-ueber-das-verhaeltnis-von-forschungsdaten-und-medienwissenschaft.

Die Open-Access-Veröffentlichung erfolgt unter der Creative Commons-Lizenz CC BY-SA 4.0 DE.