Data sharing group

„Data sharing“ Seminar ein voller Erfolg Internationaler Zentralbankkurs, Frankfurt, 11.-15. Juni 2018

Vor gut zehn Jahren riefen die Finanzminister und Zentralbankpräsidenten der G 20 die „Data Gaps Initiative“ (DGI) ins Leben; sie reagierten damit auf Datenlücken in den statistischen Erhebungen wie auch auf eine mangelnde Verfügbarkeit von Mikrodatenbeständen. Beide Defizite traten im Zuge der weltweiten Finanz- und Wirtschaftskrise im Jahr 2008 zutage. Beispielsweise wären zu dieser Zeit für eine Analyse der Verflechtungen von Marktteilnehmern untereinander sowie der Identifizierung betroffener Handelspartner der insolvent gegangenen Bank Lehman Brothers disaggregierte Daten notwendig gewesen, sogenannte granulare Daten oder Mikrodaten. Aufgrund der defizitären Daten- und Informationslage entstand ein generelles Misstrauen am Markt und die Interbankenliquidität versiegte nahezu vollständig. Um Datenlücken zu beheben, ist eine zentrale Empfehlung der DGI den Zugang zu Mikrodaten sowie - sofern möglich - auch deren Austausch zwischen Institutionen zu verbessern. Durch einen besseren Zugang zu und Austausch von Mikrodaten können unter anderem die Wirkungen politischer Maßnahmen detailliert analysiert werden, insbesondere im Zentralbankkontext im Bereich der Geld- und Währungspolitik sowie der Finanzstabilität. Nur die Analyse granularer Daten erlaubt es eine mögliche Heterogenität der untersuchten Einheiten abzubilden, wie im Falle unterschiedlicher Marktteilnehmer z.B. Banken, Unternehmen oder privater Haushalte. Granulare Daten werden auch benötigt, um die Effekte regulatorischer Maßnahmen zu beurteilen.

Oftmals ist zur Beantwortung von komplexen Fragestellungen notwendig, dass nicht nur einzelne Datenbestände analysiert werden. Vielmehr sollten die Mikrodaten intern über Abteilungsgrenzen hinaus ausgetauscht bzw. der Datenzugang gewährt werden können, was je nach Größe der datenerhebenden Institution und je nach Bandbreite der von ihr abgedeckten Fachgebiete nicht trivial ist. Von zentraler Bedeutung sind folglich die Harmonisierung, Standardisierung und Zusammenführung von großen Mikrodatenbeständen innerhalb einer Institution, aber auch zwischen Institutionen (wie z.B. der Datenzugang mit Statistikämtern). Der Zugang zu den Mikrodaten der Bundesbank wird über das Forschungsdaten- und Servicezentrum (FDSZ) geregelt. Dabei muss insbesondere eine gesetzliche Grundlage existieren, die die externe Forschung mit den erhobenen Mikrodaten für die Wissenschaft zulässt. Mit zunehmender Granularität von Daten erhöht sich auch deren Schutzbedarf. Oberste Maxime bei der Arbeit mit Mikrodaten ist die strikte Einhaltung der jeweiligen gesetzlichen Datenschutz- und Geheimhaltungsbestimmungen und somit die Gewährleistung der Vertraulichkeit der z.B. von Meldepflichtigen eingereichten Angaben. Entsprechend wächst der Bedarf für einen Wissensaustausch zu Möglichkeiten des Zugangs zu Mikrodaten für eine institutsinterne Nutzung über Abteilungsgrenzen hinweg oder für externe Datennutzer innerhalb einer sicheren Umgebung, kurz, eine Diskussionsrunde zu Aspekten des sogenannten „Data sharing“[1]. Auf diese Weise können Erfahrungen und bis dato etablierte „best practices“ präsentiert werden und darüber hinaus bietet sich eine Gelegenheit noch offene Fragestellungen und Herausforderungen zu besprechen. Letztlich dient eine bessere Verfügbarkeit von Mikrodaten innerhalb einer Institution und im besten Fall über Institutsgrenzen hinaus einer verbesserten Datengrundlage für eine evidenzbasierte Entscheidungsfindung.

Zur Förderung eines Informationsaustauschs zum Thema „Data sharing“ führte die Deutsche Bundesbank im Jahr 2018 erstmalig einen internationalen Zentralbankkurs mit dem Titel „Data sharing“ durch. Der Titel „Data sharing“ wird hier als Überbegriff verstanden, der zum einen den Datenaustausch bezeichnet und zum anderen auch im weiteren Sinne die gemeinsame Datennutzung. Eine gemeinsame Datennutzung kann in unterschiedlicher Art und Weise erfolgen und reicht von begrenztem Zugriff für unterschiedliche Datennutzer auf lediglich einem bestimmten Mikrodatensatz (ggf. nur in Teilen) bis zur Nutzung von in einen integrierten Datenbestand überführten Mikrodaten unterschiedlicher Bestände. Im Rahmen der Veranstaltung kamen Experten aus 17 Ländern in der Zentrale der Deutschen Bundesbank zusammen und informierten sich über verschiedene Aspekte des Austauschs und der gemeinsamen Nutzung sensibler granularer Daten und Mikrodaten. Das Kursprogramm wurde vom Forschungsdaten- und Servicezentrum (FDSZ) der Bundesbank in Zusammenarbeit mit weiteren Abteilungen des Zentralbereichs Statistik gestaltet. Referentinnen und Referenten aus diesen Abteilungen präsentierten ihr Fachwissen und ihre Erfahrungen mit der praktischen Umsetzung des in den vergangenen Jahren in der Bundesbank vorangetriebenen „Data sharing“, d.h. einer gemeinsamen Mikrodatennutzung. Die im Kurs behandelten Inhalte sollten einen Überblick darüber geben, wie der Zugang zu den Mikrodatenbestände Bundesbankintern wie auch mit unabhängigen externen Forschern gestaltet werden kann und wie dies in beiden Fällen einer Notenbank bei der Erfüllung ihrer Aufgaben helfen kann.

Zur Eröffnung des einwöchigen Kurses erhielten die Teilnehmer einen Überblick über die Mikrodatenbestände der Deutschen Bundesbank und wurden zudem in die wachsende Bedeutung von Mikrodaten für die politische Analyse eingeführt, insbesondere für die Analyse geldpolitischer Fragestellungen und der Finanzmarktstabilität. Dies gilt nicht nur bei der Deutschen Bundesbank, sondern bei allen Partnern des Europäischen Systems der Zentralbanken (ESZB). Im Anschluss wurden Kernthemen behandelt wie das Prinzip Daten nur einmal zu erheben und abteilungsübergreifend für Auswertungen zu nutzen (das sogenannte „collect data only once“-Prinzip), die Wertschöpfungskette bei der Erhebung und Aufbereitung von Mikrodaten, dem Datenschutz für Mikrodaten und die Datenqualität. Danach stellten die Kursteilnehmer die verschiedenen Erhebungen von (Mikro-)Daten vor, die ihre entsendenden Institutionen intern oder extern bereits gemeinsam nutzen bzw. nutzen möchten. Zudem erörterten sie die Rolle, die data sharing in ihrer Institution einnimmt und führten aus, wie data sharing organisiert ist und wie der länderspezifische Rechtsrahmen aussieht, dem data sharing unterliegt. Die Kursteilnehmer legten in ihren Präsentationen auch die aktuellen Herausforderungen dar, vor denen ihre Institutionen in puncto gemeinsame Datennutzung stehen, und erklärten, wie mit diesen umgegangen wird. Aus den Präsentationen der Teilnehmer und den anschließenden Diskussionen resultierte die Erkenntnis, dass viele Institutionen, die mit Mikrodaten arbeiten, ähnliche Herausforderungen zu bewältigen haben.

Im weiteren Kursverlauf wurde ein besonderes strategisches Vorhaben der Bundesbank präsentiert, das sogenannte „Integrierte Mikrodatenbasierte Informations- und Analyse-System“ (IMIDIAS). Zwei weitere Präsentationen widmeten sich Themen, die im Rahmen dieser IMIDIAS-Initiative besonders belangreich sind: Dies ist zum einen die Klassifizierung von Mikrodaten durch SDMX und zum anderen ein Metadaten-System, das derzeit vom Zentralbereich Statistik eingeführt und bundesbankweit für einen harmonisierten und digitalen Zugang zu Metadateninformationen genutzt werden soll. Tag vier der Kurswoche begann mit einer Präsentation darüber, wie im FDSZ Zugang für externe Forscher zu sensiblen Mikrodaten der Bundesbank gewährt wird und wie interne rechts- und revisionssichere Mikrodaten-Anfragen (IRMA) verschiedener Bundesbankabteilungen abgewickelt werden. Als ein alternativer Ansatz zum Zugang zu Daten und Austausch von Metadaten innerhalb eines Software-Tools wurde die sogenannte „Administrative Data Research Facility“ (ADRF) vorgestellt. Als eine Technik der Integration von (Mikro-)Daten aus verschiedenen Quellen wurde in einem Vortrag in Record-Linkage-Systeme eingeführt. In der nachfolgenden Präsentation ging es um das Thema Techniken des maschinellen Lernens (ML) in der täglichen Arbeit mit Daten. Eine dritte Präsentation befasste sich mit der Frage, welche Techniken der Datenerhebung für eine Umfrage, die über mehrere Länder hinweg harmonisiert ist, eingesetzt werden können. Dies wurde in einer Präsentation zur Rubrik Datenproduktion auf einen Blick erläutert, für die beispielhaft die Euroraum-Studie „Private Haushalte und ihre Finanzen“ (PHF) herangezogen wurde.

Am letzten Kurstag wurde in einer Präsentation zur „Data Gaps Initiative“ der G 20 der internationale Blick auf data sharing dargestellt. Dabei wurden die wichtigsten Empfehlungen der G-20-Staaten für einen verbessertes data sharing und für den Zugang zu Daten aufgezeigt. Wie diese Empfehlungen in der Praxis umgesetzt werden können, wurde in der folgenden Präsentation erläutert. Es wurde die Frage behandelt, wie – im Rahmen der länderübergreifenden Initiative „International Network for Exchanging Experience on Statistical Handling of Granular Data“ (INEXDA) – in den verschiedenen Zentralbanken die gemeinsame Mikrodatennutzung organisiert wird, wie eventuelle Zugänge für externe Forscherinnen und Forscher geschaffen werden können und wie Datenbestände der INEXDA-Mitglieder harmonisiert werden können.

Die bei Zentralbanken und anderen Institutionen zu beobachtende Entwicklung hin zur Analyse von stärker granularen Daten, die bereits so gut wie möglich integriert sind, wird sich auch in Zukunft fortsetzen. Die Erhebung von Mikrodaten wird voraussichtlich weiter zunehmen, dies gilt für den Umfang der Datensätze oder auch für die Anzahl verschiedener Datenerhebungen oder für beides. Dementsprechend werden eine ganze Reihe von Beteiligten aus Zentralbanken und Statistikämtern, aber auch aus der Wissenschaft, mit Fragen zur gemeinsamen Datennutzung und zur Datenintegration konfrontiert sein, wobei immer die gesetzlichen Geheimhaltungs- und Datenschutzbestimmungen eingehalten werden müssen. Weitere Diskussionen und ein Austausch von „best practices“ und fachlichen Einschätzungen zu diesem Themengebiet sind notwendig und wünschenswert. In diesem Sinne trägt der Bundesbankkurs zu einer Weiterentwicklung des Wissens für eine gemeinsame Datennutzung bei. Der Kurs wurde von den Teilnehmern ausdrücklich begrüßt, und ihrem Feedback nach wurden die Kursinhalte als hilfreich angesehen. Das Seminar zum Thema „Data sharing“ wird im November 2019 erneut angeboten.

Text: Stefan Bender und Judith Flory


Fussnoten:

  1. Im Folgenden wird der Begriff „data sharing“ weiter verwendet, weil im Deutschen „data sharing“ sowohl als „Datenaustausch“ als auch „Zugang zu Daten / Datenzugang“, wie auch „gemeinsame Datennutzung“ übersetzt werden kann. Im Kontext der Bundesbank ist „data sharing“ somit „die gemeinsame Datennutzung durch Gewährung eines (sicheren) Datenzugangs“ die adäquate Übersetzung.