Wie erleichtert ihr Journalist:innen die Recherche mit staatlichen Dokumenten?
Kleine Anfragen, Dokumente aus Untersuchungsausschüssen oder Gutachten der Wissenschaftlichen Dienste – viele wichtige Informationen des Staates stecken in PDF-Dateien, die schwer auffindbar und durchsuchbar sind. Das erschwert auch Journalist:innen die Arbeit.
In der MIZ-Innovationsförderung haben Arne Semsrott und Stefan Wehrmeyer deshalb Dokukratie entwickelt. Dokukratie ist eine Open-Source-Rechercheplattform, die Dokumente von Parlamenten und Behörden automatisiert sammelt, zentral bereitstellt und durchsuchbar macht. Wer von dem Tool profitieren kann, wie es jetzt nach der MIZ-Förderung weitergeht und was sich das Team von den Parlamenten und Behörden selbst wünscht, hat uns Projektleiter Arne Semsrott im Interview verraten.
„Dokukratie ermöglicht der Öffentlichkeit, Dokumente wie z. B. Kleine Anfragen oder Dokumente aus Untersuchungsausschüssen zentral auf einer Website zu durchsuchen und zu verarbeiten.“
Lieber Arne, was war der Anlass für die Entwicklung von Dokukratie und warum ist das Projekt wichtig?
Arne Semsrott: Dokukratie ist ein Projekt zur besseren Zugänglichmachung staatlicher Dokumente, die bisher zwar veröffentlicht sind, jedoch kaum auffindbar und nur schwer für Journalist:innen weiterzuverwenden. Es ermöglicht der Öffentlichkeit, diese Dokumente – z. B. Kleine Anfragen, Dokumente aus Untersuchungsausschüssen und Gutachten der Wissenschaftlichen Dienste – zentral auf einer Website zu durchsuchen und zu verarbeiten.
Wie genau funktioniert das Tool und was ist die technische Innovation dahinter?
Arne: Dokukratie besteht aus zwei zentralen Elementen: Einem offenen Scraping-Hub, durch das die Dokumente gesammelt werden sowie einem Frontend, das zusätzlich die Möglichkeit des Zugriffs auf die gesammelten Dokumente ermöglicht. Sowohl der zentrale Zugriff als auch die offene Weiterverwendung der Daten und der Skripte sind in dieser Form einzigartig.
Die Benutzer:innenoberfläche von Dokukratie – hier am Beispiel von Kleinen Anfragen
Wo kommt Dokukratie jetzt nach der Veröffentlichung zum Einsatz? Für welche Art von Recherchen eignet sich das Tool?
Arne: Das Tool wird von vielen Journalist:innen und auch NGOs im internen Monitoring und bei schnellen Recherchen genutzt. Die Themenbereiche sind so vielfältig wie die Dokumente – von Anfragen zu Rechtsextremen bis hin zu Klimaanpassungsstrategien.
Ihr habt bereits erste Kooperationen mit Redaktionen realisiert, bei denen Dokukratie zum Einsatz kam. Wie war das Feedback?
Arne: Besonders sinnvoll ist es, über Dokukratie schnelle Stichwortsuchen machen zu können, die direkt relevante Suchergebnisse aus verschiedenen Bundesländern zu Tage fördert. Das beschleunigt Recherchen enorm. Die Darstellung müssen wir allerdings noch etwas anpassen, da es gerade bei umfangreichen Recherchen etwas umständlich sein kann, das Tool zu nutzen.
„Wir sorgen dafür, dass die Dokumente aus Dokukratie einfach gefunden werden können – im Gegensatz zu den staatlichen Websites.“
Was tut ihr jetzt nach Abschluss der Förderung dafür, um das Tool bekannter zu machen und in die Redaktionen zu bringen?
Arne: Das wichtigste Mittel sind tatsächlich Suchmaschinen. Wir sorgen dafür, dass die Dokumente aus Dokukratie einfach gefunden werden können – im Gegensatz zu den staatlichen Websites. Darüber finden die meisten User zu uns. Außerdem sprechen wir gezielt Journalist:innen an, mit denen wir im Rahmen von Recherchen zusammenarbeiten wollen.
„Heutzutage ist es nicht damit getan, Dokumente zu veröffentlichen. Sie müssen durchsuchbar, offen, verbunden sein.“
Wo könnten die Verwaltungen und Behörden selbst ansetzen, um die Informationen besser zugänglich zu machen?
Arne: Würden die Behörden ihre Arbeit gut machen, bräuchte es Dokukratie gar nicht. Heutzutage ist es nicht damit getan, Dokumente zu veröffentlichen. Sie müssen durchsuchbar, offen, verbunden sein. Der Bundestag hat in dieser Hinsicht schon erste Schritte unternommen: Dokumente des Parlaments sind beispielsweise inzwischen per Schnittstelle abrufbar, sodass sie einfach auf Plattformen wie Dokukratie ausspielbar sind. Das ist aber leider noch eine Ausnahme.
Ihr arbeitet schon lange zum Thema Informationsfreiheit und Open Data. Was sind eure nächsten Projekte oder Themen, um das weiter voranzubringen?
Arne: Es gibt einige staatliche Datenbanken, die bisher noch gar nicht öffentlich zugänglich sind. Dem wollen wir etwas nachhelfen. Außerdem planen wir weitere Funktionen für Dokukratie, darunter KI-Analysen von Dokumenteninhalten zur automatischen Klassifikation und Sortierung von Dokumenten.
>>> Website von Dokukratie
>>> Artikel zu Dokukratie bei FragDenStaat
Erklärvideo von Dokukratie
Ansprechperson
Marion Franke
FörderungMarion leitet den Bereich Innovationsförderung. Sie ist Ansprechpartnerin für alle Fragen zu den Förderbedingungen, der Antragstellung und verantwortlich für die Betreuung der Projekte.