Analyse von Plenarprotokollen für Mensch und Maschine

Wie Data Science den Weg zu politischem Diskurs demokratisiert

Open Discourse hat die Plenarprotokolle des deutschen Bundestages seit 1949 aufgebrochen und analysierbar gemacht - und zwar für Mensch und Maschine. Die Plattform ermöglicht erstmals den Zugang und die Recherche in den über 800.000 Redebeiträgen der letzten 70 Jahre.

Die Datenbank hinter Open Discourse ist die erste granulare, umfassende und maschinenlesbare Aufbereitung jedes jemals gesprochenen Wortes in den Parlamentssitzungen des deutschen Bundestages. Sie ermöglicht erstmalig gefilterte Recherchen in den Reden und Zwischenrufen der Politker_Innen und Fraktionen.

Für einen offenen Diskurs und eine wissenschaftliche Auseinandersetzung mit politischer Sprache.

Seiten Text

Redebeiträge

Reaktionen & Zwischenrufe

An der Schnittstelle zwischen Politikwissenschaft und Data Science

Open Discourse erleichtert den Zugang zu über 800.000 Reden seit 1949 und ermöglicht eine strukturierte Stichwortrecherche auf der Grundlage von Politiker_Innen, Koalitionen und Positionen.

Mit Methoden der Informatik und Computerlinguistik haben wir alle Reden, Zwischenrufe, Anfragen uvm. den jeweiligen Politiker_Innen und Fraktionen zugeordnet und durchsuchbar gemacht, sowie zahlreiche Metainformationen hinzugefügt.

  • Wie hat sich der politische Diskurs in den letzten 70 Jahren verändert?
  • Wie ist die thematische Nähe von Politiker_Innen zueinander?
  • Wie hoch ist der relative Anteil von Frauen und Männern, die als Abgeordnete der verschiedenen Parteien sprechen?

Bürger_Innen, Journalist_Innen und Wissenschaftler_Innen können jetzt den gesamten Datensatz für ihre eigene Forschung herunterladen und auf Muster untersuchen.

Nutzen Sie unsere Volltextsuche, um den politischen Diskurs im Bundestag nachzuverfolgen und zu untersuchen oder downloaden Sie den Datensatz, um eigene umfassende Analysen der Sprache und Reaktionen des Bundestags von 1949 bis heute durchzuführen.

Open Discourse ermöglicht einzigartige Einblicke in die Herzkammer der deutschen Politik und holt so den politischen Diskurs ins 21. Jahrhundert.

Welches Potenzial steckt in den Daten?

Auswertungen und Ergebnisse

Die Datenbank ermöglicht komplexe Analysen der politischen Sprache und erlaubt es, die Reden auf Muster zu untersuchen.

Hier werden Ihnen bald noch mehr Analysen von uns und von anderen Personen zeigen können - wir bitten um noch ewas Gedult.

Die Zusammenarbeit mit anderen Partner_Innen kann dazu beitragen, deutsche Parlamente dauerhaft zu öffnen und politischen Diskurs zu demokratisieren.

Freier Zugang zur Datenbank

Das Open Discourse Korpus steht Akteur_Innen aus Politik, Journalisten_Innen, Wissenschaftler_Innen und Bürger_Innen zur freien Verfügung.

Logo der FOM - Hochschule für Ökonomie und Management

Akademische Forschung

Hypothetische Reden

Der Datensatz wurde von Masterstudent_Innen des 3.Semesters in "Big Data Analytics" für ein Lehrforschungsprojekt verwendet und mittels Generative Adversarial Networks (GAN) werden hypothetische Reden generiert.

Logo von CorrelAid

CorrelAid

Inhaltliche Analysen

CorrelAid ist ein überparteiliches gemeinnütziges Netzwerk von Data Scientists, die die Welt durch die Arbeit mit Daten verändern wollen. Ziel der Zusammenarbeit mit unserem Projekt ist es, NLP-Techniken auf den Datensatz anzuwenden, um Einblicke zu gewinnen, worüber die deutschen Abgeordneten seit der Gründung des Bundestages gesprochen haben.

Logo von ZDFHeute

ZDFHeute

Pandemiedebatte

ZDFheute untersuchte die Plenarprotokolle des Deutschen Bundestages auf Basis unseres Datensatzes und ermittelte inwiefern sich unsere Politiker_innen seit dem Jahr 1949 mit dem Stichwort “Pandemie” auseinandergesetzt haben.

Für einen offenen Diskurs mit den technologischen Mitteln des 21. Jahrhunderts.

Warum ist das wichtig?

Zugang und Durchsuchbarkeit der Dokumente

Die im Grundgesetz definierte Öffentlichkeit des Bundestages muss durch moderne Wege der Datenverarbeitung ausgebaut werden.

In seiner über 70 jährigen Geschichte war der Bundestag immer eins: Ein Ort der lebhaften Debatte und parlamentarischer Marktplatz unserer Demokratie. Egal ob Grundsätzliches oder Tagesaktuelles, ziemlich jedes Thema wurde besprochen, kritisiert oder beklatscht. Praktisch alle Dinge in der täglichen Lebenswelt haben eine politische Dimension, insbesondere eine bundespolitische. Im Grundgesetz ist definiert, dass die Abgeordneten die Vertreter_Innen des gesamten Volkes sind und dass der Bundestag öffentlich verhandelt. Wir alle haben somit das Recht, die Inhalte und Vorgänge im Parlament transparent mitverfolgen zu dürfen.

Bisher lagen die Protokolle zwar auf den Serven des Bundestages, aber die Einsicht in die Dokumenten ist umständlich und das Format der Dokumente für eine moderne Datenverarbeitung nicht geeignet. Auf Open Discourse können Bürger_Innen, Journalist_Innen und Wissenschaftler_Innen jetzt leicht zugänglich und kostenfrei über die Tools und Daten der Plattform die Plenarprotokolle nach Stichworten, Politiker_Innen und Ämtern durchsuchen und die Ergebnisse für Ihre Arbeit, Forschung und natürlich für das eigene Interesse nutzen.

Wie funktioniert das?

Die Herangehensweise

Data Science trifft auf Plenarprotokolle

Mustererkennung

Wir haben mit verschiedenen Methoden der Informatik und Computerlinguistik die Plenarprotokolle aufgebrochen und alle Redebeiträge, Zwischenrufe, Rückfragen etc. der jeweiligen Politiker_Innen und Fraktionen zugeordnet und durchsuchbar gemacht.

Open Discourse verfügt damit über eine Datenbank, die jedes bisher in Plenarsitzungen gesprochene Wort strukturiert abbildet und sowohl für Menschen als auch Maschinen lesbar zur Verfügung stellt. Diese aufbereiteten Daten bilden die Grundlage, um Algorithmen aus den Bereichen NLP (Natural Language Processing), Machine Learning, Deep Learning etc. auf die Daten anzuwenden und umfangreiche Analysen durchzuführen.

Der programmatische Ansatz unseres Verfahrens sichert die Reproduzierbarkeit und Validierbarkeit/Falsifizierbarkeit aller Analysen und erfüllt somit den Anspruch der Wissenschaftlichkeit.

Wer steckt dahinter?

Unser Beitrag zur Demokratie

Open Discourse ist ein gemeinnütziges Forschungsprojekt.

Das Open Discourse Korpus ist selbstfinanziert, unabhängig und aus den Fähigkeiten und Motivationen der Mitarbeiter_Innen der Limebit GmbH gewachsen. Die Plattform ist unser Beitrag zur Demokratisierung des Zugangs zu politischen Themen und eine Herzensangelegenheit.

Möchten Sie uns Feedback geben oder haben Sie Interesse Ihre Fähigkeiten, Ideen oder Anmerkungen in irgendeiner Form zur Verfügung zu stellen? Kontaktieren Sie uns gern!