KI-LAB
Die Verantwortung für dieses kulturelle Erbe tragen Menschen, zuallererst jene, die in der Wienbibliothek arbeiten. Sie sind es, die weiterhin Entscheidungen darüber treffen, was gesammelt wird. Diese Aufgabe nehmen sie verantwortungsvoll wahr und treten dabei in partizipativen Austausch mit Forschenden, Kolleg*innen, Nutzer*innen und anderen Stakeholdern.
Mit der Einrichtung eines KI-Labs experimentiert die Wienbibliothek mit neuen Technologien, um Wissen neu zu kontextualisieren und neue Zusammenhänge zu erkennen. Dabei beachtet sie das Urheberrecht. Sie baut lokale Sprachmodelle auf, um sich nicht völlig den großen Playern auszuliefern. Der Human-in-the-Loop ist dabei unersetzlich, sei es bei der Entwicklung sinnvoller Fragestellungen, bei der Kontrolle der Ergebnisse oder der Vermittlung der Inhalte. Damit wir sicherstellen, dass wir dabei einerseits Technologien verantwortungsvoll einsetzen und uns andererseits der Nutzen für die Öffentlichkeit leitet, richtet die Wienbibliothek ein interdisziplinär besetztes Board ein, das unsere Aktivitäten kritisch evaluiert und neue Wege weist.
Projekte
Folgende Projekte wurden 2025 auf den Weg gebracht und sind aktuell in Entwicklung:
- Historische Briefe von 1914 bis 1930. Ein computerlinguistisches Analyseprojekt
Die Wienbibliothek im Rathaus entwickelt derzeit innovative Methoden zur automatisierten Inhaltsanalyse ihrer umfangreichen Briefsammlungen aus der Zeit von 1914 bis 1930. Das interdisziplinäre Forschungsprojekt kombiniert historische Quellenforschung mit modernen Verfahren der natürlichen Sprachverarbeitung und des maschinellen Lernens.
Dauer: März 2025 bis Juni 2026
Projektleitung: Bernhard Krüpl-Sypien
In Zusammenarbeit mit: Became ai
Die Wienbibliothek im Rathaus entwickelt derzeit innovative Methoden zur automatisierten Inhaltsanalyse ihrer umfangreichen Briefsammlungen aus der Zeit von 1914 bis 1930. Das interdisziplinäre Forschungsprojekt kombiniert historische Quellenforschung mit modernen Verfahren der natürlichen Sprachverarbeitung und des maschinellen Lernens.
Methodischer Ansatz
Das Projekt nutzt die standardisierte OAI-PMH-Schnittstelle der digitalen Sammlungen, um systematisch transkribierte Brieftexte zu erfassen und mittels semantischer Segmentierung in thematisch kohärente Einheiten zu unterteilen. Durch den Einsatz großer Sprachmodelle werden diese Textfragmente anschließend kategorisiert und einer detaillierten Intentionsanalyse unterzogen. Die entwickelte Taxonomie umfasst über 40 Kategorien, die von alltäglichen Kommunikationsformen wie Grußformeln bis hin zu komplexen gesellschaftlichen Diskursen reichen.
Technische Innovation
Die Architektur des Systems basiert auf einer mehrschichtigen Datenverarbeitungspipeline: Zunächst werden die historischen Dokumente über das METS-Metadatenformat erfasst und ihre Volltexte extrahiert. Ein speziell entwickelter Algorithmus führt eine semantisch orientierte Chunking-Analyse durch, die nicht nur syntaktische, sondern auch inhaltliche Kohärenz berücksichtigt. Die nachgelagerte Kategorisierung erfolgt durch kontextualisierte Prompt-Engineering-Verfahren, wobei stilometrische Eigenschaften der Texte parallel analysiert werden.
Wissenschaftlicher Beitrag
Dieses Projekt erschließt neue Perspektiven für die quantitative Geschichtsforschung und die Digital Humanities. Durch die systematische Erschließung von Briefinhalten können erstmals großflächige Studien zu Kommunikationsmustern, thematischen Schwerpunkten und gesellschaftlichen Diskursen der Zwischenkriegszeit durchgeführt werden. Die entwickelten Methoden sind auf andere historische Textkorpora übertragbar und tragen zur Weiterentwicklung computerlinguistischer Verfahren für historische Quellen bei. Die Ergebnisse werden über eine webbasierte Forschungsplattform zugänglich gemacht, die sowohl die Rohdaten als auch die Analyseergebnisse in strukturierter Form bereitstellt und damit weitere Forschungsarbeiten ermöglicht.
- Wiener Theatergeschichte. Automatisierte Extraktion von Theaterbeziehungen aus dem Wien Geschichte Wiki
Die Wienbibliothek im Rathaus hat ein Forschungsprojekt zur systematischen Analyse von Theaterbeziehungen im Wien Geschichte Wiki entwickelt. Das Projekt kombiniert moderne Methoden der computergestützten Textanalyse mit semantischen Suchtechnologien, um bislang unerschlossene Verbindungen zwischen Personen und Wiener Theaterinstitutionen zu identifizieren und zu dokumentieren.
Dauer: März 2025 bis März 2026
Projektleitung: Bernhard Krüpl-Sypien, Katharina Prager (Wienbibliothek)
In Zusammenarbeit mit: Became ai
Methodischer Ansatz
Das System nutzt große Sprachmodelle zur automatisierten Analyse biografischer Texte und extrahiert dabei strukturierte Informationen über Theaterbeziehungen. Durch die Integration der semantischen Suchfunktionalität des Wien Geschichte Wiki werden über 1.100 Schauspieler*innen systematisch erfasst und ihre Karrierewege nachvollziehbar gemacht. Der Algorithmus identifiziert nicht nur die Namen der Theaterinstitutionen, sondern auch die spezifischen Rollen, Zeiträume und künstlerischen Tätigkeiten der erfassten Personen. Ein mehrstufiges Validierungsverfahren gewährleistet die wissenschaftliche Qualität der extrahierten Daten. Alle identifizierten Theater werden gegen die bestehenden Kategorien des Wien Geschichte Wiki abgeglichen, wodurch eine konsistente und verlässliche Datengrundlage entsteht. Das System implementiert zudem ein umfassendes Caching-System, das sowohl die Performance optimiert als auch die Nachvollziehbarkeit der Analyseschritte ermöglicht.
Technische Innovation
MediaWiki-API-Integration, LLM-basierte Textanalyse und eine webbasierte Benutzeroberfläche kombiniert. Besonders hervorzuheben ist die semantische Suchtechnologie, die es ermöglicht, Akteur*innen nicht nur über traditionelle Kategorien, sondern über ihre dokumentierten Berufsbezeichnungen zu identifizieren. Dies führt zu einer deutlich vollständigeren Erfassung der historischen Theaterlandschaft Wiens. Die entwickelte Webanwendung ermöglicht sowohl die interaktive Exploration der Daten als auch die systematische Bearbeitung größerer Datenbestände. Forscherinnen und Forscher können einzelne Biografien analysieren, Theaterverbindungen visualisieren und die Ergebnisse in strukturierter Form für weitere wissenschaftliche Arbeiten exportieren.
Wissenschaftlicher Beitrag
Das Projekt leistet einen wesentlichen Beitrag zur digitalen Kulturgeschichtsforschung, indem es traditionelle geisteswissenschaftliche Methoden mit modernen computerlinguistischen Verfahren verbindet. Die systematische Erfassung von Theaterbeziehungen ermöglicht neue Perspektiven auf die Wiener Kulturgeschichte und schafft eine Datengrundlage für netzwerkanalytische Untersuchungen der historischen Theaterlandschaft. Durch die automatisierte Analyse werden Muster und Verbindungen sichtbar, die bei manueller Bearbeitung aufgrund des Datenumfangs nicht erfassbar wären. Das Projekt demonstriert exemplarisch, wie digitale Methoden die traditionelle Archiv- und Bibliotheksarbeit erweitern und bereichern können, ohne die wissenschaftliche Sorgfalt und Genauigkeit zu beeinträchtigen. Die entwickelten Methoden und Werkzeuge sind darüber hinaus auf andere kulturhistorische Fragestellungen übertragbar und können als Grundlage für weiterführende Forschungsprojekte im Bereich der Digital Humanities dienen.
- Biographie-Maschine
Die Wienbibliothek im Rathaus entwickelt in Kooperation mit der TU Wien eine Biographie-Maschine.
Dauer: März 2025 bis März 2026
Projektleitung: Julia Neidhart (TU Wien), Katharina Prager
In Zusammenarbeit mit: Christian Doppler Laboratory for Advancing the State-of-the-Art of Recommender Systems in Multi-Domain Settings
Methodischer Ansatz
Ziel ist die Entwicklung eines Prototyps, der mithilfe generativer KI „Deep Research“ anwendet, um strukturierte Biografien zu Persönlichkeiten des 20. und 21. Jahrhunderts mit Wien-Bezug zu erstellen. Diese Methode ermöglicht komplexe (Daten-)Abfragen aus heterogenen Quellen.
Technische Innovation
Durch „Deep Research“ können Informationen gezielt verknüpft und neue Zusammenhänge sichtbar gemacht werden, was die Arbeit mit vielfältigen Quellen unterstützt. Hierzu wird ein großes Sprachmodell (LLM) eingesetzt, das in der Lage ist, Anfragen unabhängig von dem/der Benutzer*in in kleinere Teilprobleme zu zerlegen. Dies wird unter anderem durch die Nutzung eines agentischen Systems ermöglicht. Im Rahmen des Projekts werden verschiedene Werkzeuge (Tools) entwickelt, die den Zugriff auf unterschiedliche Datenquellen erlauben. Darüber hinaus können die Agenten des Systems diese Tools zur Informationsextraktion, zur Erstellung einer Biografie, zur inhaltlichen Analyse sowie zur Speicherung recherchierter Daten einsetzen. Dies wird durch den Einsatz neuer Methodiken im Bereich der generativen KI, des Toolings sowie durch moderne Softwareentwicklungsstandards wie etwa das Model Context Protocol (MCP) ermöglicht.
Wissenschaftlicher Relevanz
Eine zentrale Aufgabe der Wienbibliothek ist es, Biographien und biographische Gutachten zu verfassen. Im Projekt wird ein standardisiertes Biografie-Template entworfen, das als methodische Grundlage für die weitere Umsetzung dient. Dazu wird ein Tool entwickelt, das die Anwendung dieser Methode unterstützt: Es erleichtert die Recherche, fördert die strukturierte Aufbereitung von Informationen und gewährleistet eine konsistente Dokumentation der Ergebnisse. Die Biografie-Maschine versteht sich somit als Unterstützungstool, das bestehende Rechercheprozesse sinnvoll ergänzt.
Leitung
Dr.in Anita Eichinger, MA
Tel.: +43 1 4000 84911
E-Mail: anita.eichinger@wienbibliothek.at
Michael Ingruber
Tel.: +43 1 4000 84995
E-Mail: michael.ingruber@wienbibliothek.at
Kooperationspartner*innen
Christian Doppler Laboratory for Advancing the State-of-the-Art of Recommender Systems in Multi-Domain Settings
Prof. Julia Neidhart (Leitung)
Became ai
Bernhard Krüpl-Sypien