KI-Modell zur Leichten Sprache bei wissenschaftlichen Workshops präsentiert
Vor kurzem haben wir unser KI-Modell zur Wortkomplexität bei zwei wissenschaftlichen Workshops präsentiert: auf dem Workshop "Diversity and Change in Easy German" während der Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft und auf dem Workshop "AI and Easy and Plain Language in Institutional Contexts" auf dem MT Summit 2025 (einer Konferenz mit dem Schwerpunktthema Maschinelle Übersetzung). Beide Workshops boten aufschlussreiche Diskussionen über die sozialen und technologischen Dimensionen der Zugänglichkeit von Sprache über Sprachgrenzen hinweg, wobei sowohl gemeinsame Herausforderungen als auch sprachspezifische Lösungen herausgestellt wurden. Hier stellen wir dar, was wir aus diesen Veranstaltungen gelernt und was wir zu ihnen beigetragen haben.

Die Vielschichtigkeit von Verständlichkeit
Die Zielgruppen der barrierefreien Sprache sind so vielfältig wie ihre Barrieren (Maaß 2020; 2024). Dies veranschaulicht die oben grafisch dargestellte „Hildesheimer Treppe“ der Barrierefreien Kommunikation (nach Maaß und Rink 2024). Konkret veranschaulicht das Modell die Vielfalt möglicher Kommunikationsbarrieren: So unterscheiden sich die Barrieren für ältere Menschen – motorische und Wahrnehmungsbarrieren – von den Barrieren für Menschen mit geistigen Behinderungen, die kognitiver Natur sind. Diese wiederum unterscheiden sich von den sprachlichen und kulturellen Barrieren von Sprachlernern. Konkret bedeutet das: Für eine ältere Person oder einen Deutschlerner könnte die Leichte Sprache zu einfach, die Einfache Sprache aber nicht einfach genug sein. Andererseits könnte eine Person mit einer geistigen Behinderung die Leichte Sprache als einfach genug empfinden, aber nur, wenn sie in mündlicher Form präsentiert wird. Genau aufgrund dieser Vielschichtigkeit des Themas Verständlichkeit verfolgen wir bei t2k das Ziel einer nutzeradaptiven Textvereinfachung, d. h. unser Ziel besteht darin, Nutzerinnen und Nutzern ein ganz feingranulares Tuning ihrer spezifischen Verständlichkeitsanforderungen zu ermöglichen.
Die Grenzen der Standardisierung
Es existieren internationale und nationale Standards für die Barrierefreiheit von Sprache:
- ISO/IEC 23859 (Information technology — User interfaces — Requirements and recommendations on making written text easy to read and understand),
- ISO 24495-1:2023 (die erste internationale Norm für Einfache Sprache),
- DIN SPEC 33429 (Empfehlungen für Deutsche Leichte Sprache) und
- DIN 8581-1:2024-05 (Einfache Sprache - Anwendung für das Deutsche - Teil 1: Sprachspezifische Festlegungen).
Für die deutsche Leichte Sprache existieren zudem mehrere Regelwerke.
Zwar versuchen alle Regelwerke und Standards, die Frage zu beantworten, wie verständliche und möglichst barrierefreie Kommunikation gewährleistet werden kann. Allerdings zeigt gerade das Nebeneinander unterschiedlicher Herangehensweisen und Empfehlungen, wie schwierig es ist, hier allgemeingültige Festlegungen zu treffen und Abgrenzungen zu finden. Beispielsweise fehlt eine klare Unterscheidung zwischen Leichter und Einfacher Sprache. Die ISO-Normen indes konzentrieren sich nur auf die Einfache Sprache und gehen nicht auf die Leichte Sprache ein. Insgesamt kann konstatiert werden, dass das Nebeneinander von ISO- und DIN-Spezifikationen zu Überschneidungen und Inkonsistenzen führt, insbesondere in Bezug auf die Zielgruppe und die unterschiedlichen Vereinfachungsgrade.
Eine mögliche Lösung für diese Probleme könnte die von Maaß (2020) vorgeschlagene Form der Vereinfachung sein, die Leichte Sprache und Einfache Sprache miteinander verbindet - die Leichte Sprache Plus. Leichte Sprache Plus soll die Klarheit der Leichten Sprache mit der sozialen Flüssigkeit und Flexibilität der Einfachen Sprache verbinden. Leichte Sprache Plus ist eine optimierte Form der barrierefreien Sprache, die ein Gleichgewicht zwischen Verständlichkeit, Wahrnehmbarkeit und sozialer Akzeptanz herstellt und dabei die übermäßige Vereinfachung und Stigmatisierung der traditionellen Leichten Sprache vermeidet und gleichzeitig eine klare, zugängliche Kommunikation gewährleistet.
Hier bei t2k sind wir allerdings der Meinung, dass ein noch flexiblerer Ansatz für die Zugänglichkeit von Sprache angemessen wäre. Unser Ziel ist es, Modelle zu entwickeln, die eine Vereinfachung auf verschiedenen sprachlichen Ebenen wie etwa der Wortebene, der Satzebene und der Diskursebene vornehmen können und damit den Nutzerinnen und Nutzern die Möglichkeit geben, je nach Kontext die von ihnen bevorzugte Methode zu wählen. Um dieses Ziel zu erreichen, verfolgen wir einen KI-basierten Ansatz, der auch im Mittelpunkt der Diskussion auf beiden Tagungen stand.
Chancen und Möglichkeiten der KI-gestützten Textvereinfachung
Die KI-gestützte Textvereinfachung basiert typischerweise auf dem Prompting von LLMs wie GPT-4o, Gemini, Llama oder anderen Allzweck-LLMs. Die Prompts beschreiben dabei die Sprachregeln, auf denen die Vereinfachung basiert, und können auch Textbeispiele enthalten. Die LLMs sind in der Regel sehr groß und der Zugang erfolgt über ein kostenpflichtiges Abonnement. In den beiden Forschungs-Workshops wurden auf Prompt-Engineering basierende Vereinfachungsansätze für Deutsch, Französisch und Italienisch vorgestellt. Die Präsentationen und Diskussionen konzentrierten sich auf verschiedene Prompting-Strategien und die Bewertung der Vereinfachungsergebnisse. Einen Konsens gab es dabei im Hinblick auf die folgenden Aspekte:
- Die Angabe von Vereinfachungsbeispielen im Prompt ist hilfreich.
- Je größer das LLM, desto besser die Ergebnisse. In der Regel mussten die Modelle sehr groß sein, wie die GPT-Modelle von OpenAI oder die Gemini-Modelle von Google. (Es wurden Modelle mit mindestens 30 Milliarden Parametern genutzt. Für eine bessere Korrektheit wurden LLMs mit bis zu 175 Milliarden Parametern verwendet, wobei die Korrektheit immer noch bei lediglich 70 % lag.)
- Alle Modelle leiden unter Halluzinationen, Auslassungen wichtiger Informationen und unzureichender Vereinfachung. Das bedeutet, dass eine Nachbearbeitung der LLM-Ausgabe durch menschliche Experten erforderlich ist.
- Es besteht ein Bedarf an psycholinguistischen Studien zur Lesbarkeit und Verständlichkeit des von der KI und auch vom Menschen erzeugten Textes für die Zielgruppe.
- Es besteht Bedarf an der Entwicklung von Werkzeugen für die automatische Bewertung von vereinfachten Texten auf verschiedenen linguistischen Ebenen: Wort, Satz und Diskurs.
Unser Forschungsbeitrag – psycholinguistische Validierung von Verständlichkeit
Den während der Workshops thematisierten Herausforderungen bei der KI-gestützten Textvereinfachung tragen wir bei t2k in unserer täglichen Arbeit Rechnung. In der KI-Entwicklung beschränken wir uns dabei nicht auf das Prompting proprietärer LLMs, die in der Regel sehr groß und teuer sind. Wir arbeiten mit selbsttrainieren Modelle, die viel kleiner sind (2-12 Milliarden Parameter) und genutzt werden können, ohne dass Zugang zu teuren oder riesigen LLMs benötigt wird. Um eine gute Ergebnisqualität der Ergebnisse zu gewährleisten, führen wir außerdem umfassende menschliche und automatische Evaluationen durch. Das KI-Modell für Wortkomplexität, das wir auf den Workshops vorgestellt haben, ist ein Beispiel für eine solche Qualitätskontrolle und Bewertung.
Die Limitationen des prompt-basierten KI-Ansatzes verweisen zudem nicht nur auf die Bedeutung des „Human-in-the-Loop“, also des Fachübersetzers für Qualitätskontrolle und Post-Editing, sondern auch auf die Bedeutung des Testens der Modellergebnisse mit einer Zielgruppe. Die während der Workshops vorgestellten psycholinguistischen Studien, die auf Untersuchungen mit Zielgruppen beruhen, haben gezeigt, dass der präskriptive Ansatz der Leichten Sprache mit Einschränkungen verbunden ist. So wird beispielsweise die Verwendung von Diskursmarkern (also verbindenden Wörtern wie "deshalb", "also" und "selbstverständlich") in der Leichten Sprache strikt eingeschränkt oder vermieden, da sie als kognitiv anspruchsvoll und verwirrend für die Zielgruppe angesehen werden. Experimentelle Ergebnisse haben jedoch gezeigt, dass das Fehlen von Diskursmarkern die Verständlichkeit von Texten verringert und zu längeren Lesezeiten führt. Dies ist einer der Gründe dafür, warum wir bei t2k unsere Modellergebnisse nicht nur evaluieren, sondern mit Übersetzerinnen, Zielgruppenangehörigen und Psycholinguisten validieren. Beispielsweise haben wir im letzten Jahr im Rahmen des "Civic Innovation"-Förderprojekts umfangreiche Validierungen und Feedbackrunden mit dem Büro textsicher aus München durchgeführt. Und unser Wortkomplexitätsmodell haben wir in Zusammenarbeit mit der Psycholinguistin Sol Lago von der Goethe-Universität Frankfurt validiert. Die Ergebnisse dieser Zusammenarbeit haben wir in unserem Beitrag zum MT Summit vorgestellt.
Generell glauben wir, dass ein lediglich prompting-basierter Vereinfachungsansatz den vielschichtigen Anforderungen an eine verständliche und damit gelingende Kommunikation nicht genügen kann, da hierfür nicht nur die Manipulation von Wörtern erforderlich ist, sondern die Fähigkeit zu komplexen Analysen und Schlussfolgerungen.
Workshops:
Eine Programmübersicht und eine Sammlung der Beiträge zu den Workshops (einschließlich unseres Beitrags) finden Sie hier:
- Reich, I., Zinsmeister, H., Jablotschkin, S., & Wieland, L. (Organizers). (2025). Diversity and Change in Easy German. Workshop at the 47th Annual Meeting of the German Linguistic Society (DGfS 2025), University of Mainz, Germany, March 5–7, 2025. https://converia.uni-mainz.de/frontend/index.php?page_id=4582
- Rivas Ginel, M. I., Cadwell, P., Canavese, P., Hansen-Schirra, S., Kappus, M., Matamala, A. & Noonan, W. (Eds.). (2025). Proceedings of the 1st Workshop on Artificial Intelligence and Easy and Plain Language in Institutional Contexts (AI & EL/PL), Geneva, Switzerland, 23 June 2025. Draft: https://drive.google.com/file/d/12oriHMaI-NGBnJRTGX1oTH_2wf95_XTB/view
Weiterführende Literatur:
- Maaß, Christiane (2020). Easy Language – Plain Language – Easy Language Plus. Balancing Comprehensibility and Acceptability. Berlin: Frank & Timme.
- Maaß, Christiane (2024). Hi ChatGPT, Translate This Text into Easy Language: Is the New Easy Language Translator a Machine? VAKKI Publications 16 (2024): 9-29.
- Maaß, Christiane/Rink, Isabel (eds., 2024). Handbook of Accessible Communication. Berlin: Frank & Timme. https://library.oapen.org/handle/20.500.12657/98181
- ISO/IEC 23859:2023. Information technology — User interfaces — Requirements and recommendations on making written text easy to read and understand. International Organization for Standardization (ISO) and International Electrotechnical Commission (IEC), July 2023. https://www.iso.org/standard/77178.html
- ISO 24495-1:2023. Plain language — Part 1: Governing principles and guidelines. International Organization for Standardization (ISO), Geneva, 2023. https://www.iso.org/standard/78907.html
- DIN SPEC 33429:2023-04. Empfehlungen für Deutsche Leichte Sprache. Deutsches Institut für Normung e.V. (DIN), Berlin, April 2023. https://www.dinmedia.de/en/technical-rule/din-spec-33429/387728031
- DIN 8581-1:2024-05. Einfache Sprache – Anwendung für das Deutsche – Teil 1: Sprachspezifische Festlegungen. Deutsches Institut für Normung e.V. (DIN), Berlin, May 2024. https://www.dinmedia.de/de/norm/din-8581-1/377238273