Aspects of Linguistic Complexity
A Comparative German – Norwegian Valence Approach to the Creation of Resources for Easy-To-Understand Language
Wissenschaftliche Zielsetzung
- Ressourcen mit Information über Verbvalenzen
- zur Unterstützung der Initiativen, die öffentliche Sprache besser zugänglich machen
- Leichte Sprache (LS) für Deutsch und Klart Språk (KS) für Norwegisch
- Forschungsfragen:
- Welche Faktoren beeinflussen die Komplexität von Sprache?
- Welche Rolle spielt dabei die Valenz?
- Methoden:
- Korpusanalysen
Methoden
- Aufbau eines Textkorpus mit Texten in LS/KS
- Extraktion von Verben und ihren Argumenten aus diesen Texten
- Vergleich der Verbvalenzen mit der deutschen Valenzdatenbank E-Valbu (http://hypermedia.ids-mannheim.de/evalbu/index.html)
- Lexikon von Verben und ihren Valenzrahmen in LS und ihr Bezug zu ‚normalen‘ Verben/Valenzrahmen
- Einträge im Open German WordNet OdeNet
- Suche nach parallelen Verben und ihren Valenzrahmen im Norwegischen
- Aufbau eines Open Norwegian WordNet mit Informationen über KS-Verben
- Aufbau eines regelbasierten Systems zur automatischen Übersetzung von Texten in LS/KS
Arbeitsplan
- Phase 1 (2018): Datenextraktion
- Aufbau von LS-KS Korpora
- Extraktion von Verben und Valenzrahmen aus LS-KS
- Mapping von LS-KS Valenzrahmen auf Standard-Valenzrahmen für beide Sprachen
- Identifikation einer Menge von kritischen Unterschieden zwischen LS-KS-Valenzen und Standard-Valenzen in beiden Sprachen
- Phase 2 (2019): Aufbau von Ressourcen
- Extraktion von Verben mit Valenzrahmen-Annotationen und anderen Konstruktionen, die in Standardsprache und LS-KS unterschiedlich sind
- Aufbau von Online-Wörterbüchern und Phrasen-Wörterbüchern für LS-KS
- Aufbau von Synsets im OdeNet
- Implementierung einer Applikation, die eine automatische Übersetzung ermöglicht (Norwegisch)
Workshops
1.Workshop Trondheim (7.-11. Mai 2018)
- Aufbau von Korpora
2.Workshop Darmstadt (Oktober 2018)
- Extraktionsprozesse und Formate
3.Workshop Trondheim (Mai 2019)
- Lexika und Synsets
- Applikation zur Übersetzung
4.Workshop Darmstadt (Oktober 2019)
- Zugriff auf Lexika und Synsets
- Applikation zur Übersetzung