Projekt

Aspects of Linguistic Complexity

A Comparative German – Norwegian Valence Approach to the Creation of Resources for Easy-To-Understand Language

Wissenschaftliche Zielsetzung

  • Ressourcen mit Information über Verbvalenzen
    • zur Unterstützung der Initiativen, die öffentliche Sprache besser zugänglich machen
  • Leichte Sprache (LS) für Deutsch und Klart Språk (KS) für Norwegisch
  • Forschungsfragen:
    • Welche Faktoren beeinflussen die Komplexität von Sprache?
    • Welche Rolle spielt dabei die Valenz?
  • Methoden:
    • Korpusanalysen

Methoden

  • Aufbau eines Textkorpus mit Texten in LS/KS
  • Extraktion von Verben und ihren Argumenten aus diesen Texten
  • Vergleich der Verbvalenzen mit der deutschen Valenzdatenbank E-Valbu (http://hypermedia.ids-mannheim.de/evalbu/index.html)
    • Lexikon von Verben und ihren Valenzrahmen in LS und ihr Bezug zu ‚normalen‘ Verben/Valenzrahmen
    • Einträge im Open German WordNet OdeNet
  • Suche nach parallelen Verben und ihren Valenzrahmen im Norwegischen
    • Aufbau eines Open Norwegian WordNet mit Informationen über KS-Verben
  • Aufbau eines regelbasierten Systems zur automatischen Übersetzung von Texten in LS/KS

Arbeitsplan

  • Phase 1 (2018): Datenextraktion
    • Aufbau von LS-KS Korpora
    • Extraktion von Verben und Valenzrahmen aus LS-KS
    • Mapping von LS-KS Valenzrahmen auf Standard-Valenzrahmen für beide Sprachen
    • Identifikation einer Menge von kritischen Unterschieden zwischen LS-KS-Valenzen und Standard-Valenzen in beiden Sprachen
  • Phase 2 (2019): Aufbau von Ressourcen
    • Extraktion von Verben mit Valenzrahmen-Annotationen und anderen Konstruktionen, die in Standardsprache und LS-KS unterschiedlich sind
    • Aufbau von Online-Wörterbüchern und Phrasen-Wörterbüchern für LS-KS
    • Aufbau von Synsets im OdeNet
    • Implementierung einer Applikation, die eine automatische Übersetzung ermöglicht (Norwegisch)

Workshops

1.Workshop Trondheim (7.-11. Mai 2018)

  • Aufbau von Korpora

2.Workshop Darmstadt (Oktober 2018)

  • Extraktionsprozesse und Formate

3.Workshop Trondheim (Mai 2019)

  • Lexika und Synsets
  • Applikation zur Übersetzung

4.Workshop Darmstadt (Oktober 2019)

  • Zugriff auf Lexika und Synsets
  • Applikation zur Übersetzung