Lehrstuhl für Sprachverarbeitung und Mustererkennung

 

Sprachtechnologie und Mustererkennung

Der Lehrstuhl für Informatik 6 beschäftigt sich mit der Erforschung moderner Methoden statistischer Mustererkennung. Die Hauptanwendung dieser Methoden liegt im Bereich der automatischen Verarbeitung menschlicher Sprache, das heißt der Spracherkennung, der Übersetzung von gesprochener und geschriebener Sprache, des Verständnisses natürlicher Sprache und der sprachbasierte Dialogsysteme. Die statistische Entscheidungstheorie und die problemspezifischen Modellierung bilden den Rahmen für die Forschungsaktivitäten de Lehrstuhls. Ein Bereich, in dem dieser Ansatz maßgeblich vorangetrieben wurde, ist die Spracherkennung. Folgende Gleichung fasst die Herangehensweise zusammen:

Spracherkennung = Akustisch-Linguistische Modellierung + Statistische Entscheidungstheorie

Die Vorteile des probabilistischen Ansatzes und des Rückgriffs auf die statistische Entscheidungstheorie können wie folgt zusammengefasst werden:

  • Der Ansatz ist in der Lage, schwache Abhängigkeiten und vages Wissen auf allen Ebenen des Systems zu modellieren.

  • Die freien Modellparameter können über Trainingsdaten oder Beispiele automatisiert „gelernt“ werden – hierfür gibt es bereits sehr leistungsfähige Algorithmen.

  • Mithilfe der aus der statistischen Entscheidungstheorie abgeleiteten Bayes-Entscheidungsregel wird die endgültige Entscheidung unter Berücksichtigung des gesamten verfügbaren Kontextes getroffen. Bei der Spracherkennung auf großem Vokabular wird ein Laut stets als Bestandteil eines Wortes erkannt, das wiederum Bestandteil eines Satzes ist. Dies ermöglicht optimales Feedback seitens der syntaktische-semantischen Einschränkungen der jeweiligen Sprache bis hin zur Ebene der Lauterkennung.

Diesen Ansatz wenden wir nun auf andere Gebiete an, so zum Beispiel auf die Übersetzung gesprochener und geschriebener Sprache sowie auf andere Aufgaben im Bereich der menschlichen Sprachverarbeitung.

Im Bereich der sprachlichen Übersetzung wird dieser Ansatz durch folgende Gleichung ausgedrückt:

Sprachliche Übersetzung = Linguistische Modellierung + Statistische Entscheidungstheorie

Dieser Ansatz wurde zum Beispiel in den Projekten VERBMOBIL (deutsch) und EUTRANS (europäisch) verfolgt. Die experimentellen Vergleiche mit traditionellen regelbasierten und anderen konkurrierenden Ansätzen zeigen, dass der statistische Ansatz wettbewerbsfähig oder gar überlegen ist. Darüber hinaus bietet er eine Reihe von Vorteilen wie zum Beispiel erhöhte Robustheit und einfache, flexible Anpassung an neue Aufgaben. In der abschließenden, umfassenden Evaluierung des Übersetzungsprojekts VERBMOBIL erreichte der Übersetzungsansatz der RWTH Aachen eine Satzfehlerrate, die im Vergleich zu drei konkurrierenden Übersetzungsansätzen um den Faktor zwei niedriger lag.

Zusammenfassend umfassen die Forschungsaktivitäten des Lehrstuhls für Informatik 6 die folgenden Anwendungen:

  • Spracherkennung
    • Spracherkennung mit großem Vokabular
    • Multilinguae Spracherkennung
    • Sprecherunhabhängige und adaptive Spracherkennungi
    • Robuste Spracherkennung
  • Maschinelle Übersetzung gesprochener und geschriebener Sprache
  • Automatische Sprachverarbeitung (natural language processing, NLP)
    • Dokumentenklassifikation
    • Sprachverständnis
    • Informationsrückgewinnung für Text- und Audiodokumenten
    • Spoken-Dialogue-Systeme
  • Bilderkennung

Die Mehrzahl der Forschungsaktivitäten wurden und werden im Rahmen nationaler und europäischer Projekte durchgeführt, so zum Beispiel das deutsche VERBMOBIL-Projekt sowie die europäischen Forschungsvorhaben ARISE, EUTRANS, CORETEX und ADVISOR. Des Weiteren gibt es bilaterale Forschungsprojekte mit Industriepartnern.