FSI Korpuslinguistik

Studiengang Linguistische Informatik

Inhalt

Studium

Was ist Computerlinguistik?

Die Computerlinguistik beschäftigt sich mit der maschinellen Verarbeitung natürlicher Sprache. Sie baut auf dem Wissen der Linguistik (Sprachwissenschaft) und der Informatik auf, und hat enge Beziehungen zur Kognitionswissenschaft und zur Künstlichen Intelligenz. Siehe auch: https://meinstudium.fau.de/studiengang/linguistische-informatik-ba-2/

Innerhalb der Computerlinguistik lassen sich folgende vier Teilbereiche ausmachen:

  • theoretische Untersuchung von Sprache in allen berechnungsrelevanten Aspekten (z.B.: Sprachtheorien, Grammatikformalismen)
  • Entwicklung von Programmen zur linguistischen Forschung und Analyse (z.B. zur Untersuchung großer Sprachkorpora)
  • praxisorientierte Entwicklung von Sprachsoftware mit ingenieursmäßigen Methoden (sog. „Sprachtechnologie“)
  • „natural language processing“, d.h. die Realisierung natürlichsprachlicher Phänomene auf dem Computer

Der vierte Punkt hat in Erlangen besonderes Gewicht:

Das Ziel der Computerlinguistik ist es, die natürliche Informationsübertragung nachzubilden indem die Sprachproduktion des Sprechers und die Sprachinterpretation des Hörers auf geeigneten Computern modelliert werden. Dies läuft auf die Konstruktion kognitiver Maschinen (Robotern) hinaus, die frei in natürlicher Sprache kommunizieren können. [1]

Neugierig geworden? Dann lest euch doch die Einleitung zu Professor Haussers Buch Grundlagen der Computerlinguistik (PS, PDF) durch. Darin geht es um Computerlinguistik allgemein, und auch um den speziellen Ansatz, der hier in Erlangen verfolgt wird. (Und lasst euch nicht abschrecken, wenn ihr auf den letzten Seiten nicht so viel versteht. Es erwartet keiner von euch, dass ihr bereits über linguistische Kenntnisse verfügt.)

Anwendungen / Berufsfelder

Computerlinguistisches Know-How findet unter anderem in folgenden Bereichen Anwendung (Liste nach [2]):

  • Korrekturprogramme
  • Computergestützte Lexikographie und Terminologie
  • Volltextsuche und Text Mining
  • Textklassifikation
  • Informationsextraktion
  • Textzusammenfassung
  • Sprachsysnthesesysteme
  • Spracherkennungssysteme
  • Dialogsysteme
  • Sprachlehr- und -lernsysteme
  • Elektronische Kommunikationshilfen
  • Angewandte natürlichsprachliche Generierungs- und Auskunftsysteme
  • Maschinelle und Computergestützte Übersetzung

[1] Roland Hausser: Grundlagen der Computerlinguistik. Berlin, Springer Verlag, 2000
[2] Kai-Uwe Carstensen et al.: Computerlinguistik und Sprachtechnologie. 2. überarbeitete und erweiterte Auflage. Berlin, Spektrum Akademischer Verlag, 2004