Z. B. gibts in Zürich das CL-Institut der Uni Zürich, das dort am IFI (Institut für Informatik) haust. Da liegt die Vermutung bereits nahe, dass Computerlinguistik mit Informatik etwas zu tun hat. Dieses Fachgebiet wird aber mit der Linguistik, d. h. der Sprachwissenschaft, verknüpft, um dann das Interdisziplinärgebiet der Computerlinguistik zu bilden. Es handelt sich also um einen Studienbereich ähnlich dem der Wirtschaftsinformatik, das selber BWL-/VWL-Wissen mit Informatik-Knowhow verknüpft. Im Falle der Computerlinguistik wird Wissen um Sprachen (Syntax, Morphologie u. a.) mit Informatik-Knowhow verknüpft. Die Uni Zürich spricht zusätzlich von Sprachtechnologie, wenn anstatt das Wissen um die Möglichkeiten (Theorie) mehr die praktische Anwendung der Computerlinguistik, d. h. die Entwicklung von Sprachwerkzeugen, im Vordergrund steht. Da sich letzten Endes alles um maschinelle Sprachverarbeitung dreht, wird auch von Linguistischer Datenverarbeitung (LDV) gesprochen. Das tut etwa die deutsche Gesellschaft für linguistische Datenverarbeitung (GLDV) seit 1975.
Prinzipiell wird Sprachtechnologie schon seit jeher vorangetrieben. Bei Beginn des Kalten Krieges wurde von den USA versucht Dokumente maschinell vom Russischen ins Englische zu übertragen (Georgetown-IBM-Experiment (engl.)); das wäre das klassische CL-Forschungsgebiet der Maschinellen Übersetzung. Wie heutige Beispiele à la Yahoo! Babel Fish oder Google Translate vorführen, ist das Problem der Übersetzung zwischen Sprachen auch nach Jahrzehnten ungelöst. Eine Lösung ist wegen der Mehrdeutigkeiten in natürlichen (Gebärden-)Sprachen auch nicht in Sicht.
Andere Forschungsgebiete können unter vielen mehr die automatische Textzusammenfassung, Künstliche Intelligenz, Inhaltsanalyse oder Sprachsynthese (engl. Text-to-Speech) sein. Letzteres kann dann bereits mehr in die Elektrotechnik abdriften. Insbesondere die Inhaltsanalyse, im Sinne von der semantischen Erfassung eines Textes oder vom Zusammenhang von Informationen in diversen Texten, gewinnt wohl im Zuge vom aufkommenden Semantic Web rasant an Bedeutung.
Es sind durch die CL, genau wie mit der Technikforschung und -entwicklung generell auch für die Gesellschaft eher schädliche Anwendungen denkbar. Das ist bspw. möglich, wenn Staat oder Wirtschaft dank Erkenntnissen der Computerlinguistik personenbezogene Daten nur zu gut zu einem Gesamtbild über eine Person verknüpfen können. Die entsprechende Textkorpora (Textsammlungen) dafür sind in Staat und Wirtschaft oder auch einfach im Netz immer stärker verfügbar. Es gab z. B. den Fall der militanten gruppe (mg), wo gestützt auf häufige Verwendung von gewissen soziologischen Begriffen auf eine Person (Andrej Holm) geschlossen werden "konnte" - Verdacht war auf Mitgliedschaft in einer terroristischen Vereinigung. Mutmasslich kamen da noch nicht einmal sehr fortgeschrittene CL-Methoden zum Einsatz, doch in Zukunft könnte sich das bei der weltweiten Tendenz zur verdachtsunabhängigen Überwachung noch verschärfen.
Was zuletzt die TaCoS 2010 betrifft, die in Zürich stattfindet, so kann gesagt werden, dass die dort behandelten Themen für Leute mit Informatik- oder Linguistikkenntnissen zumindest in den Ideen zugänglich sind. Entsprechend muss man kein Studierender dieses Gebiets sein, um an einer solchen Veranstaltung teilzunehmen. Noch viel weniger muss man Studierender sein, um Beiträge an die TaCoS 2010 einzureichen. Zwar wird der Call for Papers erst noch veröffentlicht, doch jede Person, die in einem CL-relevanten Bereich arbeitet, darf mich gerne darüber orientieren - falls Interesse besteht an so einer Fachtagung als Referent aufzutreten.
|