symlink.ch | TaCoS 2010 in Zürich - und was ist eigentlich Computerlinguistik?

symlink.ch

FAQ
Mission
Über uns
Richtlinien

Moderation
Einstellungen
Story einsenden

Suchen & Index
Ruhmeshalle
Statistiken
Umfragen

Redaktion
Themen
Partner
Planet

XML | RDF | RSS
PDA | WAP | IRC
Symbar für Opera
Symbar für Mozilla

Freunde

Benutzergruppen
LUG Switzerland
LUG Vorarlberg
LUGen in DE
SIUG
CCCZH
Organisationen
Wilhelm Tux
FSF Europe
Events
LinuxDay Dornbirn
BBA Schweiz
CoSin in Bremgarten AG
VCFe in München
Menschen
maol
Flupp
Ventilator
dawn
gumbo
krümelmonster
XTaran
maradong
tuxedo

TaCoS 2010 in Zürich - und was ist eigentlich Computerlinguistik?

Veröffentlicht durch hernani am Donnerstag 24. September 2009, 06:42
Aus der Computerlinguistik-und-Sprachtechnologie Abteilung

Die TaCoS (Tagung der Computerlinguistik-Studierenden) ist eine alljährliche Veranstaltung, die jedes Jahr an einem anderen (universitären) deutschsprachigen Institut der Computerlinguistik (CL) organisiert wird. Nachdem ich der letzten und 19. TaCoS (2009) in Heidelberg einen Besuch abgestattet habe, wurde beschlossen die 20. TaCoS in Zürich abzuhalten. Diese wird wahrscheinlich im Juni 2010 stattfinden. Die reine Präsenz eines Zürchers dürfte sie auf die Idee gebracht haben, Zürich doch als nächsten Austragungsort zu wählen. Man stimmte ab - nur eine Gegenstimme für Stuttgart, Rest für Zürich. Nachdem ich mich bereit erklärte tatsächlich bei der Organisation auch zu helfen und als Botschafter für diesen Entscheid zu fungieren, war die Sache auserkoren. Schön & gut, doch fragt sich mancher: WTF ist eigentlich Computerlinguistik?

Z. B. gibts in Zürich das CL-Institut der Uni Zürich, das dort am IFI (Institut für Informatik) haust. Da liegt die Vermutung bereits nahe, dass Computerlinguistik mit Informatik etwas zu tun hat. Dieses Fachgebiet wird aber mit der Linguistik, d. h. der Sprachwissenschaft, verknüpft, um dann das Interdisziplinärgebiet der Computerlinguistik zu bilden. Es handelt sich also um einen Studienbereich ähnlich dem der Wirtschaftsinformatik, das selber BWL-/VWL-Wissen mit Informatik-Knowhow verknüpft. Im Falle der Computerlinguistik wird Wissen um Sprachen (Syntax, Morphologie u. a.) mit Informatik-Knowhow verknüpft. Die Uni Zürich spricht zusätzlich von Sprachtechnologie, wenn anstatt das Wissen um die Möglichkeiten (Theorie) mehr die praktische Anwendung der Computerlinguistik, d. h. die Entwicklung von Sprachwerkzeugen, im Vordergrund steht. Da sich letzten Endes alles um maschinelle Sprachverarbeitung dreht, wird auch von Linguistischer Datenverarbeitung (LDV) gesprochen. Das tut etwa die deutsche Gesellschaft für linguistische Datenverarbeitung (GLDV) seit 1975.

Prinzipiell wird Sprachtechnologie schon seit jeher vorangetrieben. Bei Beginn des Kalten Krieges wurde von den USA versucht Dokumente maschinell vom Russischen ins Englische zu übertragen (Georgetown-IBM-Experiment (engl.)); das wäre das klassische CL-Forschungsgebiet der Maschinellen Übersetzung. Wie heutige Beispiele à la Yahoo! Babel Fish oder Google Translate vorführen, ist das Problem der Übersetzung zwischen Sprachen auch nach Jahrzehnten ungelöst. Eine Lösung ist wegen der Mehrdeutigkeiten in natürlichen (Gebärden-)Sprachen auch nicht in Sicht.

Andere Forschungsgebiete können unter vielen mehr die automatische Textzusammenfassung, Künstliche Intelligenz, Inhaltsanalyse oder Sprachsynthese (engl. Text-to-Speech) sein. Letzteres kann dann bereits mehr in die Elektrotechnik abdriften. Insbesondere die Inhaltsanalyse, im Sinne von der semantischen Erfassung eines Textes oder vom Zusammenhang von Informationen in diversen Texten, gewinnt wohl im Zuge vom aufkommenden Semantic Web rasant an Bedeutung.

Es sind durch die CL, genau wie mit der Technikforschung und -entwicklung generell auch für die Gesellschaft eher schädliche Anwendungen denkbar. Das ist bspw. möglich, wenn Staat oder Wirtschaft dank Erkenntnissen der Computerlinguistik personenbezogene Daten nur zu gut zu einem Gesamtbild über eine Person verknüpfen können. Die entsprechende Textkorpora (Textsammlungen) dafür sind in Staat und Wirtschaft oder auch einfach im Netz immer stärker verfügbar. Es gab z. B. den Fall der militanten gruppe (mg), wo gestützt auf häufige Verwendung von gewissen soziologischen Begriffen auf eine Person (Andrej Holm) geschlossen werden "konnte" - Verdacht war auf Mitgliedschaft in einer terroristischen Vereinigung. Mutmasslich kamen da noch nicht einmal sehr fortgeschrittene CL-Methoden zum Einsatz, doch in Zukunft könnte sich das bei der weltweiten Tendenz zur verdachtsunabhängigen Überwachung noch verschärfen.

Was zuletzt die TaCoS 2010 betrifft, die in Zürich stattfindet, so kann gesagt werden, dass die dort behandelten Themen für Leute mit Informatik- oder Linguistikkenntnissen zumindest in den Ideen zugänglich sind. Entsprechend muss man kein Studierender dieses Gebiets sein, um an einer solchen Veranstaltung teilzunehmen. Noch viel weniger muss man Studierender sein, um Beiträge an die TaCoS 2010 einzureichen. Zwar wird der Call for Papers erst noch veröffentlicht, doch jede Person, die in einem CL-relevanten Bereich arbeitet, darf mich gerne darüber orientieren - falls Interesse besteht an so einer Fachtagung als Referent aufzutreten.

< CCCZH-Bericht zum JCVP-Datenschutzpodium online | Druckausgabe | Alles bestens: Apple Keynote Remix >

symlink.ch Login

extrahierte Links

Was ist ein Wiki?

Wikipedia

19. TaCoS

WTF

CL-Institut der Uni Zürich

IFI

Computerlinguistik

Syntax

Morphologie

Uni Zürich spricht

GLDV

Georgetown-IBM-Experiment

Maschinellen Übersetzung

Yahoo! Babel Fish

Google Translate

Sprachsynthese

Elektrotechnik

Semantic Web

Textkorpora

militanten gruppe

Andrej Holm

Mehr zu Wissenschaft

Auch von hernani

'TaCoS 2010 in Zürich - und was ist eigentlich Computerlinguistik?' | Einloggen/Account erstellen | 2 Kommentar(e) | Kommentare durchsuchen

Das Kleingedruckte: Der Besitzer der folgenden Kommentare ist wer immer sie eingeschickt hat. Wir sind in keiner Weise für sie verantwortlich.

SMS/Twitter-Generation (Score:0)

Von Anonymer Feigling am Thursday 01. October 2009, 17:33 MEW (#1)

solche langen Text liest keiner mehr...

[ Beantworten | eine Stufe hinauf ]

Re: SMS/Twitter-Generation by Anonymer Feigling Friday 02. October 2009, 08:52 MEW

Durchsuche symlink.ch:

Never be led astray onto the path of virtue.