Finden statt Suchen

10.06.2008

Finden statt Suchen

TU-Forscherinnen arbeiten an intelligenter www-Suchsoftware

In einem Forschungsprojekt an der TU Darmstadt arbeitet ein Team von Informatikerinnen an Software-Werkzeugen, die dem Nutzer hilfreiche Antworten auf in natürlicher Sprache gestellte Fragen liefern soll. Dabei nutzen die Wissenschaftlerinnen das kollektive Wissen von Internet-Gemeinschaften, um Informationen mittels intelligenter Software im Internet zu finden.

„Was schützt meinen Computer vor Trojaner-Attacken?“ oder „Wie finde ich einen guten Kindergarten?“: Herkömmliche Suchmaschinen im Internet liefern oftmals tausende Webseiten auf eine Frage zurück. Darin die gesuchte Antwort zu finden bleibt dem Suchenden überlassen, eine zeitaufwändige, arbeitsintensive und unbeliebte Tätigkeit. Obwohl fast alle erwachsenen Internet-Nutzer Suchmaschinen benutzen, findet nur ein kleiner Teil die relevanten Informationen gleich beim ersten Suchversuch.

Kollaborativ erstellte Frage-Antwort-Plattformen im Web 2.0 sollen das ändern. In diesen Plattformen finden sich selbst auf schwierigste Fragen oft Antworten höchster Qualität. Die Popularität von Frage-Antwort-Plattformen, wie beispielsweise Yahoo!Answers, WikiAnswers oder AnswerBag, ist beachtlich. So zählt WikiAnswers mittlerweile mehr als eine Million Fragen, die in verschiedene inhaltliche Kategorien eingeteilt sind.

Doch die Suche nach Antworten in diesen Frage-Antwort-Wissensspeichern ist immer noch eine Suche nach der sprichwörtlichen Nadel im Heuhaufen. Zum einen macht es die schiere Menge an Informationen dem Nutzer extrem schwer, dort zu navigieren. Zum anderen werden inhaltlich identische oder sehr verwandte Fragen oft in unterschiedliche Worte gefasst und können deshalb mit herkömmlichen Suchmaschinenverfahren nicht gefunden werden.

In dem Forschungsprojekt wollen sich die Wissenschaftlerinnen des Ubiquitous Knowledge Processing (UKP) Lab an der TU Darmstadt dieser Herausforderung annehmen. Sie entwickeln intelligente Algorithmen im Bereich der automatischen Sprachverarbeitung, die unterschiedlich formulierte Fragen mit ähnlicher Bedeutung in den Frage-Antwort-Plattformen automatisch aufspüren.

Existiert bereits eine Antwort auf die gestellte Frage, wird diese dem Fragesteller unmittelbar angezeigt. Sollte eine Frage noch nie beantwortet worden sein, werden elektronische Dokumente im Internet durchsucht, um die Antworten dort aufzuspüren. Dabei werden verschiedene Wörter, die das Gleiche bedeuten, auf einen Suchbegriff abgebildet. Fragt etwa der Suchende nach „einem Programm, um den Computer vor Viren zu schützen“, werden relevante Dokumente zurückgeliefert, die den Begriff „Antiviren-Software“ enthalten.

Um die menschliche Sprachintelligenz nachzubilden, werten die Darmstädter Forscherinnen kollaborativ erstellte Web 2.0-Wissensquellen automatisch aus, wie die Online-Enzyklopädie Wikipedia oder das multilinguale Wörterbuch Wiktionary und machen das daraus destillierte Wissen den Sprachanalyseprogrammen zugänglich.

Ihren ersten Praxistest soll die neue Software im computerbasierten Lehren und Lernen bestehen. In der universitären und berufsbegleitenden Ausbildung ist das Problem der Informationsrecherche besonders akut – die Lernmaterialen unterliegen ständigen Veränderungen. Die Suche nach Antworten ist extrem aufwändig, der Zugriff auf den Wissensstoff ist erschwert, und Lehrveranstaltungen bieten oft wenig Raum, um Fragen persönlich zu stellen.

Das vor wenigen Monaten begonnene Projekt wird von der Computerlinguistin Dr. Iryna Gurevych geleitet. Die 31-Jährige Wissenschaftlerin ist Leiterin des UKP Labs am Fachbereich Informatik der TU Darmstadt und wissenschaftliche Direktorin des Forschungsschwerpunkts „E-Learning“ an der TU Darmstadt. Die Deutsche Forschungsgemeinschaft unterstützt die junge Wissenschaftlerin im Rahmen des Emmy Noether-Programms zur Förderung von exzellenten Nachwuchswissenschaftlern für die Dauer von fünf Jahren. Das Projektteam besteht übrigens ausschließlich aus Frauen – mehr als ungewöhnlich in einem technischen Fach und ganz im Sinne des Förderprogramms, das nach der deutschen Mathematikerin und Physikerin Emmy Noether benannt wurde.

Das UKP Lab zählt mittlerweile insgesamt zehn wissenschaftliche Mitarbeiter und Mitarbeiterinnen und bearbeitet eine Reihe von anspruchsvollen Forschungsprojekten. Zudem wurde die Gruppe kürzlich für ihre Forschungsarbeiten im Bereich des Sprachverstehens mit dem prestigeträchtigem „IBM UIMA Innovation Award“ geehrt.

zur Liste