print

Sprachauswahl

Benutzermenü

Navigationspfad

Hauptnavigation

Inhalt

Arbeitsgebiet "Textmining"

Textmining ist ein automatisierter Prozess, mit dem natürliche Sprache in Textform analysiert wird. Textmining gliedert sich in verschiedene Teilaufgaben; z.B. beschäftigt sich Information Retrieval (IR) mit dem Auffinden von Dokumenten, die für eine bestimmte Fragestellung relevant sind, Information Extraction (IE) zielt auf das Auffinden von Entitäten (Objekten), Tatsachen oder Ereignissen ab. Named Entity Recognition (NER) ist die Unterdisziplin von IE, die sich mit dem Erkennen von Entitäten in Texten beschäftigt. Das Ziel der Text Klassifikation ist die Gruppierung von Dokumenten mit ähnlichen Inhalten.

Textmining spielt in der Bioinformatik eine wichtige Rolle, da ein Grossteil des biologischen Wissens nur in Form von Text zugänglich ist. Um dieses Wissen zu extrahieren, ist es wesentlich, biologische Objekte in Texten zu erkennen, dies gilt insbesondere für Gene und Proteine.

Unsere Arbeit zielt darauf ab:
  • Informationen aus Texten zu extrahieren
  • Aus Texten Netzwerke zur weiteren Analyse zu generieren
  • Text-Informationen zusammen mit Daten aus anderen Quellen (z.B. Genexpressionsdaten) zu analysieren

 


Servicebereich

Fußzeile