Einführung in Text Mining mit dem Natural Language Toolkit (NLTK) (17.06.2021)

211_INF15

Donnerstag 15:20-16:50 Uhr

Text-Mining-Verfahren werden eingesetzt, um aus einer großen Menge an Texten automatisiert strukturierte Informationen zu extrahieren.

Der Workshop vermittelt einen ersten, praktischen Einstieg in das Thema. Wir werden gemeinsam die Abstracts wissenschaftlicher Artikel analysieren. Als Werkzeug wird die Python-Bibliothek Natural Language Toolkit zum Einsatz kommen, mit der wir die Texte in Tokens zerlegen, Stoppworte entfernen und schließlich Visualisierungen der für diese Abstracts charakteristischen Wörter erzeugen werden.

Für den Workshop werden keine Vorkenntnisse benötigt. Zu Beginn wird es eine kurze Einführung in die Programmiersprache Python geben.

Sie können alle Programmieraufgaben auf Ihrem lokalen PC durchführen. Als Arbeitsoberfläche werden wir die im Data-Science-Bereich beliebte Open-Source-Software Jupyter Notebook nutzen, um unseren Softwarecode auszuführen und dessen Ergebnisse anzeigen zu lassen.

Im Anschluss an den Workshop können Sie Ihr selbst erstelltes Jupyter-Notebook einsetzen, um die Analysen auf eigenen Textdokumenten zu wiederholen.

Installationshinweise werden im Vorfeld des Workshops bereitgestellt.

Zielgruppe: Promovierende und Postdocs aller Fachrichtungen

Referierende: Jens Freund und Andre Pfeifer | ULB

Datum/Uhrzeit: Donnerstag, 17. Juni 2021 | 15:20 – 16:50 Uhr

Ort:

  • Online via Zoom Pro
  • Sie erhalten den Link zur Einwahl per E-Mail.

Bitte melden Sie sich hier an.

---------

Wichtige Hinweise zur Anmeldung

Für die Veranstaltungen ist eine Anmeldung notwendig.

Die Veranstaltungen sind für Nachwuchswissenschaftlerinnen und –wissenschaftler der TU Darmstadt gebührenfrei.

Bitte beachten Sie folgende Hinweise zur Anmeldung:

  • Durch das Einreichen eines Anmeldeformulars ist Ihre Anmeldung verbindlich.
  • Bis spätestens zwei Wochen vor Veranstaltungsbeginn erhalten Sie von uns eine Information über den Status Ihrer Anmeldung.
  • Anmeldungen werden in der Reihenfolge des Eingangs berücksichtigt.
  • Eine Veranstaltung findet nur statt, wenn genügend Anmeldungen vorliegen.
  • Bei Verhinderung bitte umgehend absagen, damit Interessierte von der Warteliste nachrücken können.
  • Bei unentschuldigtem Fehlen behalten wir uns vor, Ihre zukünftigen Anmeldungen nachrangig zu behandeln.
  • Bei Ausschreibungen auf Deutsch ist die Sprache der Veranstaltung Deutsch, bei englischsprachigen Ausschreibungen wird die Veranstaltung in englischer Sprache durchgeführt.

--------

Kinderbetreuung bei Veranstaltungen

Möchten Sie eine Weiterbildung besuchen, aber Ihre Kinderbetreuung deckt die erforderlichen Zeiten nicht ab? Hier finden Sie mehr Informationen über die Angebote der TU zur Ad-hoc-Betreuung für Kinder.