Workshop Details

ML Summit Summit 2020
22. - 24. April 2020 | München
Das große Trainingsevent für Machine Learning Development
& Business Innovation

Stephanie Fischer
Dr. Christian Winkler

de

15 Okt 2019
14:00 - 17:30
3+ Kollegen anmelden und bis zu 100 € pro Ticket sparen! Jetzt anmelden

Alles selber lesen war gestern – wie man mit Machine Learning große Textmengen in Erkenntnisse verwandelt

15 Okt 2019
14:00 - 17:30

Tuesday, 15. October 2019 | 14:00 - 17:30

Viele wichtige Informationen in Unternehmen liegen nur in Textform vor. Methoden der automatisierten
Textanalyse helfen, diesen Wissensschatz zu heben. Ob nutzergenerierte Inhalte aus dem Netz, Kundenanfragen per Mail oder Verträge und Pflichtenhefte: Viele Informationen liegen in Form unstrukturierter Texte vor. Da diese Datenmenge immer schneller wächst, kann man nicht mehr einfach „mitlesen”. Die Lösung besteht in einer automatisierten Verarbeitung und Auswertung solcher
Dokumente. NLP, Clustering, Topic Modeling, Klassifikation, Universal Embeddings – bei den KI-Technologien für die automatisierte Verarbeitung von Textmengen gibt es im Moment viele verschiedene
Entwicklungsrichtungen, die teils ganz unterschiedliche Probleme lösen und sich besonders in Kombination zu ihrer größten Leistungsfähigkeit entfalten können. Die Referent/innen erläutern an einem
konkreten Beispiel die Stufen eines Text-Analytics-Projekts und zeigen, welche Techniken auf welchen Einsatzbereich passen und welche neuen Use Cases damit möglich werden. Die Session richtet sich an Entwickler, Fachanwender, Führungskräfte und Data-Science-Einsteiger, die das Potenzial automatisierter Textanalyse für eigene Anwendungen besser einschätzen wollen.

Workshop Requirements:

– Als Start sollte am besten ein Arbeitsverzeichnis für den Workshop angelegt werden.

– Zunächst sollte die Anaconda-Distribution für Python 3 installiert werden (https://www.anaconda.com/distribution/#download-section), am besten als User-Installation

– Anschließend bitte den Anaconda-Prompt öffnen (bei Bedarf als Administrator) und folgende Befehle eingeben:

    • conda install -y pip
    • conda install -y -c conda-forge ipython-sql
    • conda install -y -c anaconda beautifulsoup4  
    • conda install -y -c anaconda gensim
    • pip install pyLDAvis
    • conda install -y -c anaconda word2vec
    • conda install -y -c anaconda requests
    • conda install -y -c anaconda nltk
    • conda install -y -c conda-forge spacy
    • python -m spacy download en
    • python -m spacy download de
    • conda install -y -c conda-forge wordcloud

    – Ein Client für SQLite ist hilfreich, z.B. http://sqlitebrowser.org/dl/

    – Für die Landesspracherkennung sollte https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.bin heruntergeladen und im Arbeits-Verzeichnis abgelegt werden.

    Wer die oben genannten Punkte umsetzt (und alles VOR dem Workshop vorbereitet hat), kann im Workshop an seinem Laptop mitmachen.

    Wer das nicht bis vor dem Workshop schafft, kann uns auf dem Screen folgen.