Wenn von Daten die Rede ist, ist der erste Gedanke meist eine digitale Ansammlung von Tabellen mit überwiegend numerischen Werten. Dabei sitzen viele Unternehmen unbewusst meist auf einem weiteren Schatz von Daten - Textdaten. Die Kunst liegt darin, diese Textdaten sinnvoll zu analysieren und zu interpretieren. Dafür wird heutzutage Text Mining und Natural Language Processing (NLP) - als Teilbereich von Text Mining - genutzt. In diesem Artikel zeigen wir Ihnen, was NLP und Text Mining mit Künstlicher Intelligenz und Machine Learning zu tun hat, welche spannenden Anwendungsfälle für verschiedene Unternehmensbereiche existieren und wie sich ein NLP Projekt auch für Ihre Idee umsetzen lässt.
Was bedeutet Text Mining und NLP?
Text Mining ist ähnlich wie Data Mining - die Aufbereitung unstrukturierter Daten. Der Unterschied besteht ausschließlich in der Art der Daten.
Hierbei wird der Text eingelesen und in nützliche Informationen gewandelt. So gehört bereits die Funktion Wörter zählen Ihres favorisierten Textverarbeitungsprogramm zum Text Mining. Dazu kommt die Spezifizierung der Wörter, d.h., ob es sich um Nomen, Adjektive, oder aber auch Eigennamen handelt. Jede denkbare linguistische Information, die ein Text hergibt, kann durch Text Mining extrahiert werden.
Natural Language Processing ist, wie der Name schon sagt, die Verarbeitung natürlicher, d.h. menschlicher Sprachen. NLP umfasst verschiedene Methoden. Da NLP ein Teilbereich von Machine Learning (ML) ist, arbeiten diese Methoden nach dem selben Muster wie ML Modelle. Das bedeutet, die Algorithmen lernen etwas aus den Daten. Zu den Methoden gehören unter anderem Document Classification & Topic Modelling, Sentimentanalysen und Text Generation:
- Document Classification & Topic Modeling:
Ein mathematischer Algorithmus findet verschiedene Themenbereiche (Topics) aus mehreren Textdokumenten. Dieser Vorgang nennt sich Topic Modelling. Mithilfe dieser berechneten vordefinierten Topics lassen sich somit auch zukünftige Dokumente automatisch klassifizieren (Document Classification).
- Sentimentanalyse:
Bei der Sentimentanalyse werden anhand bestimmter Wörter bzw. Wortkombinationen lässt sich die Stimmung, Emotion und Subjektivität eines Textdokuments bestimmen. Dafür werden von einem vortrainiertem Algorithmus spezifische Scores berechnet, welche definieren wie positiv oder objektiv ein Dokument ist.
- Text Generation:
Für die automatische Generierung von Textdokumenten, werden große Textdatenmengen benötigt. Damit kann ein ML Modell lernen, wie Sätze angeordnet werden. Dies ist ein fortlaufender Prozess, da das Modell mit jedem neuen Textdokument neue Zusammenhänge erlernen kann.
Text Mining and NLP - Use Cases
Im Folgenden werden typische Anwendungsfälle im Unternehmen erläutert. Dabei eröffnet Text Mining in jedem Unternehmensbereich neue Möglichkeiten.
Im Bereich Recruiting und Human Resources kann NLP beispielsweise eingesetzt werden um Bewerbungen, insbes. Initiativbewerbungen besser einzuordnen. Dabei werden die Lebensläufe gescannt und automatisch einer passenden Stellenanzeige zugeordnet. | |
NLP findet viele Beispielanwendungen im E-Commerce. Ein typischer Anwendungsfall ist das automatisierte Lesen der Kundenbewertungen. Eine anschließende Sentimentanalyse zeigt, welches Produkt gut ankommt und welches nicht. Ein fortgeschrittener, immer häufiger Anwendungsfall sind Chatbots. | |
Besonders das Marketing profitiert von den Ergebnissen der Textanalysen. Unternehmen, die Blogartikel einsetzen zu Marketingzwecken, können Ihre Artikel zielgerichtet schreiben und wissen vorab, worauf es den Lesern ankommt. Dieser spezielle Use Case wurde in diesem Artikel im Detail aufbereitet. | |
Das sogenannte Fuzzy Matching - eine NLP-Methode - hilft dem Controlling beispielsweise dabei Kundenadressen korrekt zuzuordnen. Manuelle Eingabefehler passieren, doch diese werden durch NLP automatisiert ausgebessert und führen zu qualitativen und standardisierten Daten. Fuzzy Matching ist teilweise schon in Tableau und SAP implementiert und nutzbar. |
Dies ist nur eine kleine Auswahl von Anwendungsfällen. NLP findet überall dort Anwendung, wo Texte zu extrahieren sind, beispielsweise bei der automatisierten Priorisierung von E-Mails, der Weiterleitung von Service-Tickets und der Informationsgewinnung aus Dokumenten, wie z.B. Rechnungen, Verträge oder andere Belege. NLP funktioniert optimal im Zusammenspiel mit Web-Mining bzw. Web-Scraping. Dieses dient dazu Informationen aus dem Internet zu erhalten. Das automatisierte Lesen und Analysieren eines Newsfeeds hilft beispielsweise den Kollegen aus dem Bereich Finance, die Kurse und Geschehnisse im Blick zu behalten.
Kurbeln Sie Ihr Business an mit
Machine Learning und Künstlicher Intelligenz
Voraussetzungen für die technische Umsetzung Ihres NLP Projekts
Mittlerweile gibt es schon verschiedenste Möglichkeiten ein Projekt im Bereich Text Mining und NLP umzusetzen. Dabei müssen keine komplexen mathematischen Algorithmen angelegt werden und Programmierkenntnisse sind nicht zwingend vorausgesetzt.
SAP
Im SAP Umfeld gibt es inzwischen eine Reihe von Anwendungen zur Textanalyse, Text Mining und NLP.
SAP Conversational AI
So bietet SAP mit SAP Conversational AI ein konkretes Produkt zur Erstellung von Chatbots an. Als Teil der SAP Business Technology Plattform, wird dem Anwender die Möglichkeit geboten einen digitalen Assistenten flexibel zu erstellen, zu erweitern und die Ergebnisse zu analysieren. Dies erlaubt einen Einsatz im Kundenkontakt als auch eine Unterstützung von Mitarbeitern im automatischen Support.
SAP Analytics Cloud (SAC)
Auch in der SAP Analytics Cloud (SAC) lassen sich spannende NLP Anwendungsfälle realisieren. Besonders interessant ist dabei das Feature Search to Insight. Dieses kann genutzt werden, um dem System mündlich Fragen zu stellen und schnelle Antworten zu erhalten. Wenn Sie mehr über Search to Insight und die Möglichkeiten, die SAC im Bereich KI und ML bietet, empfehlen wir Ihnen diesen Artikel.
SAP HANA
Anwender der SAP HANA haben die Option zur Text Analysis und Text Mining. Text Analysis umfasst zum einen die flexible SAP HANA Textsuche (Exact, Fuzzy, Linguistic), als auch die Möglichkeit einen Textindex zu erstellen, welcher den Text automatisch in seine Bestandteile zerlegt (Nomen, Verben, Adjektive, Prädikate, …) und sogenannte Entitäten erkennt. Text Mining hingegen bietet die konkrete Möglichkeit zur Ähnlichkeitsanalyse von Textdokumenten. Dazu werden statistische Analyseverfahren oder KNN (K-Nearest-Neighbors)-Clustering genutzt. Die Auswahl ist hierbei begrenzt, jedoch ausreichend für erste einfache Anwendungen.
Data Intelligence
Der Nachteil an den genannten Anwendungen besteht in der Transparenz. Unklar ist häufig, wie ein bestimmtes Ergebnis zustande kommt. Um dies nachhaltig evaluieren zu können, ist die Analyse mit Python (s. unterer Abschnitt) empfehlenswert für ein erstes NLP Projekt.
Als Alternative zur kompletten Programmierung eines NLP Use Cases bzw. als Brücke zwischen SAP und Python kann Data Intelligence genutzt werden. Hierbei handelt es sich um ein innovatives, visuelles Datenmanagement-Tool. Zum einen bietet Data Intelligence eigene ML Möglichkeiten über den Service von SAP Leonardo Machine Learning an, zum anderen können Data Scientists, IT und Fachabteilung in Abstimmung kollaborieren, um den gewählten NLP/Text Mining Use Case optimal als Gesamtprojekt aufzubereiten.
Python
Für Data Scientists, ML Engineers und all jene Anwender, welche sich besonders im Python-Ökosystem wohl fühlen, stehen zwei wesentliche Bibliotheken zur Verfügung.
Zum einen das Natural Language Toolkit als führende und klassische Plattform zu Verarbeitung von Textdaten, welche die Programmbibliothek nltk open-source zur Verfügung stellt. Die Bibliothek nltk ermöglicht es dem User den Text in seine Einzelteile aufzuteilen und damit die Informationen in einem Korpus strukturiert zu extrahieren.
Die zweite große open-source Bibliothek ist spaCy. SpaCy erweitert das Angebot von nltk durch spezifische Anwendungen. Erst Anfang Februar 2021 wurde die neueste Version “spaCy v3” veröffentlicht, was dem User verschiedene zusätzliche Möglichkeiten bietet, wie beispielsweise die Verwendung vortrainierter Transformator zum Trainieren eigener Pipelines.
Des Weiteren können verschiedene Bibliotheken genutzt werden, welche bereits vortrainierte Scores für die Sentimentanalyse beinhalten (z.B. TextBlob), mathematische Algorithmen zur Ähnlichkeitsanalyse bzw. für das Topic Modelling bereitstellen (z.b. gensim) und bei der Textextraktion von Webinhalten benutzt werden (z.B. scrapy, beautifulsoup).
Natural Language Processing - Unser Fazit
Text Mining und Natural Language Processing ermöglichen eine Reihe von spannenden Anwendungen, welche Unternehmen teilweise noch gar nicht bewusst sind. Grade wo viel mit Textdokumenten und Unterlagen gearbeitet wird - ob virtuell oder in Papier - kann dieser besondere Unterbereich von ML genutzt werden, um manuelle Arbeit zu vereinfachen oder gar zu ersetzen. Der Bereich NLP gewinnt immer mehr an Bedeutung und findet an mehr Stellen Anwendung als einem bewusst ist. Dazu zählen bereits mit Machine Learning perfektionierte Übersetzer und Suchmaschinen.
Die ersten Chatbots treten bereits auf einigen Unternehmenswebseiten auf und können entweder komplex und individuell programmiert werden oder mithilfe gegebener Tools implementiert werden. Die Anwendung der vorgestellten Tools für die Umsetzung eines NLP Projekts eignet sich für Personen mit geringen Programmiererfahrungen. Hierbei mangelt es jedoch an Transparenz und Verständnis. Dafür empfehlen wir programmieraffinen Anwendern die Nutzung des breiten Spektrums an Möglichkeiten von Python. Vorausgesetzt sind hierbei jedoch spezifische Fachkompetenzen.
Sind Sie nun interessiert, welche Machine Learning Anwendungsfälle für Textmining und NLP in Ihrem Unternehmen erfolgversprechend sind oder haben Sie sogar ein konkretes Problem im Visier? Unser Team umfasst Experten für verschiedene Lösungen und Anwendungen. Gerne erarbeiten wir mit Ihnen gemeinsam eine Strategie für Ihre Textdaten und unterstützen Sie vollumfänglich in der Konzipierung, Implementierung und dem Betrieb der Lösung. Sprechen Sie uns gerne an!