3-D Visualisierung eines Wordvektors (100 Verbindungen von „denken“ farblich hervorgehoben)

Wordvektoren

Wordvektoren sind die technische Grundlage für das Sprachverstehen von künstlicher Intelligenz. Worte werden nicht durch ihre Bedeutung verstanden, sondern mit welchen anderen Worten sie häufig zusammen auftauchen. Dabei werden Worte durch Vektoren (Zahlenkolonnen) aus zumeist 100-300 Werten je Wort ausgedrückt, die dann technisch weiterverarbeitet werden können. Beispielsweise ergibt die mathematische Berechnung der Vektoren von:

GmbH 
- Geschäftsführer 
+ Vorstand 
= Aktiengesellschaft

Dadurch das die jeweilige Kombination häufig in den Grundtexten auftaucht, kann künstliche Intelligenz folgern, dass ein Vorstand einer AG zugerechnet werden kann. Aber die KI versteht nicht den konzeptuellen Zusammenhang, wie es ein menschliches Gehirn direkt tut.

Warum jetzt der KI-Hype?

Künstliche Intelligenz wurde bereits mehrmals als neue Wundertechnologie angepriesen, aber 3 aktuelle Entwicklungen ermöglichen neue Anwendungen für diese cleveren, statistisch-mathematischen Methoden.

Datenaufbereitung und Neuronale Netze

Während die oben vorgestellten Technologien allgmein verfügbar sind, haben wir uns auf die Verarbeitung deutscher Sprache und Texte spezialisiert.

Die Aufbereitung vorliegender Datensätze bereitet im Deutschen deutlich mehr Aufwand als im Englischen: beispielsweise die Konjugation von Verben oder die Deklination von Nomen. Außerdem verfügen wir über Erfahrung im Normieren von alter und neuer Rechtschreibung, sowie typischer Umwandlung für die digitale Verarbeitung (z.B. ae statt ä).

Darüberhinaus verfügen wir über Fachwissen in der Erstellung neuronaler Netze, die Wordvektoren als Eingabe verwenden. Neuronale Netze werden aktuell in 2 Bereichen eingesetzt, um komplexere Aufgaben zu erfüllen:

  • Erkennung, dazu zählen das Erkennen von Objekten (z.B. Textklauseln), Stimmungen (z.B. Zufriedenheit) oder Einordnung (z.B. Buchhaltung)
  • Erzeugen, wie das Zusammenfassen von Texten, das freie Schreiben oder Chatbots.

Das mathematische Grundproblem ist jeweils das Erstellen des dafür passenden neuronalen Netzes. Durch unseren Forschungshintergrund übertragen wir die erprobten Konzepte auf die Sprache und Texte in deutschen Unternehmen. Nehmen Sie mit uns Kontakt auf, wir freuen uns auf Sie.

Beispiel einer Optimierung vom Tensorflow Playground

Welche Einblicke nützen Ihnen?

Wir unterstützen Sie dabei, die Dialoge Ihres Unternehmens zu verstehen. Nehmen Sie mit uns Kontakt auf.

Kontakt