Speech Mining – eine Revolution in der Prozessoptimierung?

Dr. Carsten Behrens

Von

Dr. Carsten Behrens

Veröffentlicht am

10.4.2024

Speech Mining – eine Revolution in der Prozessoptimierung?

Entdecke in diesem Artikel die Entstehung eines neuen Konzepts: Speech Mining. Der Fokus wird von der traditionellen technologiezentrierten Sichtweise des Process Mining hin zu einem innovativen Ansatz verlagert, bei dem der Mensch im Mittelpunkt steht. Tauche ein in eine moderne Methode, die Gespräche in Echtzeit nutzt, um Prozessbeschreibungen zu rekonstruieren. Anhand praxisnaher Beispiele wie der Dokumentation eines Montageprozesses wird gezeigt, wie ChatGPT4 durch Speech-to-Text-Technologie und Bildzuordnung eine präzise Montageanweisung während der Ausführung ermöglicht.

Die Geburt eines Konzepts

Das traditionelle Process Mining fokussiert sich auf die Analyse der digitalen Spuren, die die Mitarbeitende in den IT-Systemen des Unternehmens hinterlassen, wobei Prozesse rein technisch betrachtet werden. Doch was passiert, wenn nicht die digitalen Spuren, sondern das gesprochene Wort im Mittelpunkt steht? Hier entsteht ein innovatives Konzept, das Speech Analytics und Audio Mining kombiniert – Speech Mining.

Du hast noch nie von Speech Mining gehört? Kein Wunder, strenggenommen gibt es das nämlich noch gar nicht! Vielmehr ist es eine Vision davon, wie KI die Prozessmodellierung zukünftig revolutionieren könnte. Aber von Anfang an: Was genau ist mit Speech Mining eigentlich gemeint.

Speech Analytics, auch Interaktionsanalyse genannt, ist eine Technologie, die künstliche Intelligenz nutzt, um menschliche Sprache zu verstehen, zu verarbeiten und zu analysieren. Audio Mining beschreibt das systematische Extrahieren von Informationen aus Audioquellen. Es geht darum, durch das Hören von gesprochener Sprache wichtige Informationen zu gewinnen. Durch die Kombination von Speech Analytics und Audio Mining entsteht ein neues Konzept: Speech Mining - das menschliche Interaktion und effiziente Prozessgestaltung miteinander verbindet.

Im Gegensatz zum klassischen Process Mining steht beim Speech Mining also das gesprochene Wort im Mittelpunkt. Speech Mining ist somit eine moderne Methode, die zur Darstellung der aktuellen Situation oder des aktuellen Zustands einer Sache oder eines Prozesses eingesetzt werden kann. Dabei wird die menschliche Interaktion in Echtzeit genutzt, um Prozesse zu beschreiben, neuen Content zu generieren und Erstmodellierungen zu erstellen. Der Ansatz basiert auf der Extraktion prozessrelevanter Informationen aus gesprochener Kommunikation.

Praxisnahes Speech Mining

Um die Theorie in die Praxis umzusetzen, bietet das folgende Beispiel einen anschaulichen Einblick in die Anwendung von Speech Mining:

  1. Speech-to-Text-Aufzeichnung: Nutze eine Speech-to-Text-Technologie, um deine gesprochenen Anweisungen während des Montageprozesses aufzuzeichnen.
  2. Transformation in eine Montageanleitung: Verwende einen geeigneten Prompt, um das gesprochene Wort in ChatGPT in eine Montageanleitung zu transformieren, die den Anforderungen deines Unternehmens entspricht.
  3. Tabellarische Struktur für die Darstellung: Wir können eine tabellarische Struktur mit den Spalten Nr., Beschreibung und Bild für die Montageanleitung empfehlen. Dadurch werden klare und leicht verständliche Schritte für die Montageprozesse festgehalten.
  4. Erstellung von Bildern vom Montageprozess: Mache Bilder vom Montageprozess, um visuelle Unterstützung für die Montageanleitung zu bieten.
  5. Automatische Zuordnung von Bildern zu Montageschritten: Nutze ChatGPT4, um die Bilder automatisch den entsprechenden Montageschritten zuzuordnen. Dadurch wird die Montageanleitung zu einer idealen Vorgabe und Arbeitshilfe, die den Montageprozess erleichtert.

Gleicher Anwendungsfall, anderes Setting: Warum nicht auch strukturierte Gespräche über einen Prozess mittels Speech-to-Text aufzeichnen? Dieser Ansatz ermöglicht die kollaborative Erstellung von Montageanleitungen, indem mehrere Personen verschiedene Schritte detailliert beschreiben. Im Gegensatz zu traditionellen Methoden, bei denen eine Person den gesamten Prozess beschreibt, können in diesem Setting verschiedene Teilnehmer unterschiedliche Teile des Prozesses beschreiben. Noch eine Entwicklungsstufe weiter: Stell dir vor, wie cool es wäre, wenn eine Gruppe von Leuten sich locker über einen Prozess unterhält, ohne sich an eine feste Struktur zu halten, und dann überlässt man ChatGPT die Aufgabe, aus all diesen Schritten eine schlüssige und sinnvolle Reihenfolge zu erstellen.

Das Unternehmen als lebendiger 'Digital-Twin'

Stell dir vor, du könntest durch Führungsimpulse iterativ eine dynamische Prozesslandschaft für dein Unternehmen gestalten, einschließlich Prozessmodellen, Arbeitsanweisungen und Zielen. Dieser sich entwickelnde "Digital Twin" basiert zunächst auf generischen Eingabedaten, wird jedoch im Verlauf durch kontinuierliche Anpassungen an aktuelle Führungsimpulse immer spezifischer. Bei diesem Ansatz liegt der Schwerpunkt auf der Reduzierung der generischen Managementdokumentation und der Schaffung einer flexiblen, auf Veränderungen reagierenden Struktur, die durch Führungsimpulse gesteuert wird. Du kannst auch Gespräche über Prozesse in deiner Organisation aufzeichnen und damit deinen Digital Twin auf dem neuesten Stand der Diskussionen und Entscheidungen halten. Es ist auch sinnvoll, das klassische Process Mining in den Digital Twin zu integrieren. Auf dieser Basis entsteht ein lebendiges System, denn es ist jederzeit möglich, Fragen an den Digital Twin zu stellen, wie zum Beispiel: "Kann ich den Bleistift selbst kaufen oder brauche ich dafür eine Freigabe?" und es wird immer die richtige Antwort geliefert. Im Hintergrund bleibt jedoch eine klar strukturierte, für den Menschen lesbare Prozesslandschaft bestehen.

Eine vielversprechende Zukunft

Obwohl das Thema noch in den Kinderschuhen steckt, zeigt sich bereits heute, dass es erfolgreich eingesetzt werden kann. Die Möglichkeiten sind vielfältig und die Dynamik, die Speech Mining in die Welt der Prozessmodellierung bringt, ist beeindruckend. Die Frage, wie sich dieses Feld weiterentwickeln wird, bleibt spannend. Eines ist jedoch sicher: Das große Potenzial von Speech Mining wird die Art und Weise, wie wir Prozesse verstehen, dokumentieren und kommunizieren, entscheidend prägen. Es bleibt abzuwarten, welche spannenden Entwicklungen die Zukunft in diesem Bereich bereithält.

No items found.

Ihre Frage an Carsten

Reach out to request a blog post, submit a guest post, or with any other inquiry you might have.

Modell Aachen Insights

Seit 2009 steht die Modell Aachen GmbH für Interaktive Managementsysteme auf Basis der Wiki-Technologie. Mit Software und Managementberatung begleiten wir unsere Kunden auf dem Weg zu prozessorientierter Unternehmensführung sowie leichtgewichtigem Wissensmanagement. Mit unserem Modell Aachen Insights Blog teilen wir unser Wissen rund um die Themen Interaktive Managementsysteme, Prozessmanagement und Qualitätsmanagement mit euch.

Modell Aachen kennenlernen
Desktop and Mobile illustration

Ähnliche Beiträge