Pick-by-Voice ist ein sprachbasiertes Kommissioniersystem. Eine beleglose Kommissionierung wird dadurch umgesetzt, dass dem Kommissionierer alle nötigen Daten über Sprachausgabe bereitgestellt werden und er mit dem System über Spracheingabe kommuniziert.

Funktionsweise

Ein System besteht aus einem Hostsystem, einer Anwendungssoftware zum Übersetzen der Pick-Daten in die menschliche Sprache, einem Spracherkennungssystem, einem Funknetzwerk und mobilen Endgeräten wie Tragegurt, Kontrolleinheit mit Funkmodul und Akku sowie dem Head-Set. Der Bediener erhält seine Arbeitsanweisungen akustisch von seinem transportablen Computer (Client) über ein Headset. Die Rückmeldung zum Host findet ebenso über Sprache statt, wobei die Daten per Funk übertragen werden. Um eine hohe Kommissionierqualität zu erreichen, werden Prüfziffern verwendet. Sobald der Kommissionierer den Lagerplatz erreicht, sagt er die letzten Ziffern der Lagerplatznummer oder des produktgebundenen Barcodes. Das System überprüft die Richtigkeit und gibt ihm sofort eine Rückmeldung.

  Schematische Darstellung eines Pick-by-Voice-System
Abbildung 1: Schematische Darstellung eines Pick-by-Voice-Systems (Grafik: Lehrstuhl fml)

Spracherkennung

Die Spracherkennung erfolgt am Client. Dabei gibt es ein sprecherabhängiges und ein sprecherunabhängiges System.

sprecherabhängig:

Das Teachen erfolgt durch das Vorlesen eines vorgegebenen Textes (einmalige Durchführung, Dauer: 15-30 Min). Für jeden Nutzer gibt es dementsprechend ein eigenes Profil.

sprecherunabhängig:

Es werden keine Profile eingesetzt. Der Nutzer macht sich das Vokabular des Systems zu Eigen. Es ist ein flexibler, sinnvoller Einsatz bei sich häufig ändernden Personal und Teilzeitbeschäftigung möglich.

Mischformen:

sprecherunabhängiger Basismodell wird durch Teaching des Sprechers angepasst.

Vokabular

Das System und der Kommissionierer tauschen nur wenige, kurze Befehle aus. Die Dialogtiefe hängt jedoch nicht nur vom Anwender, sondern auch von der Größe des Systemvokabulars ab. Der durchschnittliche Wortschatz beträgt 100 - 1000 Wörter.

Kosten

Die Preise für Sprachlösungen werden weiter fallen, da immer größere Stückzahlen bei der Hardware gefertigt werden bzw. die Preise bleiben bei steigender Funktionalität (Einsatz von Bluetooth, RFID) gleich. Die Kosten für die Grundausstattung z.B. für die Anbindung an das WMS, die Funkinfrastruktur, etc. betragen zwischen 10.000 und 20.000 Euro. Dazu muss mit einem Preis von ca. 5.000 Euro pro Kommissionierer gerechnet werden.

Vorteile

  • Sprache als natürliche Kommunikationsform
  • papierloses Kommissionieren
  • freie Hände beim Kommissionieren (kein Tastendruck, bessere Konzentration, Zeitgewinn)
  • freie Augen für simultane Tätigkeiten (bessere Konzentration, Schnelligkeit)
  • innovatives auf dem Markt erhältliches System
  • sinkendes Preisniveau in den nächsten Jahren
  • keine Installationen am Regal nötig
  • großer Anwendungsbereich
  • paralleler Ablauf von mehreren Tätigkeiten (z.B. Quittierung während des Gangs zum nächsten Fach)
  • Anpassungs- und Integrierbarkeit an nahezu jenes WMS
  • geringe Kommissionierfehlerrate (ca. 0,1% [1]) durch Wegfall der optischen Erfassung des Beleges
  • kurze Anlernzeiten für die Mitarbeiter

Nachteile

  • nur kleine zu übermittelbare Datenmenge
  • nur sequenzielle Befehlsausgabe und die damit verbundenen Wartezeiten
  • Beschränkung auf das Zusammenstellen von Aufträgen, keine Identifizierung von einzelnen Waren
  • kein Scannen von Barcodes möglich
  • zusätzliche Rechnerleistung zur Sprachverarbeitung
  • lange Dauer beim Teaching von sprecherabhängigen Systemen
  • erhöhter Schutz vor Umgebungseinflüssen notwendig
  • menschliche Belastung bei langen Arbeitszeiten
  • niedrige Mitarbeiterakzeptanz durch monotone Stimme
  • Anfangsschwierigkeiten bei Anwendern (gewöhnungsbedürftige künstliche Sprache, Erkennungsprobleme)
  • kaum Kommunikation der Mitarbeiter untereinander möglich
  • bei hohen Wegzeitanteil greift das Potenzial zur Reduzierung der Totzeiten nicht

Varianten

Unterdrückung von Störgeräuschen

Ein Problem von sprachbasierten Systemen in industriellen Umgebungen ist die Spracherkennung bei Störgeräuschen und Lärm. Zur Rauschunterdrückung gibt es zum einen Lösungen auf der Hardware-Ebene, z.B. am Mikrophon selbst oder Software zum Filtern der Dialoge (z.B. über ein zweites, in den Raum gerichtetes Mikrophon, das die Nebengeräusche registriert, die dann gefiltert werden).

Erhöhung der Informationsdichte

Um den Nachteil der geringen Informationsdichte zu beheben, kann ein Pick-by-Voice-System um eine Datenbrille ergänzt werden. Das Standardsystem wird mit monokularem Bildschirm direkt vor dem Auge unterstützt. Bisher flüchtige Informationen, die dem Benutzer durch eine synthetische Stimme angesagt werden, werden ihm nun dauerhaft vor Augen geführt. Ansagen wie Pickpositionen oder gültiger Wortschatz werden im Display angezeigt. Dadurch wird der Arbeitsfluss unterstützt und Effizienzsteigerungen erreicht.

Quelle

[1] Lolling, A.: Analyse der menschlichen Zuverlässigkeit bei Kommissioniertätigkeiten, Aachen: Shaker Verlag 2003.

  • Keine Stichwörter