Sprachassistenzsysteme sind Mist. Egal von welchem Hersteller. Ob man von ΑΜΑΖΟΝS Alexa redet, von Apple Siri oder vom Google Assistenten. Sie können alle nichts.
Wer nur einmal die Chatfunktion von ChatGPT ausprobiert hat, der weiß, wie ein solches System funktionieren sollte. Gerade Medienvertreter werden ja nicht müde, darauf hinzuweisen, dass KI fast nur Müll produziert. Dass das nicht stimmt, weiß jeder, der sich etwas näher mit der Materie beschäftigt hat. Das Problem sitzt hier einmal mehr vor der Tastatur.
Wer einen vernünftigen Befehlssatz (Prompt) eingibt, der bekommt auch vernünftige Ergebnisse. Die muss man überprüfen und verbessern. Wer nur oberflächlichen Mist eingibt und dabei auch noch insgeheim darauf hofft, dass ein schlechtes Ergebnis dabei herauskommt, der bekommt logischerweise auch nur Müll heraus.
Siri von Apple gibt es mittlerweile seit 2007. So seit ungefähr 10 Jahren soll Siri produktiv einsetzbar sein.
Wer sich innerhalb des Apple-Universums bewegt und mehrere Apple-Geräte sein Eigen nennt, der hat möglicherweise etwas mehr von diesem Spracherkennungs- und Antwortsystem. Tatsächlich zeigt sich aber in der täglichen Arbeit mit Siri, dass Siri gar nichts kann.
Es ist eine Schande, dass ein Weltkonzern wie Apple diese Chance so ungenutzt hat verstreichen lassen. Selbst bei kleinsten Aufgaben scheitert das System. Einfachste Fragen kann Siri nicht beantworten und gibt immer wieder zurück: „Ich kann Ihnen Informationen auf Ihrem iPhone liefern“.
Das bedeutet nichts anderes, als dass Siri die Frage schlichtweg einer Suchmaschine vorgelegt hat und Dir die Ergebnisse nicht vorlesen mag, sondern lieber einfach auf dem Handy anzeigen will.
Auch der Google-Sprachassistent ist kaum besser. Zwar beantwortet er einfache Fragen, wie etwa „wie groß ist Friedrich Merz?“ recht zuverlässig und kann auch Wikipedia-Suchen durchführen, doch scheitert der Assistent oft an der Spracherkennung.
In Verbindung mit Smarthome kommt es dann beispielsweise dazu, dass der Befehl „Okay Google, Deckenlampe einschalten“ hundertmal korrekt ausgeführt wird, beim nächsten Mal sagt Google dann „Sohrie Sör, it siehms tatt tiß Diweiß häs nott bin sätt app“. Und das sagt der Google-Sprachassistent exakt so, wie ich es hingeschrieben habe, so wie ein Drittklässler, der noch nie in seinem Leben Englisch gesprochen hat und nun einen englischen Satz vorlesen soll.
Und ich kann gar nicht sagen, wie häufig der Sprachassistent behauptet, er habe mich nicht verstanden. Nun stamme ich aus dem Ruhrgebiet, sprechen keinen Soziolekt oder Dialekt und darf von mir behaupten das zu sprechen, was hinlänglich als Hochdeutsch bezeichnet wird. Außerdem spreche ich recht deutlich.
Aber selbst, wenn ich nicht deutlich sprechen würde, und selbst, wenn ich einen leichten Akzent hätte, sollte mich der Sprachassistent, so das Versprechen aller Hersteller, im Laufe der Zeit immer besser verstehen, weil er meine Sprechgewohnheiten lernt und mich immer besser kennenlernt.
Vergiss es!
Selbst Befehle, die man Tag für Tag oder Stunde für Stunde in immer gleichem Wortlaut und gleicher Betonung aufsagen muss, erkennen die Systeme häufig nicht.
Nun ist mir vor Jahren mal ein Trick verraten worden, wie man Sprachcomputer bei Hotlines überlisten können soll. Und ich habe das auch schon ein paar Mal erfolgreich getestet. Man soll, nachdem sich der Sprachcomputer gemeldet hat, einfach singen. Irgendein Volkslied oder etwas Sinnloses, Hauptsache singen.
Das führe, so die Theorie, dazu, dass das System ‚denkt‘ es habe es mit einem Menschen mit sprachlichen Problemen zu tun. Daraufhin wird eine Abkürzung für Behinderte und Benachteiligte gewählt und man landet zuverlässiger und vor allem schneller bei einem hilfsbereiten Sachbearbeiter.
Ob das wirklich so ist, weiß ich nicht, halte es aber durchaus für plausibel und meine diesbezüglichen Versuche haben bei mir auch immer den Eindruck hinterlassen, es würde tatsächlich helfen.
So kam mir die Idee, das auch mal bei Siri und Google auszuprobieren. Und tatsächlich: Kölsch hilft, Bayerisch funktioniert und – auch wenn das Gutmenschen wieder aufregen wird – wenn man spricht, als habe man eine geistige Beeinträchtigung, geben die Systeme bessere und zuverlässigere Antworten.
Es scheint sich zu bestätigen, dass die Entwickler einiges daran gesetzt haben, damit auch Menschen mit Behinderung und Dialektsprecher erfolgreich mit den Systemen kommunizieren können.
Ich treibe das im Moment auf die Spitze. „O-ay Uugel, icht ein-alten“ funktioniert besser als „Okay Google, Licht einschalten“.
Ich habe auf meiner Modelleisenbahn das beleuchtete Modell des Eiffelturm stehen. Die dazugehörende smarte Steckdose heißt „Eiffelturm“, ergibt ja auch Sinn.
Sage ich „Okay Google, Eiffelturm einschalten“, antwortet Google: „Hier sind 20 Ergebnisse, die Dir zeigen, wie der beleuchtete Eiffelturm bei Nacht aussieht“.
Sage ich „Turm einschalten“, versteht mich Google nie. Ich kann das R in Turrrrrrrm noch so rollen oder betonen, Google versteht immer Ton, statt Turm und antwortet mit, Ton könne nicht eingeschaltet werden, weil ich keinen Song ausgewählt habe.
Sag ich aber „Tumtumtum anmachen“, ja, dann geht’s problemlos.
Ich probiere auch mein Talent zur Nachahmung diverser Dialekte wieder mal aus. Früher habe ich das viel besser gekonnt und so manche Gesellschaft mit meinen Imitationen unterhalten können. Das habe ich aber ein wenig verlernt und kriege das nicht mehr sehr überzeugend hin.
Aber wenn ich mit dem, was ich jetzt für Bayerisch halte, auf meine Sprachassistenten einrede, bekomme ich schon viel bessere Ergebnisse. Mache ich das aber auf Kölsch, dann habe ich eine Trefferquote von fast 100 %.
In einer abstrusen Folge von Wörtern, die ich so ähnlich wie Plattdeutsch empfinde, kann ich Google sehr zuverlässig dazu bewegen, mir die Nachrichten der ZEIT-Redaktion vorzuspielen „Snak mi mol de tijd“.
Ich nutze auch meine Hörgeräte zur freihändigen und drahtlosen Spracheingabe. Wenn Du mich im Auto also durch das geöffnete Seitenfenster mal „Arsch Arsch auf“ sagen hörst, dann möchte nur, dass das Garagentor aufgeht.
Bildquellen:
- siri-alexa: Peter Wilhelm KI
Hashtags:
Ich habe zur besseren Orientierung noch einmal die wichtigsten Schlagwörter (Hashtags) dieses Artikels zusammengestellt:
#alexa #Behinderte #Dialekt #fehler #Google+ #probleme #siri #sprachassistent #spracherkennung