Diese Seite wurde mit KI und maschinellem Lernen übersetzt.

(Pocket-lint) - Seit Google im vergangenen Jahr bei Google IO seine Google Duplex-Fähigkeit demonstriert hat, war die Reaktion in Bezug auf die Technologie und die Möglichkeiten innerhalb von Google Assistant überwältigend positiv.

  • Der Pixel 4-Assistent von Google wird auf dem Gerät schneller und leistungsfähiger sein

Google Duplex erklärt

Google Duplex ist im Wesentlichen ein Name für Technologien, die sich in Google Assistant befinden und im Wesentlichen für Sie arbeiten. Die ganze Idee ist, Ihnen Zeit zu sparen. Es kann Unternehmen anrufen, um Reservierungen vorzunehmen, Termine zu buchen, Öffnungszeiten zu erhalten und vieles mehr. Diese Anrufe werden mit einer menschlich klingenden Stimme getätigt, die Sie in den folgenden Videos hören können.

Es gibt keine Lernkurve und keinen zusätzlichen Schritt zum Einrichten von Duplex. Wenn diese Option aktiviert ist, können Sie den Google-Assistenten auf Ihrem Telefon fragen: "Hey Google, rufen Sie [Name des Restaurants] an und reservieren Sie am 22. Oktober um 19 Uhr vier Personen." Ab diesem Zeitpunkt tätigt Google Assistant den Anruf und Google Duplex spricht mit dem Anrufbeantworter im Restaurant. Und außerdem passiert alles im Hintergrund.

Duplex fügt Ihre Reservierungen und Termine auch Ihrem Kalender hinzu.

"Es war ein langjähriges Versprechen, Menschen zu erlauben, so natürlich wie möglich mit Technologie zu interagieren", sagte Yossi Matias, technischer Leiter von Google, zum Zeitpunkt der ursprünglichen Ankündigung von Duplex.

„Die Google Duplex-Technologie ist so konzipiert, dass sie natürlich klingt und das Gesprächserlebnis angenehm macht.

"Wir hoffen, dass diese technologischen Fortschritte letztendlich zu einer bedeutenden Verbesserung der Erfahrung der Menschen im täglichen Umgang mit Computern beitragen werden."

Wo Duplex bisher eingeführt hat

Die Einführung der Duplex-Technologie von Google ist nach wie vor auf die USA beschränkt. Obwohl Google versprochen hat, mit dieser Funktion einen "langsamen und gemessenen Ansatz" zu verfolgen, ist sie jetzt auch auf Geräten außer Google Pixel-Handys verfügbar .

Im März kündigte Google an, dass es nach einer ersten Beta-Phase, in der nur vier US-amerikanische Städte vertreten waren, auch in 44 Bundesstaaten verfügbar sein wird. Es gibt kein Wort darüber, wohin es als nächstes kommen wird, aber vermutlich hängt es von viel Lokalisierung ab, um es zum Beispiel nach Großbritannien zu bringen.

Duplex für das Web

Neu bei Google I / O 2019 angekündigt ist Duplex für das Web. Damit geht Duplex über das Sprechen hinaus und kann nun Informationen und Formulare auf mehreren Seiten für Sie ausfüllen. Wenn Sie online buchen, müssen Sie häufig auf mehreren Seiten navigieren, kneifen und zoomen, um alle Formulare auszufüllen.

Mit Duplex für das Web wird der Assistent im Wesentlichen in Ihrem Namen handeln, um die Dinge gemäß Ihren üblichen Vorlieben auszufüllen - Google hat gezeigt, wie Duplex ein Auto buchen kann - siehe das folgende Video. Sundar Pichai von Google: [Das Ausfüllen von Formularen ist] "zeitaufwändig. Wenn Sie Benutzer im Workflow verlieren, verlieren auch Unternehmen. Unser System kann dies besser."

Dies ist derzeit nur eine Vorschau, aber Sie werden voraussichtlich später im Jahr 2019 mehr darüber erfahren.

Sollte KI wirklich so tun, als wäre sie ein Mensch?

Abgesehen von dem Wunsch, eine bessere Erfahrung mit künstlicher Intelligenz (KI) zu schaffen, wirft Duplex einige Bedenken auf, dass erstens eine solche Funktion in Google Assistant uns ziemlich faul machen würde, und zweitens gab es erhebliche Bedenken hinsichtlich des Potenzials von Duplex, diese irrezuführen die in Ihrem Namen angerufen werden.

Es ist durchaus möglich, dass Duplex der angerufenen Person zugibt, dass es sich tatsächlich um einen Computer handelt, der sie anruft. Ist es wichtig, ob die Interaktion so natürlich ist wie mit einem Menschen?

Das ist offen für Debatten, obwohl aus der Demo hervorgeht, dass Google versucht hat, die Erfahrung so natürlich wie möglich zu gestalten, indem es in den Beispielaufrufen mit Füllsprachen wie "er" oder "um" etwas über Bord gegangen ist.

Solche Sprachstörungen werden von Menschen genutzt, um die Denkzeit einzubauen, und das ist auch hier der Fall; Verschleierung, dass das System auch noch denkt. Google fügt hinzu, dass wir zwar erwarten, dass einige Dinge sofort beantwortet werden - beispielsweise wenn wir zum ersten Mal bei einem Telefonanruf Hallo sagen - es jedoch natürlicher ist, an anderer Stelle Pausen einzulegen.

„Für uns ist es wichtig, dass Benutzer und Unternehmen gute Erfahrungen mit diesem Service machen“, fährt Matias fort. „Transparenz ist ein wesentlicher Bestandteil davon. Wir möchten die Absicht des Aufrufs klarstellen, damit Unternehmen den Kontext verstehen.

Hier ist die Google Duplex-Demo in Aktion während des Google I / O- Keynote-Vortrags im letzten Jahr:

Können wir AI noch vertrauen?

Ein weiteres Problem bei Duplex ist, dass unsere Erfahrungen mit virtuellen Assistenten und anderen Sprachsteuerungssystemen dazu geführt haben, dass wir ihnen misstrauen. Oder zumindest nicht ganz vertrauen.

Es besteht die offensichtliche Sorge, dass Sie möglicherweise nicht das gewünschte Ergebnis von einem virtuellen Assistenten erhalten, den Sie beauftragt haben, einen Tisch für Sie zu reservieren. Wäre es zur richtigen Zeit und sogar im richtigen Restaurant? Wenn das System feststellt, dass es nicht in der Lage war, das gewünschte Ergebnis zu erzielen, geht Google davon aus, dass es ehrlich ist, und weist Sie darauf hin.

Obwohl es keinen vernünftigen Grund gibt, warum diese Details falsch sein sollten, besteht die Versuchung als Mensch darin, dem Misstrauen zu misstrauen, dass ein virtueller Assistent in der Lage sein würde, alles richtig zu machen - wäre er wirklich in der Lage, die Nuancen der Sprache so genau zu interpretieren?

Google argumentierte auf der Bühne und erneut im unterstützenden Google Duplex-Blogbeitrag, dass die Idee hinter dem System darin besteht, sehr spezifische Aufgaben wie das Planen eines Haartermins oder das Buchen eines Tisches auszuführen. Wenn es nicht geschult ist, kann es nicht plötzlich Ihren Arzt anrufen und sich unterhalten.

Dieses Zeug ist eigentlich ziemlich kompliziert

Natürliche Sprache ist schwer zu verstehen, während die Gesprächsgeschwindigkeit eine ziemlich schnelle Cloud-Computing-Leistung erfordert. Menschen sind es gewohnt, komplexe Interaktionen mit anderen Menschen zu haben, die laut Matias „ausführlicher als nötig sein können oder Wörter weglassen und sich stattdessen auf den Kontext verlassen können. [Natürliche menschliche Gespräche] drücken auch eine breite Palette von Absichten aus, manchmal im selben Satz. “

Google sagt, dass andere Herausforderungen für die Technologie das Hintergrundgeräusch und die schlechte Anrufqualität sind, die ein Kennzeichen vieler Telefonanrufe sind, und dass Menschen dazu neigen, schneller zu sprechen, wenn sie mit einem anderen Menschen sprechen, als wenn sie dachten, sie würden Sprachbefehle erteilen ein Computer.

Natürlich ist auch der Kontext von entscheidender Bedeutung, und wir neigen dazu, kontextbezogene Verbindungen herzustellen, die Computer traditionell nicht herstellen. Während einer Restaurantbuchung kann der Mensch also eine Zahl sagen, die die Zeit oder die Anzahl der Personen bedeuten kann.

Google sagt, dass es diese Herausforderungen mit der Verwendung eines wiederkehrenden Nural-Netzwerks bekämpft, das für eine Reihe von Eingaben geeignet ist, die Sie während eines Telefongesprächs erhalten würden. Das System verwendet weiterhin die ASR-Technologie (Automatic Speech Recognition) von Google und legt die Nuancen dieser bestimmten Konversation fest. Was ist das Ziel des Gesprächs? Was wurde vorher gesagt?

Was sind die Vorteile von Duplex?

Laut Google bietet die Duplex-Technologie mehrere Vorteile (über die Unterstützung vielbeschäftigter Menschen hinaus). Erstens könnte dies Unternehmen zugute kommen, die keine Online-Buchungssysteme haben, da Benutzer weiterhin Termine online buchen können, und sie werden auch vom Assistenten an diesen Termin erinnert, was zu weniger versäumten Terminen führt.

Zweitens könnten bestimmte lokale Daten online genauer werden. Google führte das Beispiel der Öffnungszeiten des Geschäfts in der Google-Suche zu bestimmten Jahreszeiten an. Könnte es zum Beispiel einen örtlichen Laden anrufen und nach den Öffnungszeiten für Weihnachten fragen?

Laut Google führen aktuelle Sprachinteraktionen zwischen Mensch und Computer keinen Gesprächsfluss und zwingen den Anrufer, sich an das System anzupassen, anstatt dass sich das System an den Anrufer anpasst.

Und natürlich könnte es denjenigen helfen, die aufgrund einer Behinderung Schwierigkeiten haben, das Telefon zu benutzen.

Mochte dies? Schauen Sie sich Google Assistant Easter Eggs an: Ihre vollständige Anleitung zu lustigen Assistant-Befehlen

Schreiben von Dan Grabham und Maggie Tillman.