Denna sida har översatts med AI och maskininlärning.

(Pocket-lint) - Sedan Google visade sin Google Duplex-kapacitet på Google IO förra året har reaktionen varit överväldigande positiv när det gäller tekniken och möjligheterna för det inom Google Assistant.

  • Googles Pixel 4 Assistant kommer att vara på enheten, snabbare och mycket kraftfullare

Google Duplex förklarade

Google Duplex är i huvudsak ett namn för tekniker som kommer att sitta inne i Google Assistant och i huvudsak göra saker för dina räkning. Hela idén är att spara tid. Det kan ringa företag för dig att boka, boka möten, få öppettider och mer. Det kommer att ringa dessa samtal med en mänsklig ljud som du kan höra i videorna nedan.

Det finns ingen inlärningskurva och inget extra steg för att ställa in Duplex. Om det är aktiverat kan du be Google Assistant på din telefon något som "Hej Google, ring [namnet på restaurangen] och boka en bokning för fyra personer den 22 oktober kl. 19." Från den tiden ringer Google Assistant samtalet och Google Duplex pratar med den som svarar i restaurangen. Och vad mer, allt händer i bakgrunden.

Duplex lägger också till dina bokningar och möten i din kalender.

"Att låta människor interagera med teknik lika naturligt som de interagerar med varandra har varit ett långvarigt löfte", säger Googles tekniska chef Yossi Matias vid det första tillkännagivandet av Duplex.

”Google Duplex-tekniken är byggd för att låta naturlig, för att göra konversationsupplevelsen bekväm.

"Vi hoppas att dessa tekniska framsteg i slutändan kommer att bidra till en meningsfull förbättring av människors upplevelse i den dagliga interaktionen med datorer."

Där Duplex har rullat ut hittills

Utbyggnaden av Googles Duplex-teknik är fortfarande begränsad till USA och även om Google lovade att ta ett "långsamt och uppmätt tillvägagångssätt" med funktionen, är det nu tillgängligt på enheter förutom Google Pixel-telefoner .

I mars meddelade Google att det också skulle finnas tillgängligt i 44 stater efter en första beta-period som endast hade inkluderat fyra amerikanska städer. Det finns inget ord om var det kommer att rulla ut till nästa, men förmodligen är det beroende av mycket lokalisering för att ta det till exempel till Storbritannien.

Duplex för webben

Nyligen meddelat på Google I / O 2019 är Duplex för webben. Med detta går Duplex utöver tal och kan nu fylla i information och formulär åt dig på flera sidor. Ofta när du bokar saker online måste du navigera på ett antal sidor, klämma och zooma för att fylla i alla formulär.

Med Duplex för webben kommer assistenten i huvudsak att agera för dina räken för att fylla i saker enligt dina vanliga preferenser - Google visade hur Duplex kan boka en bil - se videon nedan. Googles Sundar Pichai: [Att fylla i formulär är] "tidskrävande och om du tappar användare i arbetsflödet tappar företag också. Vårt system kan göra det bättre".

Detta är bara en förhandsvisning för närvarande men förväntar dig att höra mer om det senare under 2019.

Ska AI verkligen låtsas vara mänsklig?

Utöver önskan att skapa en bättre upplevelse med artificiell intelligens (AI), väcker Duplex vissa farhågor om att för det första skulle en sådan förmåga inom Google Assistant göra oss ganska lat och för det andra fanns det en betydande oro för Duplex potential att vilseleda dem som kallas på dina vägnar.

Det är fullt möjligt att Duplex kan erkänna att personen som kallas att det faktiskt är en dator som ringer till dem. Spelar det någon roll om interaktionen är lika naturlig som med en människa?

Det är öppet för debatt men det stod klart från demonstrationen att Google har försökt göra upplevelsen så naturlig som möjligt och gå lite överbord med fyllningsspråk som "er" eller "um" i provsamtalet.

Sådana talstörningar används av människor för att bygga upp tänkandetiden och så är det också här; förklädnad att systemet fortfarande tänker också. Google tillägger att även om vi förväntar oss att vissa saker ska besvaras omedelbart - till exempel när vi först säger hej i ett telefonsamtal - är det faktiskt mer naturligt att ha pauser någon annanstans.

"Det är viktigt för oss att användare och företag har en bra upplevelse med den här tjänsten", fortsätter Matias. ”Öppenhet är en viktig del av det. Vi vill vara tydliga med syftet med samtalet så att företag förstår sammanhanget.

Här är Google Duplex-demo i aktion under förra årets Google I / O- huvudtala:

Kan vi lita på AI ännu?

Ett annat problem med Duplex är att våra erfarenheter av virtuella assistenter och andra röststyrningssystem har fått oss att misstro dem. Eller åtminstone inte lita på dem helt.

Det finns en uppenbar oro för att du kanske inte får det resultat du ville ha från en virtuell assistent som du hade till uppgift att boka ett bord åt dig. Skulle det vara vid rätt tidpunkt och till och med i rätt restaurang? Där systemet upptäcker att det inte har lyckats uppnå önskat resultat är Googles idé att det kommer att vara ärligt och flagga detta till dig.

Det finns ingen rationell anledning till att dessa detaljer ska vara felaktiga, men frestelsen som människa är att misstro att en virtuell assistent skulle kunna få allt rätt - skulle det verkligen kunna tolka språkets nyanser så exakt?

Google argumenterade på scenen och igen i det stödjande Google Duplex-blogginlägget att tanken bakom systemet är att utföra mycket specifika uppgifter som att schemalägga ett hårmöte eller boka bord. Om det inte tränas kan det inte plötsligt ringa din läkare och börja prata.

Det här är faktiskt ganska komplicerat

Naturligt språk är svårt att förstå, medan konversationshastigheten kräver en ganska snabb molnberäkningskraft. Människor är vana vid att ha komplexa interaktioner med andra människor som, säger Matias, kan vara "mer detaljerade än nödvändigt, eller utelämna ord och förlita sig på kontext istället. [Naturliga mänskliga konversationer] uttrycker också ett brett spektrum av avsikter, ibland i samma mening. ”

Google säger att andra utmaningar för tekniken är bakgrundsljud och dålig samtalskvalitet som är ett kännetecken för många telefonsamtal plus att människor tenderar att prata snabbare om de pratar med en annan människa än de skulle om de trodde att de gav röstkommandon till en dator.

Kontext är naturligtvis också viktigt och vi brukar göra kontextuella anslutningar som datorer traditionellt inte gör. Så under en restaurangbokning kan människan säga ett nummer som kan betyda tiden eller det kan betyda antalet personer.

Google säger att det bekämpar dessa utmaningar med användningen av ett återkommande naturligt nätverk som är en idé för en serie ingångar som du skulle få under ett telefonsamtal. Systemet använder fortfarande Googles egen Automatic Speech Recognition (ASR) -teknologi och lägger till nyanserna i just den konversationen. vad är syftet med konversationen? Vad har sagts tidigare?

Vilka är fördelarna med Duplex?

Det finns flera fördelar med Duplex-tekniken, menar Google (utöver att hjälpa upptagna människor). För det första kan det gynna företag som inte har onlinebokningssystem eftersom användare fortfarande kan boka möten online och de kommer också att få påminnelser om det mötet från assistenten, vilket leder till färre missade möten.

För det andra kan det göra specifika lokala data online mer exakta. Google citerade exemplet med butikens öppettider i Google-sökning vid speciella tider på året. Kan det ringa upp en lokal butik och fråga till exempel om julens öppettider?

Bästa Android-appar 2021: Den ultimata guiden

Google säger att nuvarande röstinteraktioner mellan människa och dator inte deltar i ett konversationsflöde och tvingar den som ringer att anpassa sig till systemet istället för att systemet anpassar sig till den som ringer.

Och det kan naturligtvis hjälpa dem som har svårt att använda telefonen på grund av funktionshinder.

Gillade detta? Kolla in Google Assistant Easter Eggs: Din kompletta guide till roliga assistentkommandon

Skriva av Dan Grabham och Maggie Tillman.