Per poter rispondere in modo immediato ed esaustivo ai comandi vocali, Alexa necessita di un aiuto umano. La conferma arriva da Bloomberg che ha effettuato una ricerca basata su sette diverse fonti, svelando l’esistenza di analisti dislocati in America, Romania, India e Costa Rica che ascoltano alcuni comandi e li “traducono” per Alexa in modo da affinarne la comprensione e quindi migliorarne le relative risposte.
Seppur non in modo esplicito, questa informazione viene riportata nei termini di utilizzo del dispositivo o si può intuire dalle risposte date alle domande più ricorrenti dove si indica che “più dati usiamo per allenare questi sistemi, meglio Alexa lavorerà e addestrarla con registrazioni vocali da diversi tipi di clienti aiuta Alexa a essere più efficiente con tutti”.
Attualmente il metodo più efficace per aiutare Alexa a comprendere i comandi forniti, passa per gli esseri umani che ascoltano le domande più articolate per analizzarle e rendere più semplice la formulazione della richiesta in modo che l’assistente virtuale possa soddisfare con sempre più rapidità e precisione le necessità degli utilizzatori. Questa prassi denominata “data annotation” non viene utilizzata solo per istruire Alexa e va ad alimentare le teorie complottistiche che vedono questi dispositivi estremamente invasivi e paragonati a delle vere e proprie spie che, silenti, attendono il momento per attivarsi e registrare l’intimità delle abitazioni, captando parole da poter poi utilizzare per veicolare pubblicità specifiche per il singolo utente.
È anche vero che al momento per questi dispositivi non vi sono valide alternative. Tecnologie più avanzate sono in grado di apprendere in maniera autonoma, ma nel caso degli assistenti occorre fornire dati chiari e puliti, educandoli a districarsi ad esempio fra accenti diversi o comandi poco chiari.
La mole di dati analizzati è importante, secondo l’indagine infatti ogni impiegato ascolterebbe fino a mille ore di registrazioni nelle nove ore di lavoro, modificando i comandi e comunicandoli al sistema in modo che possa registrarlo ed evitare, o comunque ridurre notevolmente, errori di traduzione. Questa attività di “supervised learning” è utilizzata anche dai concorrenti di Amazon, anche se va sottolineata una dichiarazione del direttore scientifico di Alexa, Ruhi Sarikaya, che specifica come “I nostri sistemi devono imparare a migliorare da soli”.
La preoccupazione legata a queste registrazioni riguarda sicuramente la privacy degli utenti visto il contenuto e la quantità dei dati analizzati da migliaia di addetti anche esterni da cui è possibile risalire all’utente specifico senza troppe difficoltà, considerando che le registrazioni presentano l’identificativo del dispositivo, il nome di battesimo dell’utilizzatore e un altro codice che fa riferimento presumibilmente al numero di account della piattaforma.
Per di più non è noto dove e per quanto tempo le registrazioni vengano conservate e se siano mai state trafugate. Inoltre, secondo il rapporto di Bloomberg, gli stralci ascoltati dagli impiegati non sono stati segnalati laddove Alexa fosse testimone di potenziali reati e ancor peggio alcune clip audio vengono girate nella chat interna per puro divertimento. Chat che dovrebbe essere utilizzata per confrontarsi tra colleghi quando emergono dubbi di traduzione.
Ciliegina sulla torta, Alexa non sempre si attiva esclusivamente quando riceve l’apposito comando, ogni impiegato infatti deve segnalare fino a cento eventi di falsa attivazione, vale a dire riportare registrazioni attuate dall’assistente senza che gli sia stato dato il comando corretto.
Si suppone che questa attività venga svolta per evitare che in futuro possa nuovamente presentarsi una situazione analoga.
Interpellato, il colosso dell’e-commerce ha risposto a Bloomberg di annotare “solo un piccolo campione di registrazioni vocali su Alexa con l’obiettivo di migliorare l’esperienza dell’utente. Per esempio, le informazioni ci aiutano ad addestrare i nostri sistemi di riconoscimento del discorso e del linguaggio naturale, di modo che Alexa possa comprendere meglio le richieste, e assicurarci che il servizio funzioni bene per tutti”. Aggiungendo di seguire per questa attività “stringenti linee guida tecniche e operative” e di avere “tolleranza zero per gli abusi”.
Ogni informazione sensibile viene “trattata in modo estremamente confidenziale”, non fornendo agli analisti l’identità dell’interlocutore di Alexa, in più i dati sarebbero protetti da “autenticazione a più fattori per restringerne l’accesso”, crittografati e controllati.
Come ha però spiegato un esperto dell’università del Michigan, Florian Schaub, “Non si pensa necessariamente a un altro essere umano all’ascolto di ciò che si dice al proprio speaker intelligente nell’intimità di casa propria, penso che siamo stati condizionati all’assunto che queste macchine facciano solo del magico machine learning. Ma i fatti dicono che ci sono ancora processi manuali da svolgere”.




Lascia un commento