• Home
  • Chi siamo
  • Il nostro sito web
Future Time Security blog
Menu
  • Home
  • Chi siamo
  • Il nostro sito web
Home  /  Comunicazioni  /  Supervised learning: Chi si cela dietro Alexa?

Supervised learning: Chi si cela dietro Alexa?

Per poter rispondere in modo immediato ed esaustivo ai comandi vocali, Alexa necessita di un aiuto umano. La conferma arriva da Bloomberg che ha effettuato una ricerca basata su sette diverse fonti, svelando l’esistenza di analisti dislocati in America, Romania, India e Costa Rica che ascoltano alcuni comandi e li “traducono” per Alexa in modo da affinarne la comprensione e quindi migliorarne le relative risposte.

Seppur non in modo esplicito, questa informazione viene riportata nei termini di utilizzo del dispositivo o si può intuire dalle risposte date alle domande più ricorrenti dove si indica che “più dati usiamo per allenare questi sistemi, meglio Alexa lavorerà e addestrarla con registrazioni vocali da diversi tipi di clienti aiuta Alexa a essere più efficiente con tutti”.

Attualmente il metodo più efficace per aiutare Alexa a comprendere i comandi forniti, passa per gli esseri umani che ascoltano le domande più articolate per analizzarle e rendere più semplice la formulazione della richiesta in modo che l’assistente virtuale possa soddisfare con sempre più rapidità e precisione le necessità degli utilizzatori. Questa prassi denominata “data annotation” non viene utilizzata solo per istruire Alexa e va ad alimentare le teorie complottistiche che vedono questi dispositivi estremamente invasivi e paragonati a delle vere e proprie spie che, silenti, attendono il momento per attivarsi e registrare l’intimità delle abitazioni, captando parole da poter poi utilizzare per veicolare pubblicità specifiche per il singolo utente.

È anche vero che al momento per questi dispositivi non vi sono valide alternative. Tecnologie più avanzate sono in grado di apprendere in maniera autonoma, ma nel caso degli assistenti occorre fornire dati chiari e puliti, educandoli a districarsi ad esempio fra accenti diversi o comandi poco chiari.

La mole di dati analizzati è importante, secondo l’indagine infatti ogni impiegato ascolterebbe fino a mille ore di registrazioni nelle nove ore di lavoro, modificando i comandi e comunicandoli al sistema in modo che possa registrarlo ed evitare, o comunque ridurre notevolmente, errori di traduzione. Questa attività di “supervised learning” è utilizzata anche dai concorrenti di Amazon, anche se va sottolineata una dichiarazione del direttore scientifico di Alexa, Ruhi Sarikaya, che specifica come “I nostri sistemi devono imparare a migliorare da soli”.

La preoccupazione legata a queste registrazioni riguarda sicuramente la privacy degli utenti visto il contenuto e la quantità dei dati analizzati da migliaia di addetti anche esterni da cui è possibile risalire all’utente specifico senza troppe difficoltà, considerando che le registrazioni presentano l’identificativo del dispositivo, il nome di battesimo dell’utilizzatore e un altro codice che fa riferimento presumibilmente al numero di account della piattaforma.

Per di più non è noto dove e per quanto tempo le registrazioni vengano conservate e se siano mai state trafugate. Inoltre, secondo il rapporto di Bloomberg, gli stralci ascoltati dagli impiegati non sono stati segnalati laddove Alexa fosse testimone di potenziali reati e ancor peggio alcune clip audio vengono girate nella chat interna per puro divertimento. Chat che dovrebbe essere utilizzata per confrontarsi tra colleghi quando emergono dubbi di traduzione.

Ciliegina sulla torta, Alexa non sempre si attiva esclusivamente quando riceve l’apposito comando, ogni impiegato infatti deve segnalare fino a cento eventi di falsa attivazione, vale a dire riportare registrazioni attuate dall’assistente senza che gli sia stato dato il comando corretto.

Si suppone che questa attività venga svolta per evitare che in futuro possa nuovamente presentarsi una situazione analoga.

Interpellato, il colosso dell’e-commerce ha risposto a Bloomberg di annotare “solo un piccolo campione di registrazioni vocali su Alexa con l’obiettivo di migliorare l’esperienza dell’utente. Per esempio, le informazioni ci aiutano ad addestrare i nostri sistemi di riconoscimento del discorso e del linguaggio naturale, di modo che Alexa possa comprendere meglio le richieste, e assicurarci che il servizio funzioni bene per tutti”. Aggiungendo di seguire per questa attività “stringenti linee guida tecniche e operative” e di avere “tolleranza zero per gli abusi”.

Ogni informazione sensibile viene “trattata in modo estremamente confidenziale”, non fornendo agli analisti l’identità dell’interlocutore di Alexa, in più i dati sarebbero protetti da “autenticazione a più fattori per restringerne l’accesso”, crittografati e controllati.

Come ha però spiegato un esperto dell’università del Michigan, Florian Schaub, “Non si pensa necessariamente a un altro essere umano all’ascolto di ciò che si dice al proprio speaker intelligente nell’intimità di casa propria, penso che siamo stati condizionati all’assunto che queste macchine facciano solo del magico machine learning. Ma i fatti dicono che ci sono ancora processi manuali da svolgere”.

Condividi su
Condividi su Facebook
Condividi su Twitter
 Articolo precedente Truffe online: posto sotto sequestro popolare sito di e-commerce italiano
Articolo successivo   Un bug nel client Origin di EA ha esposto i giocatori a possibili attacchi

Articoli Simili

  • Riprendere la propria privacy da Instagram

    Dicembre 21, 2020
  • Odix: Il punto sulle Smart City

    Dicembre 17, 2020
  • 6 semplici passaggi per proteggere la tua privacy da Twitter

    Dicembre 11, 2020

Lascia un commento Annulla risposta

Cerca

Social Media

  • Connect on LinkedIn

Articoli Recenti

  • True CDR: la prossima generazione di strumenti per la prevenzione dei malware Dicembre 30, 2020
  • Tecnologia Odix Dicembre 28, 2020
  • Le estensioni di terze parti per Facebook, Instagram e altri hanno infettato milioni di profili Dicembre 23, 2020
  • Il tuo software sandbox è stato violato? Dicembre 22, 2020

Commenti recenti

  • Avast: fake Malwarebytes utilizzato per distribuire CoinMiner - LineaEDP su Falsi file di installazione di Malwarebytes che distribuiscono coinminer
  • Avast: fake Malwarebytes utilizzato per distribuire CoinMiner su Falsi file di installazione di Malwarebytes che distribuiscono coinminer
  • Scoperte su Google Play Store 47 app malevole scaricate 15 milioni di volte – Secondamano l'originale su Avast scopre 47 app malevole su Google Play Store, scaricate 15 milioni di volte
  • Lara su Quando l’amore diventa un incubo: le truffe su siti di dating online
  • Cyber warfare: tecniche, obiettivi e strategie dietro gli attacchi “state-sponsored” | Agenda Digitale su BackSwap l’innovativo Trojan bancario che introduce nuove tecniche per svuotare i conti delle vittime

Archivi

Categorie

  • Comunicazioni
  • Malware
  • Senza categoria
  • Sicurezza
  • Sicurezza Informatica
  • Suggerimenti tecnici
  • True CDR: la prossima generazione di strumenti per la prevenzione dei malware

  • Tecnologia Odix

  • Le estensioni di terze parti per Facebook, Instagram e altri hanno infettato milioni di profili

  • Il tuo software sandbox è stato violato?

  • Riprendere la propria privacy da Instagram

© 2001 - 2020 - Tutti i diritti riservati. I marchi usati nel sito sono registrati da Future Time S.r.l. Tutti gli altri nomi e marchi sono registrati dalle rispettive aziende. Future Time S.r.l. © 2001-2020. P.IVA 06677001007
Questo sito usa i cookie, anche di terze parti, per offrirti una navigazione in linea con le tue preferenze. Per maggiori informazioni puoi accedere alla nostra cookie policy, dove potrai negare il consenso ai cookie, seguendo l'apposito link. Se continui la navigazione sul sito acconsenti all'uso dei cookie.
Ok, accetto Cookie policy
Privacy & Cookies Policy

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessario
Sempre attivato

Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.

Non necessario

Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.