Gli scrapers potrebbero avere un accesso più semplice alle informazioni degli account di quanto si possa pensare.
Il mese scorso, una massiccia fuga di dati ha esposto più di 300 milioni di account diversi da piattaforme di social media. L’esfiltrazione includeva 192 milioni di record estratti da due diverse raccolte di Instagram, insieme a 42 milioni di record estratti da TikTok e altri 4 milioni di record estratti da YouTube.
I record comprendono nomi utente, foto del profilo, e-mail, numeri di telefono, età e sesso insieme a specifiche sui follower e altri dati per ciascun account. La fuga di notizie ha coinvolto una serie di tre condivisioni di dati aperti dell’azienda Social Data: poche ore dopo la notifica, le condivisioni sono state adeguatamente protette.
Ci sono molte cose interessanti in questa fuga di notizie: la sua fonte, come sono stati ottenuti i dati e cosa implica sull’uso dei social media .
Come proteggersi dalle violazioni dei dati
Social Data ha sede a Hong Kong ed è stata creata dopo la scomparsa di un’altra società chiamata Deep Social. Quest’ultima società sembra essere la fonte originale dei dati trapelati. Entrambe le società forniscono dati demografici e psicografici degli influencer dei social media ai principali marchi di consumo. Deep Social è stato chiuso nel 2018 dopo che Facebook, secondo quanto riferito, gli ha vietato di utilizzare le sue interfacce di dati di marketing e minacciato azioni legali. Social Data ha iniziato le sue operazioni nel 2019, da segnalare che ci sono molte altre agenzie di “influencer marketing” che vendono questo tipo di dati.
Come tutti ben sappiamo, gli utenti non pagano le piattaforme dei social media che guadagnano vendendo pubblicità. Per essere efficaci, le piattaforme devono tracciare chi accede a determinati contenuti e tutte le piattaforme dispongono di varie interfacce per consentire agli inserzionisti di indirizzare la visualizzazione e l’invio degli annunci in base a questa attività.
Ma queste interfacce possono anche essere utilizzate in modo improprio, e questo era il problema sorto con Deep Social. Ci sono due modi in cui queste agenzie possono operare: uno è giocare secondo le regole e ottenere i dati dell’utente nel modo in cui Facebook e altri lo hanno previsto. L’altro è estrarre i dati direttamente dalla pagina web di ogni account e sperare che le società di social media non li rilevino.
Il web scraping è in gioco praticamente da quando il web è stato inventato già dai primi anni ’90. Quello che è successo è che gli strumenti di scraping automatizzati sono migliorati per evitarne il rilevamento.
Tuttavia, i robot non sono perfetti e le persone vengono scoperte. L’esempio più evidente è Clearview.ai, che ha estratto le immagini degli utenti e poi ha commercializzato in massa la sua tecnologia di riconoscimento facciale. Un altro caso è avvenuto nel 2014 con LinkedIn, dove qualcuno ha estratto migliaia di profili personali e poi li ha utilizzati in un sito creato per i propri scopi di reclutamento.
Cosa si può fare per ridurre il rischio di appropriazione dei propri dati
Ci sono modi per difendersi dagli scraper, a seconda che si tratti di contenuti aziendali o personali che si sta cercando di proteggere. Esistono vari strumenti che possono aiutare le aziende a rilevare quando i loro contenuti web sono stati estratti e riutilizzati altrove, inclusi Cloudflare e Imperva. Ma questi ultimi due sono oltre la portata degli utenti privati e ciò significa che occorre essere più vigili su cosa e su come si pubblicano le foto, i video e anche i pensieri personali online. Si dovrebbe riflettere sui seguenti punti:
È abilitato il tag della posizione sulle foto e video? Su un telefono Android, si dovrebbero anche rivedere alcuni consigli sulla privacy correlati già pubblicati su questo blog.
Gli account social consentono a chiunque di visualizzare l’indirizzo email, il numero di telefono e la data di nascita? È probabile che queste informazioni siano state incluse nel momento della registrazione su Facebook o sugli altri social network e probabilmente da allora i controlli sui dati privati non sono stati più revisionati. E’ opportuno esaminare queste impostazioni su ciascuna piattaforma social utilizzata.




Lascia un commento