Categorie
Intelligence AI Cyberspazio Security

È possibile pensare una tecnica SOCMINT anti-bullismo?

Introduzione: la presente tecnica è stata pensata per l’individuazione del bullismo ma ritengo che sia espandibile anche ad altri tipi di reati; è possibile che funzioni meglio in aree fortemente popolate e, in ogni caso, in aree a forte penetrazione di Twitter in quanto, come si vedrà nel prosieguo per pezzo i dati verranno acquisiti proprio da Twitter.

Spunto Iniziale

Sono necessari tre step più un quarto eventuale; lo spunto mi è venuto dalla lettura del titolo e della parte iniziale di questo articolo: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0157734

Primo Step

Il primo step consiste nell’esecuzione di query alle API di Twitter al fine di estrarre i tweet necessari alla successiva analisi; bisogna prestare particolare cura alla costruzione delle query e bisogna fare in modo di includere tutti i tweet potenziali che potrebbero parlare di un dato reato. Come costruire la query? Servirebbe supporto specialistico. Idealmente immagino un lavoro congiunto di un criminologo e di un data scientist.

Secondo Step

Adesso ci troviamo con una grande quantità di tweet da cui dobbiamo estrarre quelli rilevanti all’analisi in corso; per fare questo occorre costruire una metrica in grado di rispondere alla domanda se un dato tweet parla di un dato reato. Io sto ipotizzando qui l’utilizzo di OpenAI per via dell’utilizzo in linguaggio naturale. È eventualmente possibile integrare il risultato delle query a GPT con quello di una analisi più “classica” di tipo statistico (machine learning). È importante ricordare che la metrica potrebbe essere costruita tenendo anche conto di: like, retweet, etc. Una possibilità per mixare il responso di GPT con quello di un’analisi di machine learning potrebbe essere quello di porre una serie di domande a GPT per ottenere una risposta Positive, Neutral o Negative da poi convertire in +1, 0, -1 e poi da usare nella metrica.

Terzo Step

A questo punto abbiamo un elenco di tweet: è già possibile un primo screening manuale ma possiamo proseguire nell’analisi. L’analisi prosegue con l’estrazione del “sentiment” dai tweet risultanti dal secondo step per andare ad individuare sentiment opposti a quelli attesi. La “logica” di fondo che guida la presente ipotesi è che se ci si dovesse aspettare una riprova sociale riguardo ad un dato tweet proveniente dal secondo step e questa non venisse individuata (in certi ambiti) potrebbe essere opportuna una analisi manuale dei post estratti. Purtroppo non ho la più pallida idea di come si possa costruire una metrica utile a misurare la riprova sociale.

Quarto Step

Avremo anche dati geografici che si potrebbero usare per la visualizzazione su layer GIS per meglio dettagliare il problema (se, ad es. vengono individuati tweet vicino ad una scuola, questi potrebbero essere degni di una analisi manuale).

Possibili Espansioni

  • È possibile utilizzare le API di Google per il riconoscimento delle immagini per integrare l’analisi automatizzata dei tweet che includono immagini?
  • Studio di psyops/fake-news? (andrebbe completamente risistemato)
  • Altri reati come quelli legati all’estremismo?

Conclusione

Sarebbe auspicabile, vista la congiuntura derivante dal fatto che Elon Musk possieda sia Twitter che OpenAI, una più stretta integrazione tra le piattaforme che potrebbe portare a fornire anche servizi di questo tipo.

Di Flavio Albano

Da sempre appassionato di tecnologia non ho mai smesso di credere nell'open-source e nella condivisione della conoscenza. Laureato in ingegneria civile per un errore di gioventù ed utilizzatore di Linux dal 1998 (la prima distribuzione era una Slackware... e la prima non si scorda mai ;) )

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.