Page 101 - Rassegna 2022-3
P. 101
CONTRASTARE I FENOMENI DI ODIO ONLINE
Numerosi ricercatori servendosi dell’IA, hanno deciso di affrontare il pro-
blema cominciando con l’annotare i messaggi di hate speech prelevati da vari social
network, individuandone le caratteristiche più rappresentative e sviluppando
sistemi automatici in grado di riconoscere la presenza di hate speech all’interno di
un testo e di classificarla secondo delle categorie prestabilite.
Questi sistemi, però, soffrono di diverse debolezze e ciò è dovuto al fatto
che il riconoscimento automatico di testi d’odio è un argomento che è stato
trattato relativamente di recente: il contesto linguistico (italiano, inglese, ecc.),
così come le interpretazioni fortemente soggettive dei testi o l’uso di termini
d’odio non troppo specifici e diretti, attualmente hanno impedito di ottenere un
sistema pienamente funzionante e ottimale.
L’approccio attualmente più utilizzato per lo sviluppo di sistemi automa-
tici per l’analisi e l’identificazione di testi d’odio , consiste nello sviluppo di
(16)
modelli di Machine Learning (ML) per la loro classificazione. Il ML, o in italiano
(17)
“apprendimento automatico”, è un’applicazione dell’IA capace di fornire ai
sistemi la capacità non soltanto di imparare automaticamente a svolgere un
compito ma anche a migliorare dall’esperienza senza essere esplicitamente pro-
grammato per farlo.
Utilizzando una semplice definizione il ML è la teoria secondo la quale “le
macchine dovrebbero essere in grado di imparare e di adattarsi attraverso
l’esperienza, per produrre decisioni e risultati affidabili e ripetibili”.
Uno dei problemi più annosi in sistemi di questo tipo è il reperimento
di dati adeguati per addestrare il modello di ML. Questi dati vengono rag-
gruppati in un insieme definito dataset prima di essere elaborati dai modelli di
ML. In genere, i dati di addestramento sono raccolti ed etichettati da anno-
(18)
tatori umani, cosicché l’algoritmo di ML possa, una volta ricevuti i dati e le
annotazioni come input, imparare a identificare e a riconoscere dati mai visti
prima.
La procedura di raccolta e annotazione di dati, utilizzati per l’addestra-
mento di modelli di ML per classificare automaticamente testi di hate speech è, ad
oggi, una delle più grandi sfide in questo settore. In particolare, identificare e
concordare se un testo contenga o meno hate speech è un aspetto parecchio pro-
blematico poiché, come detto precedentemente, non esiste una sua definizione
universale.
(16) P. FORTUNA, S. NUNES, A survey on automatic detection of hate speech in text, ACM Comput. Surv.,
vol. 51, no. 4, pagg. 1-30, Jul. 2019.
(17) A. L. SAMUEL, Some studies in machine learning using the game of checkers, IBM J. Res. Dev., vol. 3,
no. 3, pagg. 210-229, Jul. 1959.
(18) In inglese training.
99