Page 101 - Rassegna 2022-3
P. 101

CONTRASTARE I FENOMENI DI ODIO ONLINE




                    Numerosi ricercatori servendosi dell’IA, hanno deciso di affrontare il pro-
               blema cominciando con l’annotare i messaggi di hate speech prelevati da vari social
               network,  individuandone  le  caratteristiche  più  rappresentative  e  sviluppando
               sistemi automatici in grado di riconoscere la presenza di hate speech all’interno di
               un testo e di classificarla secondo delle categorie prestabilite.
                    Questi sistemi, però, soffrono di diverse debolezze e ciò è dovuto al fatto
               che il riconoscimento automatico di testi d’odio è un argomento che è stato
               trattato relativamente di recente: il contesto linguistico (italiano, inglese, ecc.),
               così come le interpretazioni fortemente soggettive dei testi o l’uso di termini
               d’odio non troppo specifici e diretti, attualmente hanno impedito di ottenere un
               sistema pienamente funzionante e ottimale.
                    L’approccio attualmente più utilizzato per lo sviluppo di sistemi automa-
               tici per l’analisi e l’identificazione di testi d’odio , consiste nello sviluppo di
                                                               (16)
               modelli di Machine Learning (ML)  per la loro classificazione. Il ML, o in italiano
                                              (17)
               “apprendimento  automatico”,  è  un’applicazione  dell’IA  capace  di  fornire  ai
               sistemi  la  capacità  non  soltanto  di  imparare  automaticamente  a  svolgere  un
               compito ma anche a migliorare dall’esperienza senza essere esplicitamente pro-
               grammato per farlo.
                    Utilizzando una semplice definizione il ML è la teoria secondo la quale “le
               macchine  dovrebbero  essere  in  grado  di  imparare  e  di  adattarsi  attraverso
               l’esperienza, per produrre decisioni e risultati affidabili e ripetibili”.
                    Uno dei problemi più annosi in sistemi di questo tipo è il reperimento
               di dati adeguati per addestrare il modello di ML. Questi dati vengono rag-
               gruppati in un insieme definito dataset prima di essere elaborati dai modelli di
               ML. In genere, i dati di addestramento  sono raccolti ed etichettati da anno-
                                                     (18)
               tatori umani, cosicché l’algoritmo di ML possa, una volta ricevuti i dati e le
               annotazioni come input, imparare a identificare e a riconoscere dati mai visti
               prima.
                    La procedura di raccolta e annotazione di dati, utilizzati per l’addestra-
               mento di modelli di ML per classificare automaticamente testi di hate speech è, ad
               oggi, una delle più grandi sfide in questo settore. In particolare, identificare e
               concordare se un testo contenga o meno hate speech è un aspetto parecchio pro-
               blematico poiché, come detto precedentemente, non esiste una sua definizione
               universale.

               (16)  P. FORTUNA, S. NUNES, A survey on automatic detection of  hate speech in text, ACM Comput. Surv.,
                    vol. 51, no. 4, pagg. 1-30, Jul. 2019.
               (17)  A. L. SAMUEL, Some studies in machine learning using the game of  checkers, IBM J. Res. Dev., vol. 3,
                    no. 3, pagg. 210-229, Jul. 1959.
               (18)  In inglese training.

                                                                                         99
   96   97   98   99   100   101   102   103   104   105   106