Page 103 - Rassegna 2022-3
P. 103
CONTRASTARE I FENOMENI DI ODIO ONLINE
Il primo che presentiamo nasce da un progetto denominato Preventing Hate
Against Refugees and Migrants (PHARM) , finanziato dall’Unione Europea nel 2020,
(22)
all’interno del programma Diritti, Uguaglianza e Cittadinanza, che si prefigge
come obiettivo principale quello di monitorare l’hate speech contro i rifugiati e i
migranti in Grecia, Italia e Spagna al fine di prevedere e combattere il crimine
d’odio e ridurre la sua presenza online.
Il progetto è fruibile per mezzo di una web app dotata di un’interfaccia
(23)
intuitiva per analizzare testi e individuare la presenza di messaggi d’odio. Il
(24)
tool impiega due principali approcci per l’identificazione di hate speech nei testi: il
primo è basato sul lessico (lexicon-based term detection), cioè su un dizionario con-
tenente frasi statiche, insieme a combinazioni dinamiche di termini (cioè, agget-
tivi con sostantivi), mentre il secondo si riferisce a una procedura di apprendi-
mento automatico basata su una rete neurale ricorrente (Recurrent Neural
Network, RNN) . Il tool è in grado di individuare hate speech in testi in lingua
(25)
greca, inglese, italiana e spagnola. Il secondo tool che presentiamo si concen-
(26)
tra sull’applicazione di tecniche di ML per classificare un testo in tre categorie
distinte: hate speech, “offensivo ma non hate speech” e “nessuno dei due”. Anche
questo strumento è disponibile per mezzo di una web app e permette agli utenti
di inserire un testo per ottenere una previsione sulla sua possibile categoria
d’appartenenza. Gli autori del tool hanno testato diversi modelli di ML e nello
specifico: Logistic Regression , Naive Bayes , Decision Trees (DTs) , Random
(28)
(27)
(29)
Forests e Support Vector Machine (SVMs) .
(30)
(31)
(22) https://pharmproject.usal.es/.
(23) L. VRYSIS et al., A Web Interface for Analyzing Hate Speech, doi: 10.3390/fi13030080.
(24) http://pharm-interface.usal.es/analyze.
(25) N. D. GITARI, Z. ZHANG, H. DAMIEN, J. LONG, A lexicon-based approach for hate speech detection,
Int. j. multimed. ubiquitous eng., vol. 10, no. 4, pagg. 215-230, Apr. 2015; F. E. AYO, O.
FOLORUNSO, F. T. IBHARALU, I. A. OSINUGA, Machine learning techniques for hate speech classifica-
tion of twitter data: State-of-the-art, future challenges and research directions, Comput. Sci. Rev., vol. 38,
no. 100311, pag. 100311, Nov. 2020; C. ARCILA CALDERÓN, D. BLANCO HERRERO, M. B.
VALDEZ APOLO, Rechazo y discurso de odio en Twitter: análisis de contenido de los tuits sobre migrantes
y refugiados en español/Rejection and Hate Speech in Twitter: Content Analysis of Tweets about Migrants
and Refugees in Spanish, Rev. Esp. Invest. Sociol., 2020, doi: 10.5477/cis/reis.172.21.
(26) https://hate-offens-lang-detector.herokuapp.com/.
(27) D. R. COX, The Regression Analysis of Binary Sequences, J. R. Stat. Soc. Series B Stat. Methodol., vol.
20, no. 2, pagg. 215-242, 1958.
(28) M. BAYES, M. PRICE, LII. An essay towards solving a problem in the doctrine of chances. By the late
Rev. Mr. Bayes, F. R. S. communicated by Mr. Price, in a letter to John Canton, A. M. F. R. S, Philos.
Trans. R. Soc. Lond., vol. 53, no. 0, pagg. 370-418, Dec. 1763.
(29) X. WU et al., Top 10 algorithms in data mining, Knowl. Inf. Syst., vol. 14, no. 1, pp. 1-37, Jan. 2008.
(30) T. K. HO, Random decision forests, presented at the 3 International Conference on Document Analysis
rd
and Recognition, Montreal, Que., Canada, 2002, doi: 10.1109/icdar.1995.598994.
(31) C. CORTES, V. VAPNIK, Support-vector networks, Mach. Learn., vol. 20, no. 3, pagg. 273-297, Sep. 1995.
101