Autori: Lamar Suliman Abd Aljaleel
Tvrtka/Institucija: Fakieh School, Ministry of Education of Makkah Saudi Arabia, Highly Innovative Unique Foundation (HiUF), Kingdom of Saudi Arabia
Država: Kraljevina Saudijska Arabija
Istraživanje se bavi problemom otkrivanja sličnih saudijskih Twitter računa koje kriminalci koriste za širenje štetnih ideologija, dok prikrivaju svoja prava uvjerenja. Postojeće metode, usredotočene na engleske tekstove i značajke koje ovise o sadržaju, neadekvatne su za arapski i ne uspijevaju uzeti u obzir varijabilnost u temama među računima istog autora. Ova studija predlaže inovativni model koji naglašava čimbenike neovisne o sadržaju, uključujući stilometrijske značajke za analizu stila pisanja, a ne sadržaja. Prednost ovog pristupa je njegova sposobnost otkrivanja sličnih računa u različitim temama, što ga čini prilagodljivijim arapskom jeziku i teže kriminalcima da izbjegnu otkrivanje jednostavnom promjenom sadržaja. Model procjenjuje nekoliko klasifikatora strojnog učenja (ML) kao što su Random Forest (RF) i XGBoost, kao i modele dubinskog učenja kao što su TabNet i CNN, koristeći skup podataka saudijskih Twitter računa uključenih u terorizam i rasizam. Rezultati pokazuju da ML modeli, posebice RF i XGBoost, nadmašuju modele dubokog učenja, uz uključivanje stilometrijskih značajki koje poboljšavaju točnost. Istraživanje doprinosi razvojem jedinstvenog skupa podataka, uvođenjem novih stilometrijskih značajki, usporedbom različitih modela i stvaranjem nadzorne ploče za analizu sličnih računa, nudeći učinkovitije rješenje za otkrivanje štetnih aktivnosti na arapskom Twitteru.