Hoe herken je een echte dreigtweet?

24 apr 2013

Dreigberichten. Daar hoorden we de afgelopen dagen genoeg over in het nieuws. Denk aan Leiden, John Ewbank en de Czech Republic. Promovendus Florian Kunneman zit in een onderzoeksgroep die onderzoek doet naar onder andere dreigtweets. Waar herken je zo’n tweet eigenlijk aan? 20130424 Twitter Een jongen uit Leiden schreef op een forum dat hij zijn docent Nederlands wilde neerschieten, John Ewbank werd een milde steniging en brandstapel toegewenst na het uitbrengen van zijn Koningslied en de Czech Republic kreeg haattweets na de aanslag in Boston door de verwarring met de republiek Chechnya in Rusland. Met behulp van een zoeksysteem kunnen mogelijke dreigtweets worden gefilterd. Promovendus Florian Kunneman legt uit: ‘We kijken bijvoorbeeld naar series woorden die vaak voorkomen en letten ook op woorden die ver uit elkaar staan maar bij elkaar horen, zoals ‘afmaken’. Het grappige is dat zo’n systeem een tweet met ‘huiswerk afmaken’ ook zou detecteren als dreigtweet.’ Wat vaak voorkomt in dreigtweets: Surinaamse woorden, zoals djoeken (steken). Om tweets met een bedreiging te herkennen is een background corpus met alledaagse tweets nodig ter vergelijk. De vraag is of een systeem de dreigtweet voor Ewbank ook zou herkennen als dreigend. Kunneman denkt van wel door de woorden ‘stenigen’ en ‘brandstapel’. Maar bij nadere bestudering kom je er dan achter dat het geen serieuze doodsbedreiging is. Machine learning Een zoeksysteem selecteert dus wel dreigtweets, maar nadere, menselijke bestudering is nodig om te kijken of het daadwerkelijk gaat om een dreigende tweet. Daar leert het systeem weer van, ook wel machine learning genoemd. Daarnaast is ook handmatig onderzoek gedaan naar dreigtweets. Kunneman: ‘Bij een groot aantal tweets werd gekeken of het wel of geen serieuze dreigtweet was door te kijken naar patronen.’ Naast dreigtweets deed de onderzoeksgroep ook onderzoek naar andere soorten tweets, zoals sarcastische tweets. ‘Dit hebben we uit pure interesse gedaan’, legt Kunneman uit. ‘Omdat sarcastische tweets vaak verkeerd begrepen worden zetten Twitteraars er vaak #sarcasme bij. In sarcastische tweets staan vaak overdreven positieve woorden of #not. Daar kun je ze aan herkennen.’ Een voorbeeld: ‘Dat is gezellig! # not’. In november sprak Vox Antal van den Bosch over een systeem dat in de maak is om trends te spotten. Kunneman doet hier onderzoek naar. Hij is bezig met een website waarop per maand een overzicht wordt gegeven van de events in Nederland. ‘Dit wil ik dan koppelen aan Twitter. Als daar veel over iets gesproken wordt, bijvoorbeeld over project X, dan komt dit op de kalender te staan.’ Kunneman wil ook de koppeling maken met een tijdsbestek. ‘Mensen praten anders over een event als het pas over een week is dan wanneer het morgen al is. Bijvoorbeeld bij een voetbalwedstrijd. Een aantal dagen van tevoren twitteren voetbalfanaten over de prognose van de wedstrijd. Vlak voor de wedstrijd zeggen ze vaker dingen als ‘Straks heerlijk voetbal kijken!’ of ‘Vandaag de dag dat Ajax een dubbel maakt tegen PSV’. / Soesja Verheijden

0 reacties

  1. Harry Styles nog één keer aan de slag in bakkerij | eJumo schreef op 6 mei 2013 om 05:18

    […] aldus Styles’ voormalige baas Simon Wakefield. Bijkbaar was de zanger ook toen al een echte meisjesmagneet: ‘Toen Harry hier werkte, kwamen er plots verdacht veel meisjes langs. Soms […]

Geef een reactie

Vox Magazine

Het onafhankelijke magazine van de Radboud Universiteit

lees de laatste Vox online!

Vox Update

Een directe, dagelijkse of wekelijkse update met onze artikelen in je mailbox!

Wekelijks
Nederlands
Verzonden!