Lever je sms’jes in voor de wetenschap
Gezocht: donateurs van twintig duizend sms’jes vóór 1 december 2011. Doel: opbouw verzameling van modern taalgebruik. Wie: iedereen. Beloning: kans op het winnen van een iPad 2. Opbrengst: taalhulpmiddelen en inzicht in taalontwikkeling. De afdeling Taalwetenschap van de Radboud Universiteit Nijmegen verzamelt sinds dit weekend sms-berichten voor een grote taalverzameling, een zogeheten corpus. Het doel is om 20.000 sms-berichten te verzamelen voor 1 december 2011. Gisteren, drie dagen na de start van het verzamelen staat de teller op 1600.
‘Er zijn eigenlijk nog geen grote verzamelingen sms’jes in het Nederlands. Het is een bijzonder vorm van taalgebruik – het is kort en je betaalt ervoor. Beide zorgen ervoor dat je op een bepaalde manier creatief wordt,’ zegt Maaske Treurniet . ‘We hopen dat het corpus kan helpen om allerlei technologische toepassingen te verbeteren. Het zou fijn zijn dat het woordenboek in je telefoon past bij de woorden die je ook gebruikt in sms-taal. Ook voor allerlei marketing-doeleinden is het interessan om te zien hoe sms gebruikt wordt. Dan gaat het over de taal maar ook over sociale aspecten. We vragen ook naar geslacht, leeftijd en woonplaats.’
Taal vanaf 1954
Het SoNaR-corpus bestaat uit geschreven Nederlandse teksten van na 1954. Het gaat om allerlei soorten teksten, zoals kranten, tijdschriften, ondertitels, chats, Tweets, scripties en jaarverslagen. ‘Ik denk dat de sms-verzameling in het begin het meest de aandacht zal trekken. Er is namelijk nog geen andere grote verzameling sms-berichten.’
Zo’n corpus is ook interessant voor het onderzoek naar taalontwikkelingen. Hoewel? ‘Ik vraag me af hoe lang sms zal bestaan,’ zegt Treurniet.
Meedoen met een Android-telefoon
Er is een Android-applicatie gemaakt, waarmee alle verzonden sms’jes uit een telefoon via e-mail naar SoNaR verstuurd worden. Deze applicatie ‘SoNaR SMS Corpus’ is gratis verkrijgbaar in de Android Market. De eigenaar van de sms-berichten kan zelf kiezen welke berichten wel en niet aan SoNaR gedoneerd mogen worden. De applicatie zorgt ook voor automatische anonimisatie van de sms’jes. Deze applicatie is ontwikkeld in samenwerking met de Nationale Universiteit Singapore.
Meedoen met een gewoon mobieltje
Mensen zonder Android-telefoon vinden op de website van SoNaR instructies om op andere manieren hun SMS te doneren. Het SoNaR-team verspreidt flyers en posters om bekendheid aan het project te geven.
Kans op een iPad
Iedereen die zijn SMS doneert, maakt kans op het winnen van een iPad 2.
Partners in corpus
Naast Nijmegen zijn ook de universiteiten in Tilburg, Utrecht, Twente en Leuven en de Hogeschool Gent partners in het project. Het project wordt gefinancierd door de Nederlandse en Vlaamse overheid in het kader van het STEVIN-programma. De Nederlandse Taalunie gaat het corpus beheren, zodat onderzoekers dit in de toekomst kunnen raadplegen. Corpusonderzoek is bijvoorbeeld nodig voor het ontwikkelen van technieken zoals Google Translate, T9 en Swype, maar ook voor hulpmiddelen voor mensen met bijvoorbeeld dyslexie.
Voor meer informatie, zie http://www.sonarproject.nl/
@sonarcorpus (www.twitter.com/sonarcorpus)
www.facebook.com/sonarproject