Moroccorp: tien miljoen woorden uit twee Marokkaans- Nederlandse chatkanalen

  • T Ruette
  • F Van de Velde

Abstract

In dit artikel stellen we een nieuw corpus voor van computer-gemedieerde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, dat bestaat uit tien miljoen woorden chat-materiaal. We behandelen de achtergrond, de compilatiemethode en de interne structuur van het corpus, en we leggen het verband tussen ons eigen werk en eerdere pogingen om een corpus van Nederlandse chattaal te bouwen. We hebben ook een Stable Lexical Marker analyse uitgevoerd en een gevalstudie over een welbekende morfosyntactische eigenschap van het Marokkaans Nederlands om op die manier de representativiteit van het corpus te beoordelen.

Trefwoorden: Nederlands, marokkaans nederlands, corpus, chat, stable lexical marker analysis, etnisch nederlands, representativiteit

Published
2014-01-16
Section
Articles

Journal Identifiers


eISSN: 2224-0039
print ISSN: 1684-4904