Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen
Moroccorp: Ten Million Words from two Moroccan Dutch Chat Channels.In this article we introduce a new corpus of computer-mediated communication in Dutch by Maroccan-Dutch language users, consisting of ten million words of chat material. We treat the background, the compilation method and the inner structure of the corpus, and we relate our efforts to previous attempts to build a corpus of Dutch chat language. We also conducted a Stable Lexical Marker analysis and a case study on a well-known morphosyntactic feature of Moroccan Dutch to assess in this manner the representativity of the corpus... Mehr ...
Verfasser: | |
---|---|
Dokumenttyp: | Artikel |
Erscheinungsdatum: | 2013 |
Verlag/Hrsg.: |
Bureau of the WAT
|
Schlagwörter: | dutch / moroccan dutch / corpus / chat / stable lexical marker analysis / ethnic dutch / representativity / nederlands / marokkaans nederlands / etnisch nederlands / representativiteit |
Sprache: | Englisch |
Permalink: | https://search.fid-benelux.de/Record/base-29118772 |
Datenquelle: | BASE; Originalkatalog |
Powered By: | BASE |
Link(s) : | https://lexikos.journals.ac.za/pub/article/view/1225 |
Moroccorp: Ten Million Words from two Moroccan Dutch Chat Channels.In this article we introduce a new corpus of computer-mediated communication in Dutch by Maroccan-Dutch language users, consisting of ten million words of chat material. We treat the background, the compilation method and the inner structure of the corpus, and we relate our efforts to previous attempts to build a corpus of Dutch chat language. We also conducted a Stable Lexical Marker analysis and a case study on a well-known morphosyntactic feature of Moroccan Dutch to assess in this manner the representativity of the corpus. ; In dit artikel stellen we een nieuw corpus voor van computer-gemedieerde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, dat bestaat uit tien miljoen woorden chat-materiaal. We behandelen de achtergrond, de compilatiemethode en de interne structuur van het corpus, en we leggen het verband tussen ons eigen werk en eerdere pogingen om een corpus van Nederlandse chattaal te bouwen. We hebben ook een Stable Lexical Marker analyse uitgevoerd en een gevalstudie over een welbekende morfosyntactische eigenschap van het Marokkaans Nederlands om op die manier de representativiteit van het corpus te beoordelen.