BasiScript Corpus

BasiScript is een corpus met 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool.

Het corpus bevat longitudinale data verzameld over drie achtereenvolgende jaren (najaar 2012 - voorjaar 2015). Het BasiScript-corpus is ontworpen om zowel de educatieve diversiteit (type school) als de geografische regio's van Nederland te kunnen vergelijken.

De data bevat voornamelijk handgeschreven teksten en een klein aantal teksten geproduceerd met een tekstverwerker (met automatische spellin-g en grammaticacontrole uitgeschakeld). De data is geanonimiseerd.

Voor dit product moet een licentie worden ondertekend. De download bevat de licentie en verdere instructies voor het plaatsen van een bestelling.

Productdetails

Jaar: 2015
Financier: NWO
Eigenaar: Radboud Universiteit
Dataformaat: xml (FoLiA)
Talen: Nederlands
Refereren: Tellings, A. E. J. M. (2015), BasiScript Corpus (Version 1.0) [Data set]. Available at the Dutch Language Institute:
http://hdl.handle.net/10032/tm-a2-p2
Project: Basiscript: a corpus of written language output as produced by elementary school children in the Netherlands, annotated for spelling, word frequencies and word properties, and a 20,000-word lexicon annotated for word senses zie details.
Doelpubliek: Voornamelijk voor leerkrachten, makers van lesmaterialen en toetsen, schrijvers van kinderliteratuur, uitgevers en onderzoekers.

Downloaddetails

Bestandsnaam: BP_BasiScriptCorpusNC.zip
Versie: 1.0
Bestandsgrootte: 53.13 KB
Bestandstype: application/zip
Aanmaakdatum: 12-03-2018
Om BasiScript Corpus te kunnen downloaden moet u eerst inloggen. Door vervolgens op 'Akkoord' te klikken gaat u akkoord met de voorwaarden. Een versie van deze voorwaarden zit ook in het downloadpakket.
U bent nog niet ingelogd.

Op deze website maken wij gebruik van cookies.