SoNaR Groot-corpus Commercieel

Het SoNaR Groot-corpus Commercieel is een tekstcorpus dat ongeveer 271 miljoen woorden tekst bevat afkomstig uit uiteenlopende domeinen en genres. Alle teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd. Ook de named entities werden gelabeld. Alle annotaties van SoNaR-500 werden automatisch geproduceerd.

Dit product is gratis. Maar het is wel noodzakelijk dat eerst een licentie wordt ondertekend. De download bevat de licentie en verdere instructies voor het plaatsen van een bestelling.

Productdetails

Jaar: 2015
Opdrachtgever: NTU|STEVIN
Financier: NTU|STEVIN
Eigenaar: Taalunie
Talen: Nederlands
Refereren: SoNaR Groot-corpus Commercieel (Version 1.2.1) (2015) [Data set]. Available at the Dutch Language Institute:
http://hdl.handle.net/10032/tm-a2-f4
Documentatie: Documentatie, verschillende SoNaR-corpora
Project: SoNaR: STEVIN Nederlandstalig Referentiecorpus
Projectwebsite: http://lands.let.ru.nl/projects/SoNaR

Downloaddetails

Bestandsnaam: BP_SoNaR_Groot_C.zip
Versie: 1.2.1
Bestandsgrootte: 53.55 KB
Bestandstype: application/zip
Aanmaakdatum: 12-03-2018
Om SoNaR Groot-corpus Commercieel te kunnen downloaden moet u eerst inloggen. Door vervolgens op 'Akkoord' te klikken gaat u akkoord met de voorwaarden. Een versie van deze voorwaarden zit ook in het downloadpakket.
U bent nog niet ingelogd.

Op deze website maken wij gebruik van cookies.