CHN N-grams

N-grammen zijn reeksen opeenvolgende woorden uit lopende teksten. De n-grammen in dit product zijn afkomstig uit het Corpus Hedendaags Nederlands (CHN), een groot corpus van voornamelijk hedendaagse kranten tijdschriften, journaaluitzendingen en juridisch materiaal.

CHN N-grams bevat n-grammen met reeksen van één, twee en drie opeenvolgende woorden, met de bijbehorende absolute frequentie.

Productdetails

Jaar: 2019
Opdrachtgever: INT
Dataformaat: txt
Talen: Nederlands
Refereren: CHN N-grams (Version 1.0) (2019) [Data set]. Available at the Dutch Language Institute:
http://hdl.handle.net/10032/tm-a2-p6
Toepassing: Bijvoorbeeld schrijfhulp met woordvoorspelling.

Downloaddetails

Bestandsnaam: chn-ngrams1.0.tgz
Versie: 1.0
Bestandsgrootte: 4.17 GB
Bestandstype: application/x-compressed-tar
Aanmaakdatum: 14-05-2019
Om CHN N-grams te kunnen downloaden moet u eerst inloggen. Door vervolgens op 'Akkoord' te klikken gaat u akkoord met de voorwaarden. Een versie van deze voorwaarden zit ook in het downloadpakket.
U bent nog niet ingelogd.

Op deze website maken wij gebruik van cookies.