Lassy Groot Corpus

Het Lassy Groot-corpus is een corpus van ongeveer 700 miljoen woorden met automatisch gegenereerde syntactische annotaties. De lemma's en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino.

Voor dit product moet een licentie worden ondertekend. De download bevat de licentie en verdere instructies voor het plaatsen van een bestelling.

Verzend- en afhandelingskosten

Vanwege de hoeveelheid data wordt dit product gedistribueerd op een externe harde schijf. Hier rekent het INT € 100,00 verzend- en afhandelingskosten voor. Meer informatie vindt u in het downloadpakket.

Productdetails

Jaar: 2016
Opdrachtgever: NTU|STEVIN
Financier: NTU|STEVIN
Eigenaar: Taalunie
Dataformaat: xml (compact)
Talen: Nederlands
Refereren: Lassy Groot Corpus (Version 4.0) (2016) [Data set]. Available at the Dutch Language Institute:
http://hdl.handle.net/10032/tm-a2-f6
Documentatie: LREC2006-artikel
TLT2009-artikel
Project: LASSY: Large Scale Syntactic Annotation of written Dutch
Projectwebsite: http://www.let.rug.nl/~vannoord/Lassy/
Toepassing: Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica.

Downloaddetails

Bestandsnaam: BP_LassyGroot_NC.zip
Versie: 4.0
Bestandsgrootte: 6.03 KB
Bestandstype: application/zip
Aanmaakdatum: 12-03-2018
Om Lassy Groot Corpus te kunnen downloaden moet u eerst inloggen. Door vervolgens op 'Akkoord' te klikken gaat u akkoord met de voorwaarden. Een versie van deze voorwaarden zit ook in het downloadpakket.
U bent nog niet ingelogd.

Op deze website maken wij gebruik van cookies.