D-TUNA-corpus

Het D-TUNA-corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële expressies. De semantische annotatie van alle expressies (xml-formaat) maakt het corpus bruikbaar als input voor taalgeneratiesystemen. De samenstelling van het D-TUNA-corpus is geïnspireerd op het Engelse TUNA Corpus.

Productdetails

Jaar: 2009
Eigenaar: Universiteit van Tilburg
Dataformaat: Annotaties (xml)
Talen: Nederlands
Refereren: D-TUNA-corpus (Version 1.0) (2009) [Data set]. Available at the Dutch Language Institute:
http://hdl.handle.net/10032/tm-a2-k5
Documentatie: Documentatie
Toepassing: Input voor taalgeneratiesystemen.

Downloaddetails

Bestandsnaam: D-TUNA1.0p1.zip
Versie: 1.0
Bestandsgrootte: 2.44 MB
Bestandstype: application/zip
Aanmaakdatum: 12-03-2018
Om D-TUNA-corpus te kunnen downloaden moet u eerst inloggen. Door vervolgens op 'Akkoord' te klikken gaat u akkoord met de voorwaarden. Een versie van deze voorwaarden zit ook in het downloadpakket.
U bent nog niet ingelogd.

Op deze website maken wij gebruik van cookies.