Gezocht op tag(s): Corpus

Wablieft-corpus

Gemaakt op donderdag 18 oktober 2018   »Taalmaterialen

Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief.

Details

Brieven als Buit - Gouden Standaard

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

De circa 1000 met hoofdwoordsoort en modern lemma verrijkte bronbestanden van het Brieven als Buit-programma, geleid door prof. dr. M.J. van der Wal.

Letters as Loot – Gold Standard contains the 1000 or so source files from the Letters as Loot program (directed by Prof. Dr. M.J. van der Wal), each enriched with main part-of-speech and modern lemma.

Details

OpenSoNaR

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Online zoeksysteem voor het SoNaR-corpus, een tekstverzameling van hedendaags geschreven Nederlands dat uit meer dan 500 miljoen woorden bestaat. Het SoNaR-corpus is ook als download beschikbaar onder 'Details'.

Online search engine for the SoNaR Corpus, a text collection of contemporary written Dutch containing over 500 million words. The SoNaR corpus is also available as a download (see 'Details').

Details / Ga naar website

Brieven als buit

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Taalkundig verrijkte 17e- en 18e-eeuwse brieven tussen Nederlanders in verre oorden en hun families en geliefden aan het thuisfront.

Linguistically enriched letters ('Letters as Loot') from the 17th and 18th century, exchanged between Dutch people (often seamen) in far-off countries and their families and loved ones back home.

Ga naar website

AUTONOMATA-namencorpus Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden.

Details

BasiLex-corpus Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Details

JASMIN-spraakcorpus Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst en mens-machinedialogen.

Details

COREA-coreferentiecorpus Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Het corpus bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn.

Details

BasiScript-corpus

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Details

BasiScript-corpus Commercieel

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Details

BasiScript-lexicon

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Het BasiScript-lexicon is afgeleid van dat corpus.

Details

BasiScript-lexicon Commercieel

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Het BasiScript-lexicon is afgeleid van dat corpus.

Details

Afrikaans Genre Classification Corpus

Gemaakt op maandag 30 november -0001   »Taalmaterialen

This language resource contains training and testing data for genre classification for Afrikaans.

Details

AUTONOMATA-namencorpus

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden.

Details

AUTONOMATA-POI-corpus

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Het corpus is een database van 800 voorgelezen points of interest (POIs) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc.

Details

Autshumato Afrikaans-English Translation Memory

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Translation memory from Afrikaans to English (EN-GB), in the government domain for use in the Autshumato ITE application.

Details

Autshumato English-Afrikaans Parallel Corpora

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Op deze website maken wij gebruik van cookies.