Gezocht op tag(s): Woordfrequentie

CHN N-grams

Gemaakt op vrijdag 10 mei 2019   »Taalmaterialen

N-grammen (lengten één, twee en drie) met frequenties uit het Corpus Hedendaags Nederlands.

N-grams (lengths one, two, and three) and their frequencies from the Corpus Contemporary Dutch.

Details

CHN N-grams Commercieel

Gemaakt op vrijdag 10 mei 2019   »Taalmaterialen

N-grammen (lengten één, twee en drie) met frequenties uit het Corpus Hedendaags Nederlands.

N-grams (lengths one, two, and three) and their frequencies from the Corpus Contemporary Dutch.

Details

Philostei

Gemaakt op woensdag 21 november 2018   »Grafzerk

Philostei TICCLing Philosophy

Een open source, web-gebaseerd, gebruiksvriendelijke workflow van digitale afbeeldingen van naar TEI, die het mogelijk maken een filosofisch corpus op te bouwen. Deze workflow gebruikt een combinatie van een OCRopus / Tesseract webservice voor de analyse van de tekst-layout en OCR (Optical Character Recognition) en een meertalige versie van TICCL beschikbaar als webservice TICCLops. Een opvolger is PICCL. Zie ook: http://portal.clarin.nl/node/4190.

Status: Vervallen

TICLLOPS

Gemaakt op woensdag 21 november 2018   »Grafzerk

TICCLOPS Text-Induced Corpus Clean-up online processing system

TICCL (Text Induced Corpus Clean-up) is een systeem dat dient om een corpus te doorzoeken naar varianten van bestaande woorden en kan zo dienen om spelling- en OCR-fouten te ontdekken. Deze tool is inmiddels niet meer beschikbaar. Een opvolger is PICCL. Zie ook: https://portal.clarin.nl/node/1914.

Status: Vervallen

OpenSoNaR

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Online zoeksysteem voor het SoNaR-corpus, een tekstverzameling van hedendaags geschreven Nederlands dat uit meer dan 500 miljoen woorden bestaat. Het SoNaR-corpus is ook als download beschikbaar als download. Zie SoNaR Corpus.

Online search engine for the SoNaR Corpus, a text collection of contemporary written Dutch containing over 500 million words. The SoNaR corpus is also available as a download (see SoNaR Corpus).

Details

BasiLex-lexicon Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus met daaraan toegevoegd extra informatie.

Details

JASMIN-spraakcorpus Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst en mens-machinedialogen.

Details

e-Lex Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Lexicon met ruim 200.000 lemma's en ruim 640.000 woordvormen voorzien van o.a. POS-tag, complementatiepatroon, semantisch type en uitspraakinformatie.

A lexical database consisting of over 200,000 entries and over 640,000 word forms, enriched with part of speech, complementation type, semantic type, and phonological information.

Details

BasiScript-corpus

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven door kinderen in de basisschoolleeftijd.

Details

BasiScript-corpus Commercieel

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven door kinderen in de basisschoolleeftijd.

Details

BasiScript-lexicon

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven door kinderen in de basisschoolleeftijd.

Het BasiScript-lexicon is afgeleid van dat corpus.

Details

BasiScript-lexicon Commercieel

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven door kinderen in de basisschoolleeftijd.

Het BasiScript-lexicon is afgeleid van dat corpus.

Details

Autshumato English-Sesotho sa Leboa Parallel Corpora

Gemaakt op maandag 30 november -0001   »Taalmaterialen

BasiLex-lexicon

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus met daaraan toegevoegd extra informatie.

Details

COREA-coreferentieservice

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Een systeem dat automatisch coreferentiële relaties tussen nominale constituenten in teksten op kan lossen.

Details

Corpus Gesproken Nederlands (CGN)

Gemaakt op maandag 30 november -0001   »Taalmaterialen

D-TUNA-corpus

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Op deze website maken wij gebruik van cookies.