Gezocht op tag(s): Woordfrequentie

Philostei

Gemaakt op woensdag 21 november 2018   »Grafzerk

Philostei TICCLing Philosophy

Een open source, web-gebaseerd, gebruiksvriendelijke workflow van digitale afbeeldingen van naar TEI, die het mogelijk maken een filosofisch corpus op te bouwen. Deze workflow gebruikt een combinatie van een OCRopus / Tesseract webservice voor de analyse van de tekst-layout en OCR (Optical Character Recognition) en een meertalige versie van TICCL beschikbaar als webservice TICCLops. Een opvolger is PICCL. Zie ook: http://portal.clarin.nl/node/4190.

Status: Vervallen

TICLLOPS

Gemaakt op woensdag 21 november 2018   »Grafzerk

TICCLOPS Text-Induced Corpus Clean-up online processing system

TICCL (Text Induced Corpus Clean-up) is een systeem dat dient om een corpus te doorzoeken naar varianten van bestaande woorden en kan zo dienen om spelling- en OCR-fouten te ontdekken. Deze tool is inmiddels niet meer beschikbaar. Een opvolger is PICCL. Zie ook: https://portal.clarin.nl/node/1914.

Status: Vervallen

OpenSoNaR

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Online zoeksysteem voor het SoNaR-corpus, een tekstverzameling van hedendaags geschreven Nederlands dat uit meer dan 500 miljoen woorden bestaat. Het SoNaR-corpus is ook als download beschikbaar onder 'Details'.

Online search engine for the SoNaR Corpus, a text collection of contemporary written Dutch containing over 500 million words. The SoNaR corpus is also available as a download (see 'Details').

Details / Ga naar website

BasiLex-lexicon Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus met daaraan toegevoegd extra informatie.

Details

JASMIN-spraakcorpus Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst en mens-machinedialogen.

Details

e-Lex Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Lexicon met ruim 200.000 lemma's en ruim 640.000 woordvormen voorzien van o.a. POS-tag, complementatiepatroon, semantisch type en uitspraakinformatie.

A lexical database consisting of over 200,000 entries and over 640,000 word forms, enriched with part of speech, complementation type, semantic type, and phonological information.

Details

BasiScript-corpus

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Details

BasiScript-corpus Commercieel

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Details

BasiScript-lexicon

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Het BasiScript-lexicon is afgeleid van dat corpus.

Details

BasiScript-lexicon Commercieel

Gemaakt op woensdag 28 februari 2018   »Taalmaterialen

Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Het BasiScript-lexicon is afgeleid van dat corpus.

Details

Autshumato English-Sesotho sa Leboa Parallel Corpora

Gemaakt op maandag 30 november -0001   »Taalmaterialen

BasiLex-lexicon

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus met daaraan toegevoegd extra informatie.

Details

COREA-coreferentieservice

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Een systeem dat automatisch coreferentiële relaties tussen nominale constituenten in teksten op kan lossen.

Ga naar website

Corpus Gesproken Nederlands (CGN)

Gemaakt op maandag 30 november -0001   »Taalmaterialen

D-TUNA-corpus

Gemaakt op maandag 30 november -0001   »Taalmaterialen

e-Lex

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Lexicon met ruim 200.000 lemma's en ruim 640.000 woordvormen voorzien van o.a. POS-tag, complementatiepatroon, semantisch type en uitspraakinformatie.

A lexical database consisting of over 200,000 entries and over 640,000 word forms, enriched with part of speech, complementation type, semantic type, and phonological information.

Details

Op deze website maken wij gebruik van cookies.