Gezocht op tag(s): Part of Speech

Philostei

Gemaakt op woensdag 21 november 2018   »Grafzerk

Philostei TICCLing Philosophy

Een open source, web-gebaseerd, gebruiksvriendelijke workflow van digitale afbeeldingen van naar TEI, die het mogelijk maken een filosofisch corpus op te bouwen. Deze workflow gebruikt een combinatie van een OCRopus / Tesseract webservice voor de analyse van de tekst-layout en OCR (Optical Character Recognition) en een meertalige versie van TICCL beschikbaar als webservice TICCLops. Een opvolger is PICCL. Zie ook: http://portal.clarin.nl/node/4190.

Status: Vervallen

TICLLOPS

Gemaakt op woensdag 21 november 2018   »Grafzerk

TICCLOPS Text-Induced Corpus Clean-up online processing system

TICCL (Text Induced Corpus Clean-up) is een systeem dat dient om een corpus te doorzoeken naar varianten van bestaande woorden en kan zo dienen om spelling- en OCR-fouten te ontdekken. Deze tool is inmiddels niet meer beschikbaar. Een opvolger is PICCL. Zie ook: https://portal.clarin.nl/node/1914.

Status: Vervallen

IMDI-Server

Gemaakt op dinsdag 20 november 2018   »Grafzerk

IMDI-Server

De IMDI-Server waarop de data van het Corpus Gesproken Nederlands (CGN) beschikbaar was gesteld is opgeheven. Het CGN is te vinden in de Taalmaterialen catalogus van het INT

Status: Vervallen

Wablieft-corpus

Gemaakt op donderdag 18 oktober 2018   »Taalmaterialen

Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief.

Details

Philosophical Integrator of Computational and Corpus Libraries (PICCL)

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

PICCL biedt een workflow aan voor het samenstellen van corpora waarbij een aantal bestaande tools zijn samengevoegd. Het belangrijkste onderdeel van PICCL is TICCL, een systeem voor het opschonen van tekst gebruikmakend van spellingcorrectie en het nabewerken van OCR (normalisering van spellingvarianten etc.)

Ga naar website (alleen toegankelijk via een CLARIN-login).

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL, a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Go to website (only accessible with a CLARIN login)

OMBI Arabisch-Nederlands

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Arabisch en als doeltaal Nederlands.

Details

OMBI Arabisch-Nederlands Commercieel

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Arabisch en als doeltaal Nederlands.

Details

OMBI Nederlands-Arabisch

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Arabisch.

Details

OMBI Nederlands-Arabisch Commercieel

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Arabisch.

Details

OMBI Nederlands-Deens

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Deens.

Details

OMBI Nederlands-Deens Commercieel

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Deens.

Details

OMBI Nederlands-Indonesisch

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Indonesisch.

Details

OMBI Nederlands-Indonesisch Commercieel

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Indonesisch.

Details

Cornetto-LMF

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Lexicale database voor het Nederlands met semantische relaties en combinatorische informatie. Alleen toegankelijk met een CLARIN-account.

Lexical database of Dutch, providing semantic relationships and combinatorial information. Only accessible with a CLARIN account.

Ga naar website

Nerd

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Named entity recognizer. Alleen toegankelijk met een CLARIN-account.

Named entity recognizer. Only accessible with a CLARIN account.

Ga naar website

OpenSoNaR

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Online zoeksysteem voor het SoNaR-corpus, een tekstverzameling van hedendaags geschreven Nederlands dat uit meer dan 500 miljoen woorden bestaat. Het SoNaR-corpus is ook als download beschikbaar onder 'Details'.

Online search engine for the SoNaR Corpus, a text collection of contemporary written Dutch containing over 500 million words. The SoNaR corpus is also available as a download (see 'Details').

Details / Ga naar website

Brieven als buit

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Taalkundig verrijkte 17e- en 18e-eeuwse brieven tussen Nederlanders in verre oorden en hun families en geliefden aan het thuisfront.

Linguistically enriched letters ('Letters as Loot') from the 17th and 18th century, exchanged between Dutch people (often seamen) in far-off countries and their families and loved ones back home.

Ga naar website

WebCelex

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Interface waarmee de CELEX-lexicaledatabases van het Duits, Engels, Nederlands kunnen worden geraadpleegd. Voor iedere taal zijn de lemma's aangevuld met orthografische, fonologische, morfologische en syntactische informatie en frequentiegegevens.

Interface through which the CELEX lexical databases of German, English and Dutch can be consulted. For each language, the lemmas have been enriched with orthographical, phonological, morphological and syntactic information, as well as linguistic frequency data.

Ga naar website

Referentiebestand Nederlands (RBN) Commercieel

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een verzameling van ongeveer 50.000 frequente Nederlandse woorden aangevuld met taalkundige informatie.

A collection of ca. 50,000 frequently used Dutch words, enriched with linguistic information.

Details

Op deze website maken wij gebruik van cookies.