Gezocht op tag(s): Niet-commercieel

Philostei

Gemaakt op woensdag 21 november 2018   »Grafzerk

Philostei TICCLing Philosophy

Een open source, web-gebaseerd, gebruiksvriendelijke workflow van digitale afbeeldingen van naar TEI, die het mogelijk maken een filosofisch corpus op te bouwen. Deze workflow gebruikt een combinatie van een OCRopus / Tesseract webservice voor de analyse van de tekst-layout en OCR (Optical Character Recognition) en een meertalige versie van TICCL beschikbaar als webservice TICCLops. Een opvolger is PICCL. Zie ook: http://portal.clarin.nl/node/4190.

Status: Vervallen

TICLLOPS

Gemaakt op woensdag 21 november 2018   »Grafzerk

TICCLOPS Text-Induced Corpus Clean-up online processing system

TICCL (Text Induced Corpus Clean-up) is een systeem dat dient om een corpus te doorzoeken naar varianten van bestaande woorden en kan zo dienen om spelling- en OCR-fouten te ontdekken. Deze tool is inmiddels niet meer beschikbaar. Een opvolger is PICCL. Zie ook: https://portal.clarin.nl/node/1914.

Status: Vervallen

IMDI-Server

Gemaakt op dinsdag 20 november 2018   »Grafzerk

IMDI-Server

De IMDI-Server waarop de data van het Corpus Gesproken Nederlands (CGN) beschikbaar was gesteld is opgeheven. Het CGN is te vinden in de Taalmaterialen catalogus van het INT

Status: Vervallen

Wablieft-corpus

Gemaakt op donderdag 18 oktober 2018   »Taalmaterialen

Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief.

Details

Brieven als Buit - Gouden Standaard

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

De circa 1000 met hoofdwoordsoort en modern lemma verrijkte bronbestanden van het Brieven als Buit-programma, geleid door prof. dr. M.J. van der Wal.

Letters as Loot – Gold Standard contains the 1000 or so source files from the Letters as Loot program (directed by Prof. Dr. M.J. van der Wal), each enriched with main part-of-speech and modern lemma.

Details

INT Historische Woordenlijst

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

Twee lijsten met elk ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970.

Two lists, each consisting of approx. 500,000 historical word forms, to be used for OCR and OCR post-correction, for the period of 1550 – 1970, approximately.

Details

INT IMPACT NE Lexicon

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

Lexicon voor het Nederlands, met historische namen en varianten uit de periode 1750-1945.

Lexicon for Dutch, featuring historical names and variants from the period between 1750 and 1945.

Details

Etymologiebank

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

De Etymologiebank biedt alle belangrijke etymologische publicaties van het Nederlands op woordniveau aan op één centraal punt (data geleverd door het INT).

Etymologiebank presents all important etymological publications on Dutch words in one place (data have been supplied by the Dutch Language Institute).

Ga naar website

Hulk / Keurmerk Spelling

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

Hulk / Keurmerk Spelling: keurmerk voor producten die de regels en principes van de officiële spelling van de Nederlandse Taalunie volgen.

Certification mark for products written in compliance with the official spelling rules and principles formulated by the Dutch Language Union.

Ga naar website

Philosophical Integrator of Computational and Corpus Libraries (PICCL)

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

PICCL biedt een workflow aan voor het samenstellen van corpora waarbij een aantal bestaande tools zijn samengevoegd. Het belangrijkste onderdeel van PICCL is TICCL, een systeem voor het opschonen van tekst gebruikmakend van spellingcorrectie en het nabewerken van OCR (normalisering van spellingvarianten etc.)

Ga naar website (alleen toegankelijk via een CLARIN-login).

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL, a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Go to website (only accessible with a CLARIN login)

OMBI Arabisch-Nederlands

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Arabisch en als doeltaal Nederlands.

Details

OMBI Nederlands-Arabisch

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Arabisch.

Details

OMBI Nederlands-Deens

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Deens.

Details

OMBI Nederlands-Indonesisch

Gemaakt op dinsdag 10 april 2018   »Taalmaterialen

Bilinguaal lexicaal bestand met als brontaal Nederlands en als doeltaal Indonesisch.

Details

Cornetto-LMF

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Lexicale database voor het Nederlands met semantische relaties en combinatorische informatie. Alleen toegankelijk met een CLARIN-account.

Lexical database of Dutch, providing semantic relationships and combinatorial information. Only accessible with a CLARIN account.

Ga naar website

OpenConvert

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Tool om tekst te converteren naar xml-formaat (TEI) en te voorzien van taalkundige annotaties. Alleen toegankelijk met een CLARIN-account.

A tool for converting text to XML format (TEI) and annotating it with linguistic information. Only accessible with a CLARIN account.

Ga naar website

Nerd

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Named entity recognizer. Alleen toegankelijk met een CLARIN-account.

Named entity recognizer. Only accessible with a CLARIN account.

Ga naar website

Memory Based Morphological Parser (MBMP)

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een geheugengebaseerde morfologische parser voor de programmeertaal Python. Deze tool wordt gedistribueerd via GitHub.

A memory-based morphological parser for the programming language Python. This tool is distributed through Github.

Ga naar website

INL Labs

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Webservice voor het taggen/lemmatiseren van (historische) teksten met o.a. een tagger voor eigennamen (named entities) en een tagger speciaal getraind voor historisch materiaal. De laatste geeft de moderne woordvormen weer en maakt een koppeling naar betekenisomschrijvingen.

Web service for tagging/lemmatizing (historical) texts, for example with a tagger for named entities, and a tagger trained specifically for historical material. The latter shows the modern word forms and connects these to descriptions of their meanings.

Ga naar website

Cobalt

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Applicatie om een verzameling tekstbestanden in te laden en taalkundig te annoteren. Deze applicatie wordt gedistribueerd via GitHub.

Application for importing and linguistically annotating a collection of text files. This application is distributed through Github.

Ga naar website

Op deze website maken wij gebruik van cookies.