Open source

English

Het Instituut voor de Nederlandse Taal stelt de software en computerlinguïstische tools die het heeft ontwikkeld als open source beschikbaar.

BlackLab

BlackLab is een corpuszoeksysteem op basis van Apache Lucene. Deze technologie maakt snelle, complexe zoekacties mogelijk binnen omvangrijke, geannoteerde tekstverzamelingen in onze historische en hedendaagse tekstcorpora. De zoekresultaten in de tekst worden gemarkeerd weergegeven. Onze corpora zullen we met behulp van dit zoeksysteem ontsluiten. Het Corpus Gysseling kunt u hier al in bètaversie bekijken.

MBMP (Memory Based Morphological Parser)

MBMP is een geheugengebaseerde morfologische parser voor de programmeertaal Python. Met deze parser worden woorden voorzien van een morfologische analyse. Zoals de onderverdeling van een woord in morfemen, de toekenning van PoS-tags aan de morfemen van een woord of een complete hiërarchische analyse. Daarnaast biedt het pakket de functionaliteit van een generieke geheugengebaseerde classificeerder. Deze tool ontwikkelden we ten behoeve van de morfologische component van GiGaNT.

 

Open source

The software and computational linguistic tools developed by the Dutch Language Institute are available as open source.

BlackLab

BlackLab is a corpus query system based on Apache Lucene. This technology can quickly perform complex searches within extensive, annotated text collections in our historical and contemporary text corpora. The search results are highlighted within the text. Our corpora will be made accessible through this search system. The beta version of the Gysseling Corpus can be consulted here.

MBMP (Memory Based Morphological Parser)

MBMP is a memory-based morphological parser for programming language Python. This parser analyses words morphologically. For example, it segments words into morphemes, it assigns POS tags to word morphemes or it carries out a complete hierarchical analysis. The package also offers the functionality of a generic memory-based classifier. We developed this tool for the morphological component of GiGaNT.

Op deze website maken wij gebruik van cookies.