Open Source

Het Instituut voor de Nederlandse Taal stelt zijn ontwikkelde software en computerlinguïstische tools als open source beschikbaar.

BlackLab

BlackLab is een corpuszoeksysteem op basis van Apache Lucene. Deze technologie maakt snelle, complexe zoekacties mogelijk binnen omvangrijke, geannoteerde tekstverzamelingen in onze historische en hedendaagse tekstcorpora. De zoekresultaten in de tekst worden gemarkeerd weergegeven. Onze corpora zullen we met behulp van dit zoeksysteem ontsluiten. Het Corpus Gysseling kunt u hier al in bètaversie bekijken.

MBMP (Memory Based Morphological Parser)

MBMP is een geheugengebaseerde morfologische parser voor de programmeertaal Python. Met deze parser worden woorden voorzien van een morfologische analyse. Zoals de onderverdeling van een woord in morfemen, de toekenning van PoS-tags aan de morfemen van een woord of een complete hiërarchische analyse. Daarnaast biedt het pakket de functionaliteit van een generieke geheugengebaseerde classificeerder. Deze tool ontwikkelden we ten behoeve van de morfologische component van GiGaNT.