GiGaNT (Groot Geïntegreerd Lexicon van de Nederlandse Taal)

Computationeel lexicon

Projectbeschrijving

Op dit moment ontwikkelen we GiGaNT: een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot en met het heden. Dit lexicon vormt straks een verzameling van woorden en woordgroepen, waaronder ook named entities (namen van personen, plaatsen, organisaties), in alle mogelijke spelling- en vormvarianten.

> Meer

Aan elke woordingang van GiGaNT koppelen we relevante taalkundige informatie zoals woordsoort, morfologische analyse en het woordparadigma door de eeuwen heen.

GiGaNT = lexicon met citaten

In GiGaNT worden alle woorden in het lexicon opgenomen met citaten, waarbij elk citaat is voorzien van bron en datum (bibliografische gegevens) en daterings- en lokaliseringsinformatie.

Gebruik van GiGaNT

GiGaNT is ontwikkeld voor computerlinguïstische tools. We bouwen het dan ook samen met een software-toolset voor zowel lexiconontwikkeling als lexicontoepassing. GiGaNT kunt u straks ook online raadplegen als onderdeel van de Taalbank Nederlands.

De resultaten

GiGaNT is volop in ontwikkeling. De basismodules gebaseerd op het Woordenboek der Nederlandsche Taal en het Middelnederlandsch Woordenboek zijn gereleased en toegankelijk via de INT lexicon service. Hieronder vindt u diverse working papers.

> Meer

De regels en principes die ten grondslag liggen aan de drie onderstaande aspecten van GiGaNT hebben we beschreven in onderstaande handleidingen.

1 Morfosyntactische verrijking
handleiding Ruitenberg en Van pellicom et al. 2012

2 Lemmatiseerprincipes
handleiding Mooijaart 2012

3 Morfologische analyse
handleiding Karsdorp 2010

We ontwikkelden ook een morfologische parser en een benchmark set voor historische morfologie.