GiGaNT (Groot Geïntegreerd Lexicon van de Nederlandse Taal)

English

Projectbeschrijving

Op dit moment ontwikkelen we GiGaNT: een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot en met het heden. Dit lexicon vormt straks een verzameling van woorden en woordgroepen, waaronder ook named entities (namen van personen, plaatsen, organisaties), in alle mogelijke spelling- en vormvarianten.

Aan elke woordingang van GiGaNT koppelen we relevante taalkundige informatie zoals woordsoort, morfologische analyse en het woordparadigma door de eeuwen heen.

GiGaNT = lexicon met citaten

In GiGaNT worden alle woorden in het lexicon opgenomen met citaten, waarbij elk citaat is voorzien van bron en datum (bibliografische gegevens) en daterings- en lokaliseringsinformatie.

Gebruik van GiGaNT

GiGaNT is ontwikkeld voor computerlinguïstische tools. We bouwen het dan ook samen met een software-toolset voor zowel lexiconontwikkeling als lexicontoepassing. GiGaNT kunt u straks ook online raadplegen als onderdeel van de Taalbank Nederlands.

De resultaten

GiGaNT is volop in ontwikkeling. De basismodules gebaseerd op het Woordenboek der Nederlandsche Taal en het Middelnederlandsch Woordenboek zijn gereleased en toegankelijk via de INT LexiconService. Om gebruik te kunnen maken van de service, contacteer Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.. Hieronder vindt u diverse working papers.

De regels en principes die ten grondslag liggen aan de drie onderstaande aspecten van GiGaNT hebben we beschreven in onderstaande handleidingen.

1 Morfosyntactische verrijking
handleiding Ruitenberg en Van pellicom et al. 2012

2 Lemmatiseerprincipes
handleiding Mooijaart 2012

3 Morfologische analyse
handleiding Karsdorp 2010

We ontwikkelden ook een morfologische parser en een benchmark set voor historische morfologie.

 

GiGaNT

Description of the project

At this moment we are developing GiGaNT (Groot Geïntegreerd  Lexicon van de Nederlandse Taal): a computational lexicon of the Dutch language from the sixth century up to and including the present. This lexicon will soon form a collection of words and word groups, including named entities (names of persons, places, organisations), in all possible spelling and form variants.

To each word entry of GiGaNT, we link relevant linguistic information such as word class, morphological analysis and the word paradigm through the ages.

GiGaNT = lexicon with citations

In GiGaNT, all words are added to the lexicon with citations. For each citation, the source and date (bibliographical data) are provided along with dating and localisation information.

Usage of GiGaNT

GiGaNT has been developed for computational linguistic tools. We are therefore building it together with a software toolset for both lexicon development and lexicon application. It will soon be possible to consult GiGaNT online as a part of the ‘Taalbank Nederlands’.

The results

The development of GiGaNT is in full swing. The basic modules based on the dictionaries ‘Woordenboek der Nederlandsche Taal’ and the ‘Middelnederlandsch Woordenboek’ are released and available via the INT LexiconService. To use the service, please contact Katrien Depuydt. Below you can find various working papers.

The rules and principles that govern the following three aspects of GiGaNT are defined in the manuals below.

1 Morphosyntactical enrichment
manual by Ruitenberg and Van pellicom et al. 2012

2 Lemmatising principles
manual by Mooijaart 2012

3 Morphological analysis
manual by Karsdorp 2010

We have also developed a morphological parser and a benchmark set for historical morphology.

Op deze website maken wij gebruik van cookies.