Categorieën
Corpora & lexica

DiaMaNT

DiaMaNT staat voor Diachroon seMantisch lexicon van de Nederlandse Taal. Het is een computationeel semantisch lexicon in ontwikkeling, dat betekenisinformatie over woorden door de tijd heen moet bieden. DiaMaNT legt verbanden tussen woordvormen en betekeniseenheden (concepten), en plaatst ze in de tijd.

English version

DiaMaNT

With DiaMaNT (Diachroon seMAntisch lexicon van de Nederlandse Taal), the Dutch Language Institute is building a computational semantic lexicon that offers diachronic semantic information. It forms a semantic layer on top of GiGaNT (a computational lexicon of the Dutch language from the sixth century until now), by providing information about word meanings. DiaMaNT interrelates word forms with semantic units (concepts) and places them in time. The lexicon is a subproject of CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities), a collaborative project set up to provide a digital infrastructure for the Arts and Humanities.

Lexicon with semantic relations

DiaMaNT contains word meanings and relations between words, for the time being mainly synonym relations.

Application

DiaMaNT makes it easy to find the historical terms for concepts, as well as information on the period and the type of texts they were used in.

Development

Until now, we have mostly worked on the onomasiological component (different words for one meaning), in aid of which synonym definitions in dictionaries have been extracted and structured. After this, we will focus on the semasiological component (different meanings for one word).

Results

All synonym relations extracted from the Dictionary of Middle Dutch (MNW) and the Dictionary of the Dutch Language (WNT) have been manually verified, resulting in a lexicon containing over 300,000 synonym relations, published in RDF (Resource Description Framework). DiaMaNT is available as a data set in RDF and will soon also be available as a user application for a broad audience.

The lexicon has been used in the CLARIAH research pilots SERPENS and DB:CCC (Diamonds in Borneo: Commodities as Concepts in Context).


Applications/products

Further reading

Met DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) bouwt het Instituut voor de Nederlandse Taal (INT) aan een computationeel semantisch lexicon dat diachrone semantische informatie moet bieden. Het wordt gebouwd als laag bovenop GiGaNT (een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot nu), door betekenisinformatie toe te voegen. DiaMaNT legt relaties tussen woordvormen en betekeniseenheden (concepten) en plaatst ze in de tijd. Het lexicon is een deelproject van CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities), een samenwerkingsproject om een digitale infrastructuur voor de geesteswetenschappen tot stand te brengen.

Lexicon met betekenisverbanden

DiaMaNT bevat woordbetekenissen en relaties tussen woorden, voorlopig met name synoniemrelaties.

Gebruik

Met behulp van DiaMaNT kun je op een eenvoudige manier historische aanduidingen voor concepten terugvinden, met informatie over wanneer, en in wat voor materiaal, ze gebruikt werden.

Ontwikkeling

Vooralsnog is er voornamelijk gewerkt aan de onomasiologische component (verschillende woorden voor één betekenis), waarbij in de woordenboeken aanwezige synoniemdefinities zijn geëxtraheerd en gestructureerd. Hierna zullen we ons richten op de uitwerking van de semasiologische component (verschillende betekenissen van één woord).

Resultaten

Alle uit het Middelnederlands Woordenboek (MNW) en het Woordenboek der Nederlandsche Taal (WNT) geëxtraheerde synoniemrelaties zijn handmatig gecontroleerd, met als resultaat een in RDF (Resource Description Framework) gepubliceerd lexicon dat ruim 300.000 synoniemrelaties bevat. DiaMaNT is beschikbaar als dataset in RDF en in de vorm van een gebruikersapplicatie voor een breed publiek.

Het lexicon is gebruikt in de CLARIAH-researchpilots SERPENS en DB:CCC (Diamonds in Borneo: Commodities as Concepts in Context).


Applicaties/producten

Meer lezen