Met DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) bouwt het Instituut voor de Nederlandse Taal (INT) aan een computationeel semantisch lexicon dat diachrone semantische informatie moet bieden. Het wordt gebouwd als laag bovenop GiGaNT (een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot nu), door betekenisinformatie toe te voegen. DiaMaNT legt relaties tussen woordvormen en betekeniseenheden (concepten) en plaatst ze in de tijd. Het lexicon is een deelproject van CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities), een samenwerkingsproject om een digitale infrastructuur voor de geesteswetenschappen tot stand te brengen.
Lexicon met betekenisverbanden
DiaMaNT bevat woordbetekenissen en relaties tussen woorden, voorlopig met name synoniemrelaties.
Gebruik
Met behulp van DiaMaNT kun je op een eenvoudige manier historische aanduidingen voor concepten terugvinden, met informatie over wanneer, en in wat voor materiaal, ze gebruikt werden.
Ontwikkeling
Vooralsnog is er voornamelijk gewerkt aan de onomasiologische component (verschillende woorden voor één betekenis), waarbij in de woordenboeken aanwezige synoniemdefinities zijn geëxtraheerd en gestructureerd. Hierna zullen we ons richten op de uitwerking van de semasiologische component (verschillende betekenissen van één woord).
Resultaten
Alle uit het Middelnederlands Woordenboek (MNW) en het Woordenboek der Nederlandsche Taal (WNT) geëxtraheerde synoniemrelaties zijn handmatig gecontroleerd, met als resultaat een in RDF (Resource Description Framework) gepubliceerd lexicon dat ruim 300.000 synoniemrelaties bevat. DiaMaNT is beschikbaar als dataset in RDF en in de vorm van een gebruikersapplicatie voor een breed publiek.
Het lexicon is gebruikt in de CLARIAH-researchpilots SERPENS en DB:CCC (Diamonds in Borneo: Commodities as Concepts in Context).