CLARIAH

English

CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities) is een samenwerkingsproject om een digitale infrastructuur voor de geesteswetenschappen tot stand te brengen. Het kan gezien worden als de opvolging (en uitbreiding) van CLARIN-NL. Grote hoeveelheden data en software uit verschillende geesteswetenschappelijke disciplines worden aan elkaar gekoppeld en digitaal doorzoekbaar gemaakt. CLARIAH richt zich op drie deelgebieden: taalkunde, mediastudies en sociaal-economische geschiedenis, die zich respectievelijk richten op het ontsluiten van tekstbestanden, het ontwikkelen van gereedschappen om audiovisuele bronnen te ontginnen, en het inzetbaar maken van gestructureerde databestanden. Het Instituut voor de Nederlandse Taal is betrokken in twee werkpakketten, namelijk Techniek (werkpakket 2) en Taalkunde (werkpakket 3).

Zoeken in databestanden

Onze expertise wordt met name ingezet op het gebied van zoeken in taalkundige databestanden. In het CLARIAH-project worden lexica, corpora, elektronische woordenboeken en niet-taalkundige databases doorzoekbaar gemaakt. Daarbij gaat het om lokaal zoeken in databestanden (local search), zoeken in bestanden die op verschillende locaties staan (federated search), en zoeken met gebruikmaking van verschillende types databestanden tegelijk (chaining search).

Semantisch lexicon DiaMaNT

DiaMaNT (Diachroon seMAntisch lexicon van de Nederlandse Taal) is een deelproject van CLARIAH en zal het ontwerp, de bouwwijze en een eerste versie van een diachroon semantisch lexicon van de Nederlandse taal opleveren. Het lexicon biedt een hulpmiddel voor tekstontsluiting en bij het onderzoek naar begrippen door de eeuwen heen. Het lexicon legt relaties tussen woordvormen en betekeniseenheden (concepten), en plaatst deze in de tijd. De bedoeling van het diachrone semantische lexicon is om diachrone onomasiologie, d.i. de veranderende uitdrukking/verbalisatie van een concept, en semasiologie, d.i. de verschuiving van betekenis(nuance) van woorden in de tijd, systematisch vast te leggen op een zodanige wijze dat de informatie voor mens en computer bruikbaar is.

Enerzijds dient de onomasiologische component de zoekmogelijkheden, omdat gerelateerde historische concepten kunnen worden toegevoegd aan een zoekvraag (slager ? beenhouwer, beenhakker, vleeshouwer; boer ? landman). Anderzijds draagt de semasiologische component (het in kaart brengen van betekenisverandering), bij aan de toegankelijkheid van historische tekst door de gebruiker erop te attenderen dat woorden in een bepaalde historische context een geheel andere betekenis kunnen hebben; zo is bv. de oudste betekenis van appel ‘vrucht in het algemeen’ (dus ook peren, pruimen etc.). Het lexicon wordt met name gebaseerd op de historische woordenboeken van het Instituut voor Nederlandse Lexicologie.

CLARIAH

CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities) is a distributed research infrastructure for the humanities and social sciences. It can be considered a successor to and expansion of CLARIN-NL. Large quantities of data and software from different disciplines in the humanities are linked together and made digitally searchable. CLARIAH focuses on three sub-disciplines: linguistics, media studies, and socio-economic history, which focus on making text files available, developing tools for the mining of audio-visual files, and making structured databases usable, respectively. The Dutch Language Institute is involved in the development of two work packages: Technology (work package 2) and Linguistics (work package 3).

Searching data files

Our expertise is primarily applied in the area of the searchability of linguistic data files. In the CLARIAH project, lexica, corpora, electronic dictionaries and non-linguistic databases are made searchable. This involves ’local search’ (in local data files), ‘federated search’ (in files stored in different locations), and ‘chaining search’ (in different types of data files at once).

Semantic lexicon DiaMaNT

DiaMaNT (Diachronic SeMantic lexicon of Dutch) is a sub-project of CLARIAH, and will result in the design, construction and first version of a diachronic semantic lexicon of the Dutch language. The lexicon enhances text availability and fosters research into the development of concepts throughout the ages, by interrelating attested word forms and semantic units (concepts), and tracing semantic developments through time. The aim of the diachronic semantic lexicon is to systematically record diachronic onomasiology, i.e. the change in the naming of concepts, and semasiology, i.e. the change in the meaning (nuance) of words in time, so that the information is usable to both humans and computers.

The onomasiological part of the lexicon is designed to enhance recall in text retrieval by providing different verbal expressions of a concept or related concepts (slager ? beenhouwer, beenhakker, vleeshouwer (synonyms for ‘butcher’); boer ? landman (‘synonyms for ‘farmer’). The diachronic semasiological component (which charts semantic change) aims to enhance precision by enabling the user to take semantic change into account; the oldest meaning of apple, for example, is ‘a fruit’ (so apple is also used for pears, plums etc.). The lexicon is based primarily on the historical dictionaries of the Dutch Lexicological Institute.

Op deze website maken wij gebruik van cookies.