Projectbeschrijving
CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities) is een samenwerkingsproject dat een digitale infrastructuur voor de geesteswetenschappen tot stand brengt. Het kan gezien worden als de opvolging (en uitbreiding) van CLARIN-NL. Grote hoeveelheden data en software uit verschillende geesteswetenschappelijke disciplines worden aan elkaar gekoppeld en digitaal doorzoekbaar gemaakt. CLARIAH richt zich op drie deelgebieden: taalkunde, mediastudies en sociaal-economische geschiedenis, die zich respectievelijk bezighouden met het ontsluiten van tekstbestanden, het ontwikkelen van gereedschappen om audiovisuele bronnen te ontginnen, en het inzetbaar maken van gestructureerde databestanden. Het Instituut voor de Nederlandse Taal is betrokken bij twee werkpakketten, namelijk Techniek (werkpakket 2) en Taalkunde (werkpakket 3).
Onze rol
Onze expertise wordt met name ingezet op het gebied van zoeken in taalkundige databestanden. In het CLARIAH-project worden lexica, corpora, elektronische woordenboeken en niet-taalkundige databases doorzoekbaar gemaakt. Daarbij gaat het om lokaal zoeken in databestanden (local search), zoeken in bestanden die op verschillende locaties staan (federated search), en zoeken met gebruikmaking van verschillende types databestanden tegelijk (chaining search).
Semantisch lexicon DiaMaNT
DiaMaNT (Diachroon seMAntisch lexicon van de Nederlandse Taal) is gestart als deelproject van CLARIAH en heeft een eerste versie van een diachroon semantisch lexicon van de Nederlandse taal geleverd. Het lexicon is gebruikt in de CLARIAH research pilots SERPENS en DB:CCC (Diamonds in Borneo: Commodities as Concepts in Context).