Het Instituut voor de Nederlandse Taal (INT) maakt als CLARIN B-centrum deel uit van CLARIN. Dit Europese programma biedt een stabiele, permanente, toegankelijke en uitbreidbare onderzoeksinfrastructuur voor geesteswetenschappers. Onderzoekers, docenten en studenten krijgen hiermee toegang tot digitale materialen en tools die relevant zijn voor hun onderzoek.
Doel van CLARIN
CLARIN (‘Common Language Resources and Technology Infrastructure’) bouwt aan een geïntegreerde, interoperabele onderzoeksinfrastructuur met taalbronnen en taaltechnologie. De infrastructuur, die stabiel, permanent, toegankelijk en uitbreidbaar is, moet de bestaande versnippering opheffen en gebruik van computationele technieken in de geesteswetenschappen (Digital Humanities) bevorderen.
- geïntegreerd: de bronnen- en servicecentra zijn door grid-technologie verbonden en vormen één virtueel, geïntegreerd domein
- interoperabel: de bronnen en diensten zullen gebruikmaken van de technologie van het semantische web, waarbij verschillen in formaat, structuur en gebruikte terminologie opgeheven zullen worden
- stabiel: de bronnen en diensten zijn in hoge mate beschikbaar
- permanent: de bronnen en diensten zullen op lange termijn nog steeds beschikbaar zijn voor onderzoek
- toegankelijk: de bronnen en diensten zijn op verschillende manieren via het web toegankelijk; daarvoor wordt training aangeboden, aangepast aan de behoeften van de gebruiker
- uitbreidbaar: de infrastructuur is open voor uitbreiding met nieuwe taalbronnen en diensten
Aan CLARIN nemen inmiddels 22 landen deel; Nederland speelt met vier bij CLARIN betrokken instituten, waaronder het INT, een belangrijke rol als trekker. Voor België is het INT een coördinerende partner. Zie ook de website van CLARIN zelf.
De maatschappelijke voordelen van CLARIN zijn groot. Deze infrastructuur overschrijdt disciplines, talen en grenzen. Het zet de talen en culturen van een land op de kaart. En doordat de deelnemende landen en instellingen centrale diensten gebruiken en allemaal dezelfde standaarden gebruiken, worden er veel kosten bespaard.
Voor wie is CLARIN?
CLARIN biedt zijn diensten aan aan:
- taalkundigen: om hun modellen en tools (software) zo aan te passen dat ze alle taalmateriaal aankunnen
- geesteswetenschappers: door de toegang tot taalbronnen en taaltechnologie te vergemakkelijken
- de gemeenschap: door de toegang tot multiculturele en meertalige bronnen te vergemakkelijken
CLARIN-centra
Er bestaan verschillende typen CLARIN-centra: B, C, E en K. Nederland telt vier CLARIN B-centra: het Meertens Instituut, het Huygens ING, het Max Planck Instituut en het Instituut voor de Nederlandse Taal. Voor CLARIN-België vervult het INT ook de rol van CLARIN B-centrum voor Vlaanderen. Het legt contacten met academische instellingen en onderzoeksinstituten daar.
Het INT is eveneens een CLARIN K-centrum, waarbij de K staat voor Knowledge, met de focus op, hoe kan het ook anders, het Nederlands. In die rol biedt het INT zijn kennis over het Nederlands aan niet-Nederlandstalige onderzoekers aan. Zie ook https://kdutch.ivdnt.org/wiki/K-Dutch.
Een CLARIN B-centrum neemt tools en data in beheer en zorgt dat ze beschikbaar zijn of komen voor onderzoek. Om zo’n centrum te worden ondergaat een instelling eerst een assessmentprocedure om een Data Seal of Approval te krijgen. Dat garandeert onder meer dat een CLARIN B-centrum erkende standaarden gebruikt, metadata verschaft en dat alles juridisch en ethisch op orde is.
Behalve CLARIN B-centra zijn er nog andere instituten die binnen CLARIN diensten verlenen, zoals dataproviders (o.a. KB, DBNL en Beeld en Geluid).
Wat doen wij voor onderzoekers?
Via universiteiten en andere onderzoeksinstituten kunnen onderzoekers en studenten via single sign-on inloggen om tools en materialen te gebruiken. Die zijn te vinden via portals. Zo is ook gemakkelijk te ontdekken welk onderzoek er al gedaan is en nog loopt; dat stimuleert (internationale) contacten met collega-onderzoekers.
De portals maken het mogelijk om tools en data online te gebruiken of te downloaden. Onderzoekers kunnen gebruikmaken van een eigen workspace. Bovendien kunnen ze hun eigen onderzoeksdata en -tools na afloop van hun project veilig en duurzaam in de infrastructuur achterlaten. Een belangrijk punt van CLARIN is de garantie dat tools actueel en bruikbaar worden gehouden en materiaal beschikbaar en onderzoekbaar blijft door persistent identifiers.
Meer informatie
Afgeronde CLARIN-projecten
- Presentatie over CLARIN (pdf)
- CLARIN op videolectures.net
- CLARIN ERIC-kanaal op YouTube
- Analysing verb clusters with GrETEL (video)