Categorieën
Onderzoek & projecten

CLARIN

Het Instituut voor de Nederlandse Taal (INT) maakt als CLARIN B-centrum deel uit van CLARIN (Common Language Resources and Technology Infrastructure). Dit Europese programma biedt een stabiele, permanente, toegankelijke en uitbreidbare onderzoeksinfrastructuur voor geesteswetenschappers. Onderzoekers, docenten en studenten krijgen hiermee toegang tot digitale materialen en tools die relevant zijn voor hun onderzoek.

English version

INT is CLARIN B Centre

As a CLARIN B Centre, the Dutch Language Institute (INT) is part of CLARIN. This European program offers a stable, sustainable, accessible and expandable common infrastructure for research in the humanities. It provides researchers, (assistant) professors and students with the digital materials and tools relevant to their research.

Objective of CLARIN

CLARIN (Common Language Resources and Technology Infrastructure) is building an integrated, interoperable research structure with language sources and language technology. It involves both the software tools and the content: the digital material. The acronym CLARIN stands for ‘Common Language Resources and Technology Infrastructure’.

In 2012, the project was expanded into CLARIN ERIC (‘European Research Infrastructure Consortium’). By now, 19 countries are taking part; the Netherlands has played a key role from the start.

What is a CLARIN B centre?

The Netherlands has four CLARIN B centres: The Meertens Institute, Huygens ING, the Max Planck Institute and the Dutch Language Institute. Through its connection with the Dutch Language Union, the Dutch Language Institute serves as a CLARIN B centre for Flanders.

A CLARIN B centre manages tools and data, and makes them available for research. In order to become such a centre, an organization must first undergo an assessment procedure to obtain a Data Seal of Approval. This guarantees that each CLARIN B centre employs recognized standards, provides metadata, and is legally and ethically sound.

Apart from CLARIN B centres, there are other institutes that provide services within CLARIN ERIC, such as data providers (The National Library of the Netherlands, The Digital Library of Dutch Literature and Beeld en Geluid, among others).

What does a CLARIN B centre do for researchers?

Researchers and students affiliated with universities and other research institutes can log in with single sign-on (SSO) to use tools and materials. These can be found through portals. This also makes it easy to keep track of ongoing and previously conducted research, which stimulates the cultivation of (international) contacts with fellow researchers.

The portals enable the online use or downloading of tools and data. Researchers have the option of using a personal workspace. Moreover, they can safely and sustainably leave their own research data and research tools in the infrastructure upon finishing their project. Crucially, CLARIN ERIC guarantees that tools will be updated, and that materials will remain available and searchable through the use of persistent identifiers.

What are the benefits of CLARIN?

In addition to providing facilities for researchers, the CLARIN ERIC infrastructure is also beneficial to the participating countries and organizations. It transcends fields of study, languages and borders. It puts the languages and cultures of a country on the map. Furthermore, the use of central services and shared standards saves its participants a lot of money.

The Dutch Language Institute’s CLARIN ERIC tools and materials

All tools and materials made available for linguistic research by the Dutch Language Institute can be found in the portal.


More information

Finished CLARIN projects

Applications/products

Het Instituut voor de Nederlandse Taal (INT) maakt als CLARIN B-centrum deel uit van CLARIN. Dit Europese programma biedt een stabiele, permanente, toegankelijke en uitbreidbare onderzoeksinfrastructuur voor geesteswetenschappers. Onderzoekers, docenten en studenten krijgen hiermee toegang tot digitale materialen en tools die relevant zijn voor hun onderzoek.

Doel van CLARIN

CLARIN (‘Common Language Resources and Technology Infrastructure’) bouwt aan een geïntegreerde, interoperabele onderzoeksinfrastructuur met taalbronnen en taaltechnologie. De infrastructuur, die stabiel, permanent, toegankelijk en uitbreidbaar is, moet de bestaande versnippering opheffen en gebruik van computationele technieken in de geesteswetenschappen (Digital Humanities) bevorderen.

  • geïntegreerd: de bronnen- en servicecentra zijn door grid-technologie verbonden en vormen één virtueel, geïntegreerd domein
  • interoperabel: de bronnen en diensten zullen gebruikmaken van de technologie van het semantische web, waarbij verschillen in formaat, structuur en gebruikte terminologie opgeheven zullen worden
  • stabiel: de bronnen en diensten zijn in hoge mate beschikbaar
  • permanent: de bronnen en diensten zullen op lange termijn nog steeds beschikbaar zijn voor onderzoek
  • toegankelijk: de bronnen en diensten zijn op verschillende manieren via het web toegankelijk; daarvoor wordt training aangeboden, aangepast aan de behoeften van de gebruiker
  • uitbreidbaar: de infrastructuur is open voor uitbreiding met nieuwe taalbronnen en diensten

Aan CLARIN nemen inmiddels 21 landen deel; Nederland speelt met vier bij CLARIN betrokken instituten, waaronder het INT, een belangrijke rol als trekker. Zie ook de website van CLARIN zelf.

De maatschappelijke voordelen van CLARIN zijn groot. Deze infrastructuur overschrijdt disciplines, talen en grenzen. Het zet de talen en culturen van een land op de kaart. En doordat de deelnemende landen en instellingen centrale diensten gebruiken en allemaal dezelfde standaarden gebruiken, worden er veel kosten bespaard.

Voor wie is CLARIN?

CLARIN biedt zijn diensten aan aan:

  • taalkundigen: om hun modellen en tools (software) zo aan te passen dat ze alle taalmateriaal aankunnen
  • geesteswetenschappers: door de toegang tot taalbronnen en taaltechnologie te vergemakkelijken
  • de gemeenschap: door de toegang tot multiculturele en meertalige bronnen te vergemakkelijken

INT als CLARIN B-centrum

Er bestaan verschillende typen CLARIN-centra: B, C, E en K. Nederland telt vier CLARIN B-centra: het Meertens Instituut, het Huygens ING, het Max Planck Instituut en het Insituut voor de Nederlandse Taal. Via de Nederlandse Taalunie vervult het INT ook de rol van CLARIN B-centrum voor Vlaanderen. Het legt contacten met academische instellingen en onderzoeksinstituten daar.

Een CLARIN B-centrum neemt tools en data in beheer en zorgt dat ze beschikbaar zijn of komen voor onderzoek. Om zo’n centrum te worden ondergaat een instelling eerst een assessmentprocedure om een Data Seal of Approval te krijgen. Dat garandeert onder meer dat een CLARIN B-centrum erkende standaarden gebruikt, metadata verschaft en dat alles juridisch en ethisch op orde is.

Behalve CLARIN B-centra zijn er nog andere instituten die binnen CLARIN diensten verlenen, zoals dataproviders (o.a. KB, DBNL en Beeld en Geluid).

Wat doen wij voor onderzoekers?

Via universiteiten en andere onderzoeksinstituten kunnen onderzoekers en studenten via single sign-on inloggen om tools en materialen te gebruiken. Die zijn te vinden via portals. Zo is ook gemakkelijk te ontdekken welk onderzoek er al gedaan is en nog loopt; dat stimuleert (internationale) contacten met collega-onderzoekers.

De portals maken het mogelijk om tools en data online te gebruiken of te downloaden. Onderzoekers kunnen gebruikmaken van een eigen workspace. Bovendien kunnen ze hun eigen onderzoeksdata en -tools na afloop van hun project veilig en duurzaam in de infrastructuur achterlaten. Een belangrijk punt van CLARIN is de garantie dat tools actueel en bruikbaar worden gehouden en materiaal beschikbaar en onderzoekbaar blijft door persistent identifiers.