Teksten opschonen met Taalradar

Taalradar is een crowdsourcingplatform dat het Instituut voor de Nederlandse Taal (INT) ontwikkelt in het kader van een Europees samenwerkingsproject. In het nieuwste Taalradaronderzoek kunt u helpen met het opschonen van onze tekstverzamelingen.

Om het hedendaagse Nederlands te kunnen monitoren legt het INT grote tekstverzamelingen aan, ook wel corpora genoemd. Zo maken we onder andere een corpus van internetpagina's. Zo'n corpus bevat veel informatie over hoe het Nederlands in de praktijk gebruikt wordt, en we kunnen er bijvoorbeeld automatisch voorbeeldzinnen uit halen om te gebruiken in het Algemeen Nederlands Woordenboek (ANW) en voor materialen voor taalleerders. Het nadeel van een verzameling webteksten is dat er ook ongepaste taal (bijv. obsceen taalgebruik) in kan voorkomen. Daarom kunt u in dit nieuwe onderzoek van Taalradar helpen onze tekstverzameling op te schonen, door zinnen met ongepaste taal aan te vinken. Doet u mee?

Leren van taal

Het INT ontwikkelt Taalradar in het kader van het Europese COST-project enetCollect, waarbinnen wordt gekeken naar de mogelijkheden om crowdsourcing in te zetten bij het maken van materiaal voor het leren van taal. Via dit platform vroegen we deelnemers eerder naar het gebruik van blends (mixwoorden zoals preferendum), nieuwe woorden en taalvariatie. Door deze experimenten kunnen we beter in kaart brengen hoe taal in de praktijk wordt gebruikt, om onze taalmaterialen, zoals woordenboeken, te verbeteren.

Op deze website maken wij gebruik van cookies.