Het Instituut voor de Nederlandse Taal ontwikkelt software om onderzoekers efficiënter te laten werken met taalmaterialen. Die software maken we voor de gebruikers zo goed mogelijk toegankelijk.
Het ontwikkelen van zoeksystemen
Voor het toegankelijk maken van taalmaterialen worden zoeksystemen ontwikkeld. Hiermee kan in de woordenboeken gezocht worden, zoals de historische woordenboeken en het Algemeen Nederlands Woordenboek (ANW). Daarnaast hebben we zoeksystemen ontwikkeld om corpora doorzoekbaar te maken. Nieuw is de ontwikkeling van een generieke corpusapplicatie (BlackLab). Die wordt gebruikt in de IMPACT retrieval demonstrator.
We maken elk zoeksysteem zo veelzijdig en snel mogelijk en letten op het gebruiksgemak. Naast het opzoeken van de betekenis van een woord, kan er ook omgekeerd gezocht worden (vanuit de betekenis naar een woord), op datering of naar groepen samenhangende woorden. We brengen ook steeds meer koppelingen aan tussen afzonderlijke materialen, zodat gebruikers efficiënt en overzichtelijk toegang hebben tot de complete dataverzameling van het instituut.
Software voor ondersteuning van onderzoek
Onze software ondersteunt onderzoekers bij hun werkzaamheden. We bieden:
- programma’s voor automatische gegevensinvoer
- programma’s voor het structureren van digitaal taalmateriaal zoals woordenbestanden of corpusbestanden
- programma’s voor het converteren van digitaal taalmateriaal in XML-standaarden zoals TEI, NAF of FoLiA
- programma’s voor controle en correctie van gegevens
- een gespecialiseerde bewerkingsomgeving zoals de ANW-woordenboekeditor
- een Rapid Application Development platform om webgebaseerde omgevingen te ontwikkelen voor het handmatig bewerken van gestructureerde data (Lex’it)
Het doel is altijd om zoveel mogelijk bewerkelijke, tijdrovende klussen te automatiseren. In de meeste gevallen worden de automatisch gegenereerde data nog handmatig gecontroleerd. Dat verhoogt de kwaliteit.