Softwareontwikkeling

Wat doen wij op dit gebied?

Het Instituut voor de Nederlandse Taal ontwikkelt software om onderzoekers efficiënter te laten werken met taalmaterialen en de resultaten zo toegankelijk mogelijk aan eindgebruikers aan te bieden.

Het ontwikkelen van zoeksystemen

Voor het toegankelijk maken van taalmaterialen worden zoeksystemen ontwikkeld. Hiermee kan in de woordenboeken gezocht worden, zoals de Historische woordenboeken en het Algemeen Nederlands Woordenboek (ANW). Daarnaast hebben wij zoeksystemen ontwikkeld om corpora doorzoekbaar te maken. Nieuw is de ontwikkeling van een generieke corpusapplicatie (BlackLab). Deze wordt gebruikt in de IMPACT retrieval demonstrator. Bij het ontwikkelen van zoeksystemen worden veelzijdigheid, gebruiksgemak en snelheid nagestreefd. Naast het opzoeken van de betekenis van een woord, kan er ook omgekeerd gezocht worden (vanuit de betekenis naar een woord), op datering of naar groepen samenhangende woorden. Ook wordt in toenemende mate gewerkt om de afzonderlijke materialen aan elkaar te koppelen, zodat gebruikers efficiënt en overzichtelijk toegang hebben tot de complete dataverzameling van het instituut.

Software voor ondersteuning van onderzoek

Software voor de ondersteuning van de werkzaamheden van de onderzoekers neemt vele vormen aan:

  • programma’s voor automatische gegevensinvoer
  • programma's voor het structureren van digitaal taalmateriaal zoals woordenbestanden of corpusbestanden
  • programma's voor het converteren van digitaal taalmateriaal in XML-standaarden als bijvoorbeeld TEI
  • programma’s voor controle en correctie van gegevens
  • een gespecialiseerde bewerkingsomgeving zoals de ANW-woordenboekeditor.

Doel is altijd om zo veel mogelijk bewerkelijke klussen te automatiseren. Doorgaans wordt de automatisch gegenereerde data nog handmatig gecontroleerd. Die controle dient de kwaliteit.