Softwareontwikkeling

English

Softwareontwikkeling

Wat doen wij op dit gebied?

Het Instituut voor de Nederlandse Taal ontwikkelt software om onderzoekers efficiënter te laten werken met taalmaterialen en de resultaten zo toegankelijk mogelijk aan eindgebruikers aan te bieden.

Het ontwikkelen van zoeksystemen

Voor het toegankelijk maken van taalmaterialen worden zoeksystemen ontwikkeld. Hiermee kan in de woordenboeken gezocht worden, zoals de Historische woordenboeken en het Algemeen Nederlands Woordenboek (ANW). Daarnaast hebben wij zoeksystemen ontwikkeld om corpora doorzoekbaar te maken. Nieuw is de ontwikkeling van een generieke corpusapplicatie (BlackLab). Deze wordt gebruikt in de IMPACT retrieval demonstrator. Bij het ontwikkelen van zoeksystemen worden veelzijdigheid, gebruiksgemak en snelheid nagestreefd. Naast het opzoeken van de betekenis van een woord, kan er ook omgekeerd gezocht worden (vanuit de betekenis naar een woord), op datering of naar groepen samenhangende woorden. Ook wordt in toenemende mate gewerkt om de afzonderlijke materialen aan elkaar te koppelen, zodat gebruikers efficiënt en overzichtelijk toegang hebben tot de complete dataverzameling van het instituut.

Software voor ondersteuning van onderzoek

Software voor de ondersteuning van de werkzaamheden van de onderzoekers neemt vele vormen aan:

  • programma’s voor automatische gegevensinvoer
  • programma's voor het structureren van digitaal taalmateriaal zoals woordenbestanden of corpusbestanden
  • programma's voor het converteren van digitaal taalmateriaal in XML-standaarden als bijvoorbeeld TEI
  • programma’s voor controle en correctie van gegevens
  • een gespecialiseerde bewerkingsomgeving zoals de ANW-woordenboekeditor.

Doel is altijd om zo veel mogelijk bewerkelijke klussen te automatiseren. Doorgaans wordt de automatisch gegenereerde data nog handmatig gecontroleerd. Die controle dient de kwaliteit.

 

Software development

What do we do in this field?

The Dutch Language Institute develops software that enables researchers to work with language materials more efficiently, and makes the results easily accessible to end users.

The development of search engines

In order to make language materials accessible, search engines are designed. They can be used to search the dictionaries, such as the Historical Dictionaries and the ANW, or to make corpora searchable. The development of a generic corpus application (BlackLab) is a novelty. It is used in the IMPACT retrieval demonstrator. Versatility, ease of use and speed are key in the development of our search engines. Apart from looking up the meaning of a word, a reverse search (from meaning to word) is also possible, as well as searching by date or for groups of related words. We are also actively working on ways to connect the separate materials, to provide users with efficient and well-organized access to the institute's full data collection.

Software to support research

Software to support researchers' work comes in many forms:

  • programs for automatic data entry
  • programs for structuring digital language material such as word files or corpus files
  • programs for converting digital language material into XML standards such as TEI
  • programs for checking and correcting data
  • a specialized editing environment like the ANW dictionary editor

The goal is always to automatize as many labour-intensive tasks as possible. The automatically generated data will typically also be manually checked. The additional checkup serves to improve quality.

Op deze website maken wij gebruik van cookies.