Beschrijving van de woordenschat

Het Instituut voor de Nederlandse Taal beschrijft de woordenschat van het Nederlands op basis van grote hoeveelheden bronnenmateriaal. Voor historische woordenboeken beschrijven de onderzoekers wat in het historische tekstmateriaal zichtbaar is, zonder daar een waardeoordeel aan te hechten. Dat kan ook moeilijk, want in vroeger eeuwen was er geen standaardtaal en waren er al helemaal geen spellingregels. Voor hedendaagse woordenboeken wordt uiteraard beschreven wat er in de bronnen staat, maar worden afwijkingen van de geldende spellingnorm wel expliciet gesignaleerd.

Wat bepaalt de betekenis van woorden?

De betekenis van de woorden wordt bepaald op basis van de context waarin ze voorkomen. Door het materiaal door te nemen, wordt het betekenisprofiel van het betreffende woord duidelijk en kan de redacteur een adequate beschrijving maken. Bij historisch materiaal geldt daarbij als complicatie dat sommige woorden en betekenissen wel bestaan moeten hebben, maar niet zijn overgeleverd, waardoor er hiaten in de beschrijving kunnen ontstaan. Voor hedendaags materiaal geldt dat men continu alert moet zijn op nieuwe betekenissen en gebruikstoepassingen van woorden. Een woordenboek van het hedendaags Nederlands is dus eigenlijk nooit af en moet voortdurend bijgewerkt worden.

Materiaal en selectie

Het materiaal op basis waarvan de woordenboeken worden gemaakt, is een zo divers mogelijke selectie van teksten uit de betreffende periode. Uit oudere periodes is relatief weinig materiaal bewaard gebleven. Voor het Oudnederlands Woordenboek bestaat het materiaal daarom uit alles wat er maar verzameld kon worden. Dat geldt eigenlijk ook voor het Vroegmiddelnederlands Woordenboek. Voor het Woordenboek der Nederlandsche Taal en het Algemeen Nederlands Woordenboek is wel een selectie gemaakt uit het beschikbare materiaal, anders zou het teveel worden. Bij die woordenboeken is geprobeerd om de selectie zo evenwichtig mogelijk te maken, met gelijke aandacht voor woorden uit de literatuur, uit krantenmateriaal, uit vakboeken, enzovoorts.

Beschrijving in clusters

Op basis van dit materiaal, dat een corpus genoemd wordt, wordt een lijst gemaakt met de woorden die voor beschrijving in het woordenboek in aanmerking komen. Het hangt van de omvang van het woordenboek af hoe groot deze lijst uiteindelijk wordt. Met deze lijst gaat de redactie van het woordenboek aan de slag. Vroeger verschenen veel woordenboeken in gedrukte afleveringen en was het noodzakelijk om de woordenschat strikt alfabetisch te bewerken. Door de digitalisering is dat inmiddels niet meer nodig. De relatief kleine woordenboeken van het Oudnederlands en het Vroegmiddelnederlands zijn door de redactie in clusters bewerkt, waarbij verwante woorden gezamenlijk werden beschreven, ook als ze alfabetisch ver uit elkaar staan. Dat is voor de redacteur veel efficiënter en levert voor de gebruiker een veel uniformer resultaat op. Deze aanpak is overgenomen voor het Algemeen Nederlands Woordenboek, waarvan tweemaandelijks een update met nieuw bewerkte woorden verschijnt.

Beschikbaar voor onderzoek

Onderzoekers kunnen zowel onze woordenboeken als corpora gebruiken voor eigen onderzoek. Met de uitgebreide zoekmogelijkheden van de woordenboekapplicaties kan men zelf de meeste onderzoeksvragen stellen. Ook de meeste corpora zijn toegankelijk voor wetenschappelijk onderzoek. Ze bevatten, behalve het tekstmateriaal zelf, over het algemeen ook informatie op diverse niveaus, bijvoorbeeld datering en geografische herkomst van de tekst, aanduiding van woordsoort en morfologische geleding en combinatiemogelijkheden. Niet alle corpora bieden dit in dezelfde mate, maar veel corpora bieden in elk geval meer dan alleen het tekstmateriaal.