Het Instituut voor de Nederlandse Taal (INT) beschrijft de woordenschat van het Nederlands op basis van grote hoeveelheden bronnenmateriaal. Voor historische woordenboeken beschrijven de onderzoekers wat in het historische tekstmateriaal zichtbaar is. Dat gebeurt op een andere manier dan de beschrijving van de hedendaagse woordenschat, omdat er in vroeger eeuwen nog geen standaardtaal was en er nog geen officiële spellingregels waren. Voor hedendaagse woordenboeken wordt uiteraard ook beschreven wat er in de bronnen staat, maar wordt de officiële spelling volgens het Groene Boekje gevolgd en worden eventuele afwijkingen van de geldende spellingnorm wel expliciet gesignaleerd.
Wat bepaalt de betekenis van woorden?
De betekenis van woorden wordt bepaald op basis van de context waarin ze voorkomen. Door het gebruik van een bepaald woord in allerlei contexten te onderzoeken wordt het betekenisprofiel van dat woord duidelijk en kan een woordenboekredacteur een adequate beschrijving van dat woord maken. Een complicatie bij het bestuderen van historische teksten is dat je weet dat bepaalde woorden en betekenissen wel bestaan moeten hebben, maar dat die niet zijn overgeleverd in het beschikbare materiaal, waardoor de betekenisbeschrijvingen dus niet compleet zijn.
Voor hedendaags materiaal geldt dat je continu alert moet zijn op nieuwe betekenissen en gebruiksmogelijkheden van woorden. Een woordenboek van het hedendaags Nederlands is dus eigenlijk nooit af en moet voortdurend bijgewerkt worden.
Materiaal en selectie
Het materiaal op basis waarvan de woordenboeken worden gemaakt is een zo divers mogelijke selectie van teksten uit de periode die het woordenboek beschrijft. Uit oudere periodes zijn relatief weinig teksten bewaard gebleven. Voor het Oudnederlands Woordenboek (ONW) en het Vroegmiddelnederlands Woordenboek (VMNW) bestaat het materiaal daarom uit alles wat er maar verzameld kon worden. Voor het Woordenboek der Nederlandsche Taal (WNT) en het Algemeen Nederlands Woordenboek (ANW) is er wel een selectie gemaakt uit de beschikbare bronnen, omdat er heel veel teksten beschikbaar waren. Bij die woordenboeken is geprobeerd om de selectie zo evenwichtig mogelijk te maken, met gelijke aandacht voor teksten uit de literatuur, uit kranten, uit vakboeken, enz.
Beschrijving in clusters
Op basis van deze verzameling teksten, die een corpus genoemd wordt, wordt een lijst gemaakt met de woorden die voor beschrijving in het woordenboek in aanmerking komen. Het hangt van de omvang van het woordenboek af hoe groot deze lijst uiteindelijk wordt. Met deze lijst gaat de redactie van het woordenboek aan de slag. Vroeger verschenen veel woordenboeken in gedrukte afleveringen en was het noodzakelijk om de woordenschat strikt alfabetisch te bewerken. Door de digitalisering is dat inmiddels niet meer nodig. De relatief kleine woordenboeken van het Oudnederlands en het Vroegmiddelnederlands zijn door de redactie in clusters bewerkt, waarbij verwante woorden gezamenlijk werden beschreven, ook als ze alfabetisch ver uit elkaar staan. Dat is voor de redacteur veel efficiënter en deze werkwijze levert voor de gebruiker een uniformer resultaat op. Deze aanpak is overgenomen voor het Algemeen Nederlands Woordenboek, waarvan dagelijks een update met nieuw toegevoegde woorden verschijnt.
Beschikbaar voor onderzoek
Onderzoekers kunnen zowel onze woordenboeken als corpora gebruiken voor eigen onderzoek. Met de uitgebreide zoekmogelijkheden van de woordenboekapplicaties kan men zelf de meeste onderzoeksvragen stellen. Ook de meeste corpora zijn toegankelijk voor wetenschappelijk onderzoek. Bovendien bevatten de corpora behalve het tekstmateriaal zelf over het algemeen ook nog andere informatie, bijvoorbeeld datering en geografische herkomst van de tekst, aanduiding van woordsoort en combinatiemogelijkheden van het trefwoord.