Methodologie van de woordenboekrecensie

De methodologie van de woordenboekrecensie*
door Jaap Bakker

Omdat mensen weten dat ik 'iets met taal heb', word ik af en toe aangeklampt met de vraag 'Wat is nu een goed woordenboek?'

Tot voor kort mompelde ik maar iets in de geest van 'enerzijds-anderzijds', want een afdoende antwoord had ik niet paraat. In de loop van de jaren heb ik heel wat woordenboeken gerecenseerd, ja zelfs gebruikt, en ik houd er zo mijn privé-meningen op na, maar wat zijn die waard voor iemand die allicht heel andere eisen stelt dan ik? Behalve de oeroude wijsheid dat woordenboeken beter zijn naarmate ze meer kosten, had ik mijn raadvragers weinig te bieden. Ik kon bijvoorbeeld geen verstandig woord zeggen over de krachtsverhoudingen tussen gelijkgeprijsde uitgaven, of tussen de grote handwoordenboeken en hun editio minor.

Het verzoek van het maandblad Onze Taal om de Nederlandse verklarende woordenboeken eens aan een vergelijkend onderzoek te onderwerpen, was dan ook een gerede aanleiding om mijn eigen weetgierigheid te bevredigen. Het onderzoek mondde uit in een serie van drie artikelen die onder de titel 'De woordenboekentest' zijn verschenen in juni 1992, oktober 1992 en januari 1993.

Ik heb een testmethode uitgedacht die zo objectief en controleerbaar mogelijk zou zijn, en die duidelijk zou kunnen aangeven welk boek voor welk soort gebruiker de voorkeur verdient. Voor de presentatie van de uitslagen heb ik een consumentenbondachtige stijl gekozen: de waardering werd uitgedrukt in schoolcijfers, aangevuld met een beknopt commentaar.

Op die manier heb ik alle vorig jaar verkrijgbare woordenboeken in de prijsklasse boven ca. ƒ 20,-- onderzocht,1 uitgezonderd het Nieuw handwoordenboek Nederlands van Van Dale, dat volgens de uitgever binnenkort uit de roulatie zal worden genomen.

In dit artikel zal ik uiteenzetten hoe ik de woordenboekentest heb uitgevoerd, waarop ik zoal heb gelet en welke problemen zich voordeden.

KWANTITATIEVE ASPECTEN
Ik begon altijd met tellen. De consument wil tenslotte weten hoeveel waar hij voor z'n geld krijgt. Niet alle woordenboeken geven aan hoeveel woorden ze bevatten, en waar dat wel gebeurt is enige argwaan op z'n plaats. Mijn ervaring met rijmwoordenboeken heeft me geleerd dat uitgevers geneigd zijn nogal fors naar boven af te ronden.

Een eigen telling was dus de enige manier om aan betrouwbare en vergelijkbare informatie te komen. Ik gebruik altijd dezelfde methode, namelijk deze:

Om te beginnen bepaal ik het netto aantal pagina's. Netto betekent dat voor- en nawerk niet meetellen, evenmin als de blanco paginadelen aan het eind van iedere letter; dat komt meestal neer op aftrekking van 13 (26 x gemiddeld 1/2) pagina's.

[5]Daarna bepaal ik het gemiddeld aantal trefwoorden per bladzijde door van iedere twintigste pagina het aantal lemma's in de rechter kolom te tellen. Deze steekproef van 2,5 procent (bij twee kolommen per bladzijde) levert een gemiddelde op, dat wordt vermenigvuldigd met het zoëven gevonden netto aantal pagina's.

Verwijslemma's tellen mee, want ze bevatten informatie. Dubbele trefwoorden (bijv. Hindostaan, Hindoestaan) tellen dubbel als het tweede woord geen eigen ingang heeft. Verstopte woorden (bijvoorbeeld enfant terrible in het artikel enfant) tellen niet mee, want een trefwoord moet typografisch als zodanig herkenbaar zijn.

Ik maak ook altijd een schatting van het aantal tekens (letters, cijfers, leestekens, spaties), omdat dat een betere maat is voor het informatiegehalte van een lexicon dan het aantal trefwoorden.

Een methode om snel en vrij nauwkeurig het aantal tekens te bepalen is deze:

a) Tel van 20 lukraak gekozen volle regels het aantal tekens, en bepaal het gemiddelde.

b) Tel het aantal tekens in de kortste onvolledige regel die u vinden kunt. Tel dit getal op bij getal a en deel door 2. De uitkomst b is het gemiddeld aantal tekens per onvolledige regel.

c) Tel van 100 lukraak gekozen kolommen het aantal onvolledige regels en bepaal het gemiddeld aantal onvolledige regels per kolom.

d) Bepaal het aantal regels per kolom, trek daar getal c van af en noteer het gemiddeld aantal volle regels per kolom. Het aantal tekens bedraagt: [(a x d) + (b x c)] x 2 x aantal pagina's.

Als de woordenboeken het aantal tekens vermeldden kwamen ze doorgaans wat hoger uit dan ik, waarschijnlijk doordat ook de zetcodes zijn meegeteld.

Het opgegeven aantal trefwoorden was meestal iets lager dan mijn schatting. Men kan de woordenboekuitgevers dus niet van overdrijfzucht betichten, althans niet in dit opzicht.

Toch levert systematisch tellen af en toe wel een nieuwswaardig feit op, bijvoorbeeld dat het aantal encyclopedische ingangen in Verschueren niet 50.000 maar 22.000 bedraagt, of dat er in de nieuwe Grote Van Dale niet 0 maar 18.000 woorden zijn geschrapt.

COMPLEETHEID
Getallen zijn interessant, maar de eigenschap waar je als woordenboekbeoordelaar vooral nieuwsgierig naar bent is compleetheid: de mate waarin het boek doordringt in de periferie van de woordenschat.

Om daar achter te komen zou je in principe allerlei subcategorieën kunnen onderzoeken, bijvoorbeeld 'informele woorden' of 'economische termen'.

Ik heb gekozen voor de subcategorieën 'nieuwste woorden', omdat iedereen daar altijd nieuwsgierig naar is, en 'oudste woorden' omdat iedereen daar veel te weinig nieuwsgierig naar is. Ervan uitgaande dat de belangstellingshorizon van de woordenboekgebruiker niet ophoudt bij de krant van gisteren, is het even belangrijk om bekkeneel te kunnen vinden als backing vocals.

Om de compleetheid te testen heb ik gebruikgemaakt van twee lijsten, elk bestaande uit honderd onafhankelijk (buiten enig woordenboek om) verzamelde woorden waarvan mocht worden aangenomen dat een gebruiker die zou willen opzoeken.

Het opstellen van die lijsten was een aardige en niet al te tijdrovende klus. Een paar dagen ogen en oren openzetten leverde al gauw 100 moderne woorden op. Evenveel ouderwetse uitdrukkingen verzamelde ik door een paar uur te bladeren in een bloemlezing van Tachtigers-poëzie, de verklarende woordenlijst van een Max Havelaar-editie, en De Tale Kanaäns, een woordenboek van bijbelse termen.

Daarna was het een kwestie van opzoeken en turven.

INTERMEZZO: NORMERING
Nu doet zich voor het eerst een principiële vraag voor: welke norm moet worden gehanteerd? Ik had al snel besloten dat een absolute norm niet fair zou zijn: je kunt het een woordenboek moeilijk aanrekenen dat het woorden mist die nergens anders voorkomen.

Zo kwam ik uit bij een relatieve normering, met als referentie het aantal woorden dat door een collectief van lexica wordt beschreven.

Omdat ik de woordenboekentest in het verloop van een half jaar heb uitgevoerd en aanvankelijk nog niet alle boeken ter beschikking had, heb ik het volgende kwartet als ijkverzameling genomen:

Van mijn 100 'nieuwste woorden' stonden er 70 in één of meer van dit viertal. Dat geeft voor bijv. Verschueren, die er 38 had, een score van 38/70. De referentiewaarde voor de 'oudste woorden' was 90.

[6]Methodologisch was het fraaier geweest om de ijkverzameling te laten bestaan uit álle onderzochte woordenboeken. Met de verschijning van de Grote Van Dale 12 en Koenen 29 zijn de referentiewaarden (m.n. voor de 'nieuwste woorden') aanzienlijk opgeschroefd, maar ik kon moeilijk de eerder gepubliceerde cijfers met terugwerkende kracht verlagen.

Hierbij vindt u de beide lijsten. De hekjes geven aan welke woorden op dit moment nog nergens zijn beschreven. U kunt eruit afleiden dat de norm voor 'nieuwste woorden' inmiddels bij 83 ligt. De norm voor 'oudste woorden' is gestegen naar 91 doordat Kramers het woord achitofelsraad bleek te kennen.

Voor de presentatie van de scores had ik percentages, staafdiagrammen of een sterrensysteem kunnen gebruiken, maar ik heb de voorkeur gegeven aan schoolcijfers. Die hebben het voordeel dat iedereen ze gemakkelijk kan interpreteren. Door gebruik te maken van halven, plussen en minnen verkreeg ik een veertigpuntsschaal die voor mijn doel voldoende nauwkeurig was.

KWALITATIEVE ASPECTEN
Uit de tot nu toe beschreven deelonderzoeken is nog niet af te leiden hoe goed een woordenboek is. Daarvoor moet er toch echt gelezen worden.

Er zijn een paar manieren om woordenboeken kwalitatief te vergelijken. Als we het onsystematische grasduinen even terzijde laten, blijven er twee manieren over:

1) Een aantal willekeurige kolommen woord voor woord vergelijken;

2) Werken met een testbatterij: Van te voren een lijst met interessante woorden opstellen en die in alle woordenboeken opzoeken.

De eerste methode, die ik in het verleden enkele malen heb gebruikt, brengt de systematiek van de lexicograaf goed aan het licht. De werkwijze brengt met zich mee dat er relatief veel oninteressante lemma's in de vergelijking [7] worden betrokken, lemma's die veelal zo kort zijn dat stijl- en kwaliteitsverschillen niet uit de verf komen. Er ontstaat een beeld met veel grijstinten en weinig contrast. Dat vond ik een bezwaar, want de hele exercitie had immers tot doel de consument zo 'contrastrijk' mogelijk voor te lichten.

Nog een overweging was, dat diezelfde consument zelden een hele kolom leest, maar meestal gericht zoekt naar woorden waarover hij iets weten wil. Vandaar de keus voor de tweede methode, die het werkelijke gebruik veel beter nabootst.

Ik heb een testbatterij opgesteld met 100 heel verschillende woorden, waarover uiteenlopende vragen zouden zijn te stellen. De betreffende 100 artikelen heb ik vervolgens vergeleken.

Er valt nogal wat te vergelijken als je honderd artikelen in acht woordenboeken bestudeert. Ik heb een rubricering aangebracht die stoelt op de gedachte dat het woordenboek steun biedt bij twee soorten taalgebruik: passief (lezen, luisteren) en actief (spreken, schrijven, redigeren).

Aan beide soorten taalgebruik heb ik twee rubrieken gekoppeld, op de volgende manier:

Passief:

Actief:

Deze vier beoordelingsrubrieken zal ik hieronder behandelen.

DIEPGANG
De passieve taalgebruiker, zo redeneerde ik, kan een woord in allerlei contexten tegenkomen: in kranten, op televisie, in specialistische publikaties, in straattaal, in ironische stijl, in historische lectuur, in Vlaamse teksten. Van de context hangt de betekenis af, die vervolgens nog kan worden gemodificeerd door woorden waarmee vaste verbindingen worden gevormd. Etnisch heeft in verbinding met onlusten een specifieke betekenis, net als koesteren in verbinding met argwaan.

Het woordenboek honoreert deze betekenisverschillen door een trefwoord op te splitsen in deelbetekenissen, en binnen die indeling de relevante verbindingen te behandelen. Tot die verbindingen reken ik overigens ook voorbeeldzinnen (op te vatten als 'niet-vaste verbindingen') en zegswijzen.

De mate waarin een lexicon deelbetekenissen en verbindingen geeft, wordt uitgedrukt door het begrip 'diepgang'. Die term vond ik ruim genoeg om er nog een ander, voor de passieve taalgebruiker relevant aspect bij onder te brengen, namelijk de hoeveelheid etymologische en encyclopedische achtergrondinformatie.

De hoedanigheid 'diepgang' liet zich eenvoudig kwantificeren door telling van het aantal deelbetekenissen en verbindingen. Verwijzingen, bijv. naar een spreekwoordenlijst of een ander artikel, telden uiteraard mee.

[8]De achtergrondinformatie werd gekwantificeerd door het aantal 'informatieve elementen' te tellen, bijv. zo:

lemma [Gr.* 'inkomen'* <LAMBANEIN*, -- nemen*>'wat genomen wordt'*]

Dit zijn 5 etymologische elementen.

Freudiaans = in de trant van Freud [grondvester* vd psychoanalyse* (1856 - 1939)*]

Dit zijn 3 encyclopedische elementen.

Het cijfer voor 'diepgang' werd afgeleid van de scores voor:

a) Het aantal deelbetekenissen (2x)

b) Het totale aantal verbindingen, zegswijzen, voorbeeldzinnen en verwijzingen (1x)

c) Het aantal etymologische en encyclopedische gegevens (1x)

Verderop laat ik zien hoe de gevonden getallen worden omgezet in een eindcijfer.

BETEKENISVERKLARING
Buitengewoon belangrijk, vooral voor de passieve taalgebruiker, is de kwaliteit van de woordenboekdefinities. Om dit aspect in een cijfer te vangen, heb ik in alle artikelen de 'uitlegelementen' geteld. Uitlegelementen zijn eenheden van informatie, zoals te zien is in dit voorbeeld (uit Koenen):

waterhoofdo —en

Door overmatige* produktie* van hersenvocht* opgezet* hoofd, inz. groot* kinder*hoofd.

@ een organisatie met een -: met een in verhouding* te grote* staf*

De primaire definitie bevat zes uitlegelementen. 'Overmatige produktie' zou je kunnen herschrijven tot 'overproduktie' en dan éénmaal tellen; maar hier is zowel de notie dat het vocht überhaupt geproduceerd wordt, als de 'overmatigheid' ervan relevant. 'Hoofd' telt niet mee, omdat dit al een element van het titelwoord is en uit de context duidelijk wordt dat er geen 'pier' of 'chef' wordt bedoeld. Om dezelfde reden telt 'kinderhoofd' (hoofd van een kind) maar één keer.

Verbindingen (@) worden aan dezelfde analyse onderworpen. De omschrijving telt drie uitlegelementen. 'In verhouding' telt mee, want het is een zinvolle toevoeging. De lexicograaf had nog een extra puntje kunnen verdienen door te benoemen in verhouding tot wát die staf te groot is.

In deze rubriek heb ik opnieuw het aantal voorbeeldzinnen laten meewegen. Ik hecht daar grote waarde aan: vooral bij de uitleg van moeilijke woorden is de voorbeeldzin een onovertroffen uitlegmiddel.

Ten slotte turfde ik de redactionele toelichtingen en analytische labels zoals [fig.], [vandaar], [als stofnaam onz.], [eig. ten onrechte], omdat die de betekenisstructuur verhelderen.

Het cijfer voor 'betekenisverklaring' is het gewogen gemiddelde van de cijfers voor:

a) Het gemiddeld aantal uitlegelementen per deelbetekenis (4x)

b) Het gemiddeld aantal uitlegelementen per verbinding (2x)

c) Het aantal voorbeeldzinnen (1x)

d) Het aantal redactionele toelichtingen en analytische labels (1x)

INTERMEZZO: VAN SCORE NAAR CIJFER

De analyse van 100 lemma's levert rijen getallen op, die moeten worden omgezet in een waarderingscijfer. Ik zal aan de hand van een praktijkvoorbeeld laten zien hoe dat gaat.

We nemen de getallen die betrekking hebben op het onderdeel 'diepgang' van Van Dale 11, Verschueren, Grote Koenen en Grote NN.

GVD Versch. Gr.Koe. Gr.NN

a) Deelbet.206171167163

b) Verbind.456350267175

c) Ety./enc.69 217 1405

De hoogste score voor ieder deelaspect - hierboven onderstreept - correspondeert met het cijfer 10. De rest wordt daaraan afgemeten.

Het eindcijfer is het gewogen gemiddelde van de deelcijfers, afgerond naar het dichtstbijzijnde veelvoud van 0,25. U ziet dat hier gedemonstreerd (de wegingsfactoren staan tussen haakjes):

GVDVersch. Gr.Koe Gr.NN

a) Deelbet. (x2)10,00 8,308,11 7,91

b) Verbind. (x1)10,00 7,685,85 3,84

c) Ety./enc. (x1) 3,18 10,006,45 0,23

Gewogen gemidd. 8,298,577,13 4,98

Eindcijfer 8 + 8 ½ 7 + 5

[9]Bij dit onderdeel kwam ik trouwens lelijk met mijn ijking in de knoop. Toen de nieuwe druk van de Grote Van Dale verscheen, bleek deze juist op het punt 'diepgang' fors te zijn uitgebreid (237 deelbetekenissen, 460 verbindingen, 301 etymologische en encyclopedische elementen). Dat dwong me om met cijfers boven de 10 te gaan werken en zo mijn eigen systematiek te doorkruisen. Anderzijds onderstreept zo'n raar cijfer (het was een 12 -) wel de betrekkelijkheid van het systeem. Ik heb er dus niet lang van wakker gelegen.

Hoe zijn de wegingsfactoren tot stand gekomen? In de eerste plaats op basis van intuïtie en gezond verstand. In de rubriek 'diepgang', bijvoorbeeld, vond ik dat het aantal deelbetekenissen het zwaarst moest wegen. Het is belangrijker te kunnen lezen dat kwakkel behalve 'kwartel' in België ook 'canard' kan betekenen, dan dat de verbinding 'zo doof als een kwakkel' wordt vermeld, of dat het etymologische verband met (Me.Lat.) quaccola wordt gelegd.

Ten tweede waren er statistische overwegingen. Deelcijfers die berusten op een gering aantal waarnemingen (bijv. het aantal voorbeeldzinnen) mogen niet te zwaar meewegen, al was het maar omdat het toeval een betrekkelijk grote rol speelt. Een steekproef van 100 woorden is voor zulke gevallen aan de kleine kant.

Ten derde heb ik getracht de redelijkheid in het oog te houden. Ik heb erover gedacht om in de bovenbeschreven rubriek 'diepgang' de drie deelcijfers even zwaar te laten wegen, maar dan zouden de woordenboeken die - wellicht op goede gronden - weinig etymologische en encyclopedische informatie geven, onevenredig laag worden becijferd. De Grote NN zou bijvoorbeeld op een eindcijfer 4 uitkomen. Dat werd me een beetje te gortig, al vind ik persoonlijk die Grote NN, afgemeten naar z'n pretenties, een stuitend oppervlakkig produkt. Maar ja, in de rol van objectief beoordelaar kon ik me niet te veel door m'n antipathieën laten meeslepen.

HULP BIJ ACTIEF TAALGEBRUIK
Onontbeerlijk voor spreker en schrijver zijn de grammaticale basisgegevens (geslacht, meervoud, trappen van vergelijking, stamtijden enz.). Steun wordt ook ontleend aan grammaticale labels, zoals [overg.]; stijllabels, zoals [schrijft.], [vulg.]; gebruikssfeerlabels, zoals [Z.N.], [econ.], [muz.]; en normatieve opmerkingen, bijvoorbeeld dat eerstens een germanisme is en georven een onofficiële woordvorm.

Voor de stilist is ook het aantal vaste verbindingen van groot belang, vandaar dat ik dit aspect hier ten tweeden male heb laten meewegen.

Het cijfer is het gewogen gemiddelde van de cijfers voor:

a) Het aantal grammaticale gegevens (3x)

b) Het gemiddeld aantal verbindingen per deelbetekenis (2x)

c) Het aantal grammaticale, stijl- en gebruikssfeerlabels (1x)

d) De mate waarin afbreekpunten worden aangegeven (1x)

e) Hoeveelheid en kwaliteit van de uitspraakinformatie (1x)

f) Het aantal opgegeven synoniemen en antoniemen (1x)

g) De mate van normatieve steun (1x)

De deelcijfers berusten merendeels op tellingen. Zo ook punt e), maar daarbij heb ik tevens de noodzaak van de uitspraakaanwijzingen meegewogen. Een woordenboek kan tot een hoge score komen door bij iedere intervocalische s te vermelden [s = z] en bij ieder woord op -atie [aa(t)sie]. In zulke gevallen heb ik een correctie van minus 1/4 punt toegepast.

Ook van belang is het realiteitsgehalte: de mate waarin van vreemde woorden de in Nederland gebruikelijke uitspraak wordt weergeven. Een aanvaardbaar realiteitsgehalte levert 1/4 punt op. Koenen bijvoorbeeld is dat kwartje misgelopen omdat hij van alle Engelse woorden alleen de oorspronkelijke uitspraak vermeldt.

Punt d) werd gewoon met het timmersmansoog bepaald.

Punt g) heb ik onderzocht met een testbatterijtje van 30 bekende neologismen en barbarismen (georven, koffie maken, frontpagina, eerstens, grootstad e.d.). Het aantal waarschuwende labels werd geteld en omgezet in een score 0 - 1/4 - 1/2 - 3/4 - 1. Ik heb niet veel hoge scores genoteerd; op het punt van normatieve steun laten de meeste woordenboeken hun publiek lelijk in de steek.

Het valt u misschien op dat één aspect ontbreekt: de spelling. Ik heb hier geen subrubriek van gemaakt omdat ik geen grote fouten of opmerkelijke verschillen tussen de woordenboeken verwachtte. Die heb ik ook inderdaad niet waargenomen.

GEBRUIKERSVRIENDELIJKHEID
Gebruikersvriendelijkheid is voor zowel passieve als actieve taalgebruikers van belang, maar ik heb deze hoedanigheid bij de tweede categorie ondergebracht in de veronderstelling dat actieve taalgebruikers ongeduldiger zijn dan passieve, en daarom [10] hogere eisen stellen aan de toegankelijkheid en de hanteerbaarheid van hun naslagwerk.

Er was te meer reden om hier een aparte rubriek van te maken omdat die gebruikersvriendelijkheid één van de belangrijkste wapens is geworden in de concurrentieslag tussen woordenboekuitgevers.

Ik heb, geheel op eigen gezag, de volgende tien criteria (à 1 punt) voor een optimaal gebruikersvriendelijk woordenboek vastgesteld.

1. Alle trefwoorden zijn volledig uitgeschreven;

2. Alle trefwoorden staan aan het begin van een regel;

3. Vet, cursief en typografische tekens worden adequaat gebruikt;

4. Alle deelbetekenissen zijn duidelijk gemarkeerd;

5. Verbindingen, zegswijzen enz. zijn duidelijk gemarkeerd;

6. Lijsten van afkortingen, symbolen enz. staan zo dicht mogelijk bij de omslag;

7. De artikelen staan in strikt alfabetische volgorde en zijn logisch ingedeeld: bij elkaar horende gegevens stáán ook bij elkaar;

8. De klemtoon wordt aangeduid door onderstreping o.i.d. (1/2), en de uitspraak wordt weergegeven in gewone lettertekens (1/2);

9. Het boek bevat zo weinig mogelijk verwijzingen (1/2) en zo veel mogelijk extraatjes als spellingregels, titulatuur, plaatjes of een grammaticaal compendium (1/2);

10. Het boek heeft geen stofomslag (1/2) en geen dichtklapneiging (1/2).

De score werd geheel op het oog bepaald, en per item uitgedrukt in de waardering 0 - 1/4 - 1/2 - 3/4 of 1. Voortdurend legde ik twee of meer uitgaven naast elkaar om tot een zo eerlijk mogelijke becijfering te komen.

INTERMEZZO: HOE MEER HOE BETER?
Het beoordelingssyssteem is gebaseerd op de gedachte dat de kwaliteit van een woordenboek kan worden bepaald met behulp van tellingen: hoeveelheid uitlegelementen, grammaticale gegevens, labels enz. Is het uitgangspunt 'hoe meer, hoe beter' altijd juist?

Niet altijd, maar in de grote meerderheid der gevallen wel. Ook een bij uitstek kwalitatief begrip als betekenisverklaring kan heel goed op een kwantitatieve manier worden benaderd. Naar mijn ervaring is de uitvoerigste omschrijving bijna altijd ook de beste. Als een definitie onduidelijk of onvolledig is, ligt dat vrijwel nooit aan de woordkeus, maar aan een te gering aantal 'informatieve elementen'. Korte omschrijvingen, bijvoorbeeld 'gespletenheid van geest' voor schizofrenie, hebben het voordeel dat ze zich gemakkelijk laten onthouden en citeren. Maar wat heb je eraan, een karikaturaal vervormde samenvatting van de werkelijke betekenis te onthouden? De meeste korte definities (reclamejongens zeggen 'pittig' of 'bondig') zijn in wezen nietszeggend en ongenuanceerd.

Bij de telling van uitlegelementen heb ik overigens niet alles voor zoete koek geslikt. Elementen die ik onprecies, onnodig moeilijk of fout vond heb ik niet meegeteld. Een paar voorbeelden daarvan:

naar (vz.) 'in de richting van' (onprecies)

beroerte 'hersenbloeding' (onprecies)

kwezel (o.a.) 'lijmepoep' (het uitlegwoord is onbekender dan het uitgelegde woord)

redactie (o.a.) 'het redigeren' (idem)

buddy'vaste vriend van een homofiel' (fout)

waterhoofd (o.a.) hersenwaterzucht (fout)

Het adagium 'hoe meer, hoe beter' geldt ook voor de beoordeling van 'hulp bij actief taalgebruik'. Als bij kwezel wordt aangegeven (v./m.) dan telt die toevoeging dubbel, omdat zij informatiever is dan alleen (v.) of (m.) of (de -). De aanduiding (b.n., bijw.) bij freudiaans is informatiever dan alleen (b.n.), want niet alle bijvoeglijke naamwoorden worden als bijwoord gebruikt. Evenzo is een woordenboek een betere schrijfhulp naarmate het uitvoeriger melding maakt van trappen van vergelijking, meervouden en diminutieven. De paar keer in je leven dat je het woordenboek met dat soort grammaticale vragen opslaat wil je toch wel graag een antwoord.

Het kwam een enkele keer voor dat een uitgave door de cijfers onvoldoende recht werd gedaan. In die gevallen heb ik dat in het testrapport verbaal gecompenseerd. Er zijn bijvoorbeeld lexica die betrekkelijk lage cijfers halen maar toch blijk geven van ijver, virtuositeit en inlevingsvermogen. Dit soort imponderabilia heb ik tot uitdrukking gebracht in het commentaar bij de cijfers. Zo is het rapport over het Prisma-woordenboek van Abeling veel positiever getoonzet dan dat over de Kleine NN, hoewel beide woordenboeken een vergelijkbaar cijfergemiddelde hebben.

[11]TOT SLOT
Ik geloof niet dat mijn methodiek echt wetenschappelijk kan worden genoemd. Wetenschappelijkheid was ook allerminst mijn voornaamste doel; ik wilde leesbare onderzoeksrapporten schrijven die niet noodzakelijk neutraal van toon zouden hoeven te zijn.

Wetenschappelijke trekjes zijn misschien de vaste en in principe controleerbare werkwijze en het gebruikmaken van betrekkelijk grote, en eveneens controleerbare, steekproeven.

Daar staat tegenover dat ik niet heb teruggegrepen op enige literatuur. Ik had noch de tijd, noch de lust om me een wetenschappelijk referentiekader eigen te maken, als dat al zou bestaan. Ik ken één boek waarin lexica min of meer systematisch worden beoordeeld (Wegwijs in woordenboeken van D. Geeraerts en G. Janssens), maar dat gebeurt vrij globaal en volgens een methode die nauwelijks wordt verantwoord.

Ook heb ik me niet begeven in statistische bewerkingen. Ik kan niet onomstotelijk bewijzen dat een uitgave die voor één of ander onderdeel een 7 haalt, significant beter is dan één die een 6 scoort, ook al maakt een volle punt meer zo'n kwaliteitsverschil wel zeer waarschijnlijk.

Een kwetsbaar punt, tenslotte, is de scoring van 'uitlegelementen'. Als ik mijn notities later nog eens naging, bleek ik het niet altijd met mezelf eens te zijn. Als iemand anders de scoring had verricht, was hij ongetwijfeld op iets andere getallen uitgekomen. Er is dus sprake van een zekere intra- en inter-observer error, die alleen kan worden geëlimineerd met behulp van een gedetailleerd en zorgvuldig uitgetest beoordelingsprotocol.

Een echt grondige aanpak zou veel meer tijd hebben gekost dan ik eraan heb besteed (ongeveer een werkweek per woordenboek). Voor mij was het in elk geval genoeg. Mijn nieuwsgierigheid is bevredigd, en ik kan de kennissen die me om raad vragen nu tot in de puntjes voorlichten over de tops en flops van de Nederlandse lexicografie.

noot

1. De volgende werken zijn onderzocht:

- Van Dale Groot Woordenboek der Nederlandse Taal, 11e en 12e druk

- Van Dale Groot woordenboek van hedendaags Nederlands ('Grote NN'), 2e druk

- Van Dale Handwoordenboek van hedendaags Nederlands ('Kleine NN'), 1e druk

- Verschueren Groot Geïllustreerd Woordenboek, 9e druk

- Wolters' Woordenboek Eigentijds Nederlands ('Grote Koenen'), 1e druk

- Wolters' Woordenboek Nederlands Koenen, 29e druk

- Kramers' Nieuwe Woordenboek Nederlands, 20e druk

- Prisma Handwoordenboek Nederlands, 2e druk

DE TESTBATTERIJ

10 gewone Nederlandse woorden:

aanleggen, bas, beroerd, goud, hinken, kras, leuk, naar (v.z.), pomp, slachten;

10 moeilijk te definiëren woorden:

aandacht, ergotherapie, hovaardig, kleinkunst, kwezel, lallen, lijzig, meesmuilen, neerbuigend, sermoen;

10 woorden interessant i.v.m. verbindingen:

argwaan, jegens, keper, opvatting, redactie, risico, toegedaan, uitnodiging, vrijwaren, zede;

10 Vlaamse en moderne woorden:

commercieel, etnisch, flamingant, kuisen, kwakkel, proper, scenario, shoarma, syndicaat, waterhoofd;

10 woorden uit politiek en economie:

implementeren, interpellatie, kartel, koopkracht, marketing, motie, obligatie, referendum, tribunaal, wisselkoers;

10 woorden uit geneeskunde en psychologie:

affect, beroerte, freudiaans, gestaltpsychologie, overspannen, quarantaine, schizofrenie, tourniquet, trauma, tyfus;

10 woorden uit kunst en sport:

album, atonaal, buitenspel, conditie, kitsch, langlaufen, producer, rokade, slem, vernissage;

10 woorden uit taal- en natuurwetenschap:

algoritme, haiku, leidmotief, lemma, metonymie, ozon, pregnant, quasar, stochastisch, titreren;

10 Engelse woorden:

boom, COBOL, display, overheadkosten, paper, safe, seminar, software, workshop, yuppie;

10 woorden uit diverse vreemde talen:

bigot, enfant terrible, flair, kassian, kinnesinne, macho, makke, sowieso, toko, xantippe.

NIEUWSTE WOORDEN
accommoderen (huisvesten)#, alcoholprobleem, Alzheimer, archief (het ronde -)#, aso, aviertje, avtel#, back-up, bemensen, beugelbek#, billboard, blooper, blusher, borderline#, bruggetje (radio/t.v.-taal), buddy, burn-out, casten, CD, centerfold, chromakey, conditioner#, contacten (w.w.), crack (drug), CT-scan#, culi, date(n), demo, depri, falafel, fisten, freelancen, frust, functioneren (pregn.)#, g(h)ettoblaster, gebruik(er)svriendelijk, geschoren (opgescheept; opgelicht), goudenregen (urolagnie)#, grachtengordel, grapdichtheid#, grijsrijden/er, grip (filmterm)#, G-string, hezbollah, hijglijn, hotshot#, inhebben, inschieten op, inspelen op, insteken op, intifada, junkfood, kaasschaafmethode, kast (uit de - komen)#, lijntje, lijstduwer, linksdragend, lip sync(hroon), macher, matje (haardracht), meltdown, mensuren, move, niersteenvergruizer, opblazen (v.e. foto), pesto, piepelen, plakken (blijven -), pomo, postnatale depressie, psych (= psychiater)#, quote (Eng.), rushes, snel (= modieus), sneu (in 'sneu tiep')#, snoezelen, snooker(biljart), soap(-opera), soundmixen, sushi#, tabloid, tagliatelle, takkewijf, tattoo, teletekst, therapietrouw#, transparant (metaf.), trivia, vetoën, vibraties (= sfeer), vies (- tegenvallen etc.), whizzkid, wieberen, wiegedood, wijzer (achtervoegsel), wysiwyg, XTC, yup, zakjapanner, zappen.

# = nergens beschreven (17 woorden)

OUDSTE WOORDEN
aboucheren# M, abrahams schoot T, achitofelsraad T, adderengebroed T, afgetrokken (abstract) M, apostelpaarden T, ark des verbonds T, barg P, barouchet M, bedachtig# P, behemoth T, biologie (het biologeren) M, brillekiek M, cantille M, crinoline M, delling P, desavoueren M, disculperen M, djimat M, domen P, doorn in het vlees T, eenzelvigheid (identiteit) P, efelcustiek# M, egyptische duisternis T, elim T, erlangen P, fiool T, gearceerd (-e schemering)# P, gehenna M, geluw P, genucht# P, grondsop T, heerde P, hoofdigheid M, hoorn verhogen T, hukken P, imponderabel M, izebel T, jakobsdood sterven T, kaïnsteken T, kiskassen M, klinkletter M, kortswijl P, kraton M, krethi en plethi T, krielen P, laban, vee van - T, lamzalig P, lent# P, leviathan T, lezen (verzamelen) P, lijnwaad M, luiken w.w. P, luwtje# P, maag (verwant) M, malven(d) P, mannin T, mas M, meeps P, middellijk M, mirre T, nazireeër T, onspoed M, ontvlieden P, ontzetbaar P, ontzwemmen P, organiek M, pajoeng M, pendopo M, popel P, rabboeni# T, radja M, rijs P, schabrak M, sluikerij M, stenen P, stille (- in den lande) T, surnumerair M, tempeest P, terafim T, tikar M, tittel T, tongen (in - spreken) T, toonbroden T, tricheren M, uriasbrief T, vakerig P, veil (b.n.) P, veil (z.n.) P, verspieder T, vervaren P, verzenen T, watertrens# M, wederpartijder T, wegel P, wen P, zaad (nageslacht) T, zemelknoper P, zilverling T, zwatelen (v. olmen) P

# = nergens beschreven (9 woorden)

M = afkomstig uit Multatuli

P = afkomstig uit poëzie

T = afkomstig uit Tale Kanaäns

*Dit artikel is eerder verschenen in Trefwoord 5 (1993), pp. 4-11. De paganinummers van het origineel zijn tussen [ ] weergegeven.

Van Sterkenburg heeft gereageerd op dit stuk, lees zijn reactie hier. <ZIE