Glossary

  • annotatie
    verrijking van tekst met extra informatie
  • annotaties
    extra informatie waarmee  tekst is verrijkt
  • annoteren
    verrijken van tekst met extra informatie
  • antroponymisch
    met betrekking tot persoonsnamen
  • applicatie
    computerprogramma voor eindgebruikers
  • applicaties
    computerprogramma’s voor eindgebruikers
  • artesteksten
    genre van praktische en informatieve Middelnederlandse teksten, waarin kennisoverdracht centraal staat
  • attestatie
    bewijs (in een tekst of een spraakbestand) voor het bestaan van een woord
  • attestatiemateriaal
    bron die gebruikt wordt om bewijzen te vinden voor het bestaan van een woord
  • bronmateriaal
    teksten die als basis dienen voor het maken van woordenboeken, corpora en lexica
  • bronnenmateriaal
    teksten die als basis dienen voor het maken van woordenboeken, corpora en lexica
  • complementatiepatronen
    vaste sets syntactische combinatiemogelijkheden bij een woord
  • complementatiepatroon
    vaste set syntactische combinatiemogelijkheden bij een woord
  • computationeel
    met behulp van een computer (gemaakt)
  • computationele
    met behulp van een computer (gemaakte)
  • corpora
    grote verzamelingen geschreven of gesproken teksten, gemaakt om een taal te bestuderen en te beschrijven
  • corpus
    grote verzameling geschreven of gesproken teksten, gemaakt om een taal te bestuderen en te beschrijven
  • corpusapplicatie
    computerprogramma waarmee in tekstverzamelingen of in één specifieke tekstverzameling  kan worden gezocht
  • diachrone
    gericht op of m.b.t. de historische ontwikkeling; niet beperkt tot één periode
  • diachroon
    gericht op of m.b.t. de historische ontwikkeling; niet beperkt tot één periode
  • entry
    trefwoord; ingang in een woordenboek of lexicon
  • entrylijst
    lijst trefwoorden; lijst ingangen in een woordenboek of lexicon
  • entry’s
    trefwoorden; ingangen in een woordenboek of lexicon
  • equivalent
    (woord) met een gelijke betekenis
  • equivalenten
    woorden met een gelijke betekenis
  • etymologie
    de herkomst van een woord of, meer in het algemeen, de studie van de herkomst van woorden
  • etymologisch
    met betrekking tot de herkomst van een woord of van woorden
  • etymologische
    met betrekking tot de herkomst van een woord of van woorden
  • geannoteerd
    verrijkt met extra informatie
  • geannoteerde
    verrijkt met extra informatie
  • getranscribeerd
    overgebracht van een handgeschreven of gedrukte tekst, een tekstafbeelding of een geluidsfragment naar een digitaal (tekst)bestand, bijv. door overtypen
  • getranscribeerde
    overgebracht van een handgeschreven of gedrukte tekst, een tekstafbeelding of een geluidsfragment naar een digitaal (tekst)bestand, bijv. door overtypen
  • glos
    verklarende aantekening of vertaling van een woord tussen de regels of in de marge (van een middeleeuws handschrift)
  • glosse
    verklarende aantekening of vertaling van een woord tussen de regels of in de marge (van een middeleeuws handschrift)
  • glossen
    verklarende aantekeningen of woordvertalingen tussen de regels of in de marge (van een middeleeuws handschrift)
  • hiërarchisch
    op basis van verschillende rangen (geordend)
  • hiërarchische
    op basis van verschillende rangen (geordende)
  • hoofdtrefwoord
    hoofdvorm van een woord; trefwoord waaronder je de betekenis, vertaling of spelling van een woord in bijv. een woordenboek kunt opzoeken
  • hoofdtrefwoorden
    hoofdvormen van woorden; trefwoorden waaronder je de betekenis, vertaling of spelling van woorden in bijv. een woordenboek kunt opzoeken
  • infrastructuur
    geheel van voorzieningen, bijv. een speciaal ingerichte webomgeving waardoor het mogelijk is gezamenlijk aan een project te werken
  • lemma
    hoofdvorm van een woord; trefwoord waaronder je de betekenis, vertaling of spelling van een woord in bijv. een woordenboek kunt opzoeken
  • lemma’s
    hoofdvormen van woorden; trefwoorden waaronder je de betekenis, vertaling of spelling van woorden in bijv. een woordenboek kunt opzoeken
  • lemmata
    hoofdvormen van woorden; trefwoorden waaronder je de betekenis, vertaling of spelling van woorden in bijv. een woordenboek kunt opzoeken
  • lexica
    gestructureerde datasets met lemma's (hoofdvormen van woorden) en allerlei taalkundige informatie over die woorden, bijv. woordsoort, mogelijke woordvormen en uitspraak
  • lexicografie
    beschrijving van de woordenschat door het maken van o.a. woordenboeken
  • lexicologie
    wetenschap die de woordenschat bestudeert
  • lexicon
    gestructureerde dataset met lemma's (hoofdvormen van woorden) en allerlei taalkundige informatie over die woorden, bijv. woordsoort, mogelijke woordvormen en uitspraak
  • lexicons
    gestructureerde datasets met lemma's (hoofdvormen van woorden) en allerlei taalkundige informatie over die woorden, bijv. woordsoort, mogelijke woordvormen en uitspraak
  • manueel geverifieerd
    handmatig gecontroleerd
  • manueel geverifieerde
    handmatig gecontroleerde
  • metadata
    extra gegevens die bij (taalkundige) data worden vermeld; 'data over data', bijv. datering, auteursnaam, locatie
  • morfeem
    kleinste woordeenheid met een zelfstandige betekenis of betekenisbepalende functie
  • morfemen
    kleinste woordeenheden met een zelfstandige betekenis of betekenisbepalende functie
  • morfologie
    leer van de woordvorming en woordstructuur; bestudering van de vormen, verbuigingen, vervoegingen en afleidingen van woorden
  • morfologisch
    m.b.t. de woordvorming en woordstructuur  
  • morfologische
    m.b.t. de woordvorming en woordstructuur 
  • morfosyntactisch
    m.b.t. woorddelen en hun functie in zinsverband
  • morfosyntactische
    m.b.t. woorddelen en hun functie in zinsverband
  • morfosyntaxis
    leer van de woorddelen m.b.t. hun functie in zinsverband
  • n-gram
    reeks opeenvolgende woorden in een lopende tekst, waarbij n voor het aantal woorden staat
  • n-grammen
    reeksen opeenvolgende woorden in een lopende tekst, waarbij n voor het aantal woorden staat
  • n-grams
    reeksen opeenvolgende woorden in een lopende tekst, waarbij n voor het aantal woorden staat
  • named entities
    begrippen die worden aangeduid met een eigennaam en die bijv. een persoon, plaats of organisatie vertegenwoordigen
  • named entity recognition
    automatische herkenning van eigennamen
  • named entity recognizer
    computerprogramma voor automatische herkenning van eigennamen
  • OCR
    Optical Character Recogniton of optische tekenherkenning; methode om een afbeelding van tekst om te zetten in digitale, bewerkbare tekst
  • OCR-postcorrectie
    correctie, vaak m.b.v. een slimme tool, van tekst die automatisch is gegenereerd met optische tekenherkenning 
  • onomasiologische
    m.b.t. de verschillende woorden die er voor één begrip (concept) bestaan
  • paradigma
    grammaticaal geheel van de vervoegde of verbogen vormen van een bepaald woord
  • paradigma’s
    grammaticale gehelen van de vervoegde of verbogen vormen van woorden
  • paradigmata
    grammaticale gehelen van de vervoegde of verbogen vormen van woorden
  • parser
    computerprogramma dat de syntactische structuur van zinnen of de morfologische structuur van woorden ontleedt  
  • parseren
    syntactisch ontleden
  • parsers
    computerprogramma's die de syntactische structuur van zinnen of morfologische structuur van woorden ontleden
  • part of speech
    woordsoort
  • PoS
    part of speech; woordsoort
  • PoS-tag
    digitaal label dat van een woordvorm de woordsoort aangeeft
  • PoS-tagging
    het aanbrengen van digitale labels die per woordvorm de woordsoort aangeven
  • PoS-tags
    digitale labels die van woordvormen de woordsoort aangeven
  • semantiek
    betekenisleer; wetenschap die zich bezighoudt met de betekenis van woorden
  • semantisch
    m.b.t. de betekenis(leer)
  • semantische
    m.b.t. de betekenis(leer)
  • semasiologische
    m.b.t. de verschillende betekenissen die één woord kan hebben 
  • synchrone
    gelijktijdige; gericht op hetzelfde tijdvak, zonder te kijken naar de historische ontwikkeling 
  • synchroon
    gelijktijdig; gericht op hetzelfde tijdvak, zonder te kijken naar de historische ontwikkeling 
  • synoniem
    (woord) met dezelfde betekenis
  • synoniemdefinities
    definities die bestaan uit een of meer woorden met dezelfde betekenis, i.p.v. een omschrijving; bijv. rijwiel = 'fiets'
  • synonieme
    met dezelfde betekenis
  • synoniemen
    woorden met dezelfde betekenis
  • synoniemrelaties
    verbanden tussen woorden op grond van gelijke betekenis
  • syntactisch
    m.b.t. de opbouw en structuur van zinsdelen en zinnen
  • syntactische
    m.b.t. de opbouw en structuur van zinsdelen en zinnen
  • syntaxis
    (bestudering van de) opbouw en structuur van zinsdelen en zinnen; zinsleer
  • taalkundig verrijkt
    voorzien van taalkundige informatie, zoals woordsoort en lemma, d.m.v. codes of tags
  • taalkundig verrijkte
    voorzien van taalkundige informatie, zoals woordsoort en lemma, d.m.v. codes of tags
  • taalkundige verrijking
    het toevoegen van taalkundige informatie aan (woorden in) een tekst, bijv. informatie over de woordsoort, meestal d.m.v. bepaalde codes of tags
  • taalmaterialen
    bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie, zoals tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software
  • tag
    digitaal label met taalkundige informatie
  • taggen
    voorzien van digitale labels met taalkundige informatie (bijv. woordsoort of lemma)
  • tagging
    het voorzien van teksten met digitale labels met taalkundige informatie (bijv. woordsoort of lemma)
  • terminologie
    studie naar (het gebruik van) vakspecialistische woorden of woordgroepen
  • token
    in een tekst aangetroffen combinatie van karakters die een eenheid vormen
  • tokens
    in een tekst aangetroffen combinaties van karakters die een eenheid vormen
  • tool
    computerprogramma dat gebruikt wordt om digitale bestanden te bewerken of te analyseren
  • tools
    computerprogramma’s die gebruikt worden om digitale bestanden te bewerken of te analyseren
  • toponymisch 
    m.b.t. plaatsnamen en andere eigennamen van geografische eenheden
  • transcriberen
    een handgeschreven of gedrukte tekst, een tekstafbeelding of een geluidsfragment naar een digitaal (tekst)bestand overbrengen, bijv. door overtypen
  • transcriptie
    het overbrengen van een handgeschreven of gedrukte tekst, een tekstafbeelding of een geluidsfragment naar een digitaal (tekst)bestand, bijv. door overtypen
  • trefwoord
    ingang (hoofdwoord) in een woordenboek
  • trefwoorden
    ingangen (hoofdwoorden) in een woordenboek
  • valentie-informatie
    geheel van verbindingsmogelijkheden van een bepaald woord om met dat woord afleidingen en samenstellingen te vormen en om met andere woorden woordgroepen en zinnen te vormen
  • verrijken
    van extra (taalkundige) informatie voorzien
  • verrijking
    het digitaal voorzien van extra (taalkundige) informatie 
  • verrijkt
    van extra (taalkundige) informatie voorzien
  • volksetymologie
    verandering van een onbegrepen woord onder invloed van vermeende etymologische verwantschap met een bekend woord
  • volksetymologische
    door volksetymologie (verandering van een onbegrepen woord onder invloed van vermeende etymologische verwantschap met een bekend woord) tot stand gekomen
  • woordenboekapplicatie
    online versie van een woordenboek
  • woordenboekapplicaties
    online versies van woordenboeken
  • woordindices
    registers waarin aangetroffen woorden worden opgetekend
  • woordsoort
    soort of categorie waartoe een woord behoort, bijv. zelfstandig naamwoord, bijvoeglijk naamwoord of werkwoord