Categorie: Termextractie
Afkorting/acroniem: [-]
TermFinder is een online applicatie die terminologie uit Franse, Engelse en Italiaanse teksten extraheert.
Deze applicatie maakt gebruik van Poisson-statistieken, de Maximum Likely Estimation en de Inverse Document Frequency tussen de frequentie van woorden in een bepaald document en een algemeen corpus van 100 miljoen woorden per taal. De applicatie gebruikt een probabilistische woordsoorttagger om de waarschijnlijkheid af te wegen dat een bepaalde sequentie een term kan zijn. Ook creëert zij n-grammen van woorden.