
Martin Kroon studeerde Taalwetenschap aan de Rijksuniversiteit Groningen, gevolgd door een joint-degree master Language and Communication Technologies aan diezelfde universiteit en de Universiteit van Lotharingen in Nancy, Frankrijk. In 2022 promoveerde hij aan de Universiteit Leiden op een onderzoek naar de automatische detectie van syntactische verschillen tussen talen. Hierna volgden enkele postdocs aan de Universiteit Utrecht, waar hij meewerkte aan de ontwikkeling van een zoekmachine voor Nederlandse gezegden en een programma voor de semi-automatische grammaticale analyse van spontane taal van Nederlandstalige kinderen en patiënten met afasie. Gelijktijdig heeft hij nog college gegeven bij het Leidse Centre for Digital Humanities en werkte hij bij CLARIAH aan de verspreiding van taalkundige tools en datasets in het Nederlandse taalkundige onderzoek en onderwijs.
Sinds oktober 2025 is Martin onderzoeker-taalkundige aan het Instituut voor de Nederlandse Taal. Hier werkt hij aan de uitbreiding van de bestaande lexica en de ontwikkeling van een centrale kennisbank. Zijn interesses gaan onder andere uit naar zinsconstructies, taalvariatie en etymologie en de rol die computationele taalkunde daarin kan spelen. Zodoende zet hij zich graag in voor de ontwikkeling van taalkundige software ten behoeve van fundamenteel taalkundig onderzoek.
Publicaties
- Martin Kroon & Jan Odijk. (2024). MWE-Finder: An evaluation through three case studies. In Selected papers from the CLARIN Annual Conference 2023. Linköping Electronic Conference Proceedings. https://doi.org/10.3384/ecp210009
- Jan Odijk, Martin Kroon, Tijmen Baarda, Ben Bonfil & Sheean Spoel. (2024). MWE-Finder: A Demonstration. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 12027–12031, Torino, Italia. ELRA and ICCL.
- Jan Odijk & Martin Kroon. (2024). A Canonical Form for Flexible Multiword Expressions. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 91–101, Torino, Italia. ELRA and ICCL.
- Jan Odijk, Martin Kroon, Sheean Spoel, Ben Bonfil & Tijmen Baarda. (2024). MWE-Finder: Querying for multiword expressions in large Dutch text corpora. In Voula Giouli & Verginica Barbu Mititelu (Eds.), Multiword expressions in lexical resources (pp. 229–267). Language Science Press. https://doi.org/10.5281/zenodo.10998643
- Martin S. Kroon. (2022). Towards the automatic detection of syntactic differences [Doctoral dissertation, Leiden University]. Landelijke Onderzoeksschool Taalwetenschap. https://doi.org/10.48273/LOT0629
- Martin Kroon, Sjef Barbiers, Jan Odijk & Stéphanie van der Pas. (2020). Detecting syntactic differences automatically using the minimum description length principle. Computational Linguistics in the Netherlands Journal, 10, 109–127.
- Martin Kroon, Sjef Barbiers, Jan Odijk & Stéphanie van der Pas. (2019). A filter for syntactically incomparable parallel sentences. Linguistics in the Netherlands, 36(1), 147–161. https://doi.org/10.1075/avt.00029.kro
- Martin Kroon, Masha Medvedeva & Barbara Plank. (2018). When Simple n-gram Models Outperform Syntactic Approaches: Discriminating between Dutch and Flemish. In Proceedings of the Fifth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2018), pages 244–253, Santa Fe, New Mexico, USA. Association for Computational Linguistics.
- Maria Medvedeva, Martin Kroon & Barbara Plank. (2017). When Sparse Traditional Models Outperform Dense Neural Networks: the Curious Case of Discriminating between Similar Languages. In Proceedings of the Fourth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial), pages 156–163, Valencia, Spain. Association for Computational Linguistics. https://doi.org/10.18653/v1/W17-1219
- Martijn Wieling, Martin Kroon, Gertjan van Noord & Gosse Bouma (Eds.). (2017). From Semantics to Dialectometry: Festschrift in honor of John Nerbonne. (Tributes; Vol. 32). College Publications.