Het Instituut voor de Nederlandse Taal (INT) werkt mee aan OpenGPT-X: de wetenschappelijke tegenhanger van het taalmodel dat ten grondslag ligt aan ChatGPT. Het taalmodel achter ChatGPT is namelijk niet openbaar. OpenGPT-X-modellen zullen wel vrij toegankelijk zijn.
In het Duitse project OpenGPT-X werken verschillende partijen samen aan een het – vanaf nul – opbouwen van een aantal taalmodellen, tot nu toe vooral van het Duits en Engels. In 2023 wordt ook het eerste meertalige taalmodel ontwikkeld. Het Instituut voor de Nederlandse Taal gaat dit coördineren voor het Nederlands, als betrokken partij bij zowel CLARIN-BE als CLARIN-NL. In dit meertalige model worden onder andere Duits, Engels, Spaans, Frans, Italiaans en Nederlands, samen met een handvol andere talen opgenomen.
Wetenschappelijke tegenhanger van ChatGPT
Een dergelijk model wordt ontwikkeld als wetenschappelijke tegenhanger van modellen als GPT-3 en ChatGPT, waarvan niet duidelijk is op welke data ze getraind zijn en wat de exacte architectuur ervan is. Bij OpenGPT-X wordt het integrale taalmodel gepubliceerd en zal er grondig onderzoek op mogelijk zijn, waarbij alle parameters gecontroleerd kunnen worden. Dat is momenteel niet mogelijk met de commerciële varianten.