Autshumato English-Afrikaans Parallel Corpora

English and Afrikaans parallel corpora aligned on sentence level through a combination of automatic and manual alignment techniques. The parallel corpora were obtained from the SA government domain.

 

Productdetails

Aantal woorden: Text: 421 319 sentences (tokens)
Opdrachtgever: Department of Arts and Culture
Financier: Department of Arts and Culture
Eigenaar: North-West University , Centre for Text Technology (CTexT)
Annotaties: UTF8 , Aligned , Sentence segmented
Dataformaat: text
Talen: Afrikaans, English
Documentatie: Readme contained in download
Licentiesoort: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 South Africa

Downloaddetails

Bestandsnaam: 20150804_Autshumato_English-Afrikaans_Parallel_Corpora_1.0.zip
Versie: 1
Bestandsgrootte: 5.8 MB
Bestandstype: application/zip
Aanmaakdatum: 12-03-2018
Om Autshumato English-Afrikaans Parallel Corpora te kunnen downloaden moet u eerst inloggen. Door vervolgens op 'Akkoord' te klikken gaat u akkoord met de voorwaarden. Een versie van deze voorwaarden zit ook in het downloadpakket.
U bent nog niet ingelogd.

Op deze website maken wij gebruik van cookies.