Autshumato English-Sesotho sa Leboa Parallel Corpora

English and Sepedi parallel corpora aligned on sentence level aligned on sentence level through a combination of automatic and manual alignment techniques. The parallel corpora were obtained from the SA government domain.

 

Productdetails

Aantal woorden: Text: 44 981 sentences (tokens)
Opdrachtgever: Department of Arts and Culture
Financier: Department of Arts and Culture
Eigenaar: North-West University , Centre for Text Technology (CTexT)
Annotaties: UTF8 , Aligned , Sentence segmented
Dataformaat: text
Talen: English , Sesotho sa Leboa (Sepedi)
Documentatie: Readme available with download
Licentiesoort: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 South Africa

Downloaddetails

Bestandsnaam: 20150804_Autshumato_English-Sesotho_sa_Leboa_Parallel_Corpora_1.0.zip
Versie: 1
Bestandsgrootte: 2.37 MB
Bestandstype: application/zip
Aanmaakdatum: 12-03-2018
Om Autshumato English-Sesotho sa Leboa Parallel Corpora te kunnen downloaden moet u eerst inloggen. Door vervolgens op 'Akkoord' te klikken gaat u akkoord met de voorwaarden. Een versie van deze voorwaarden zit ook in het downloadpakket.
U bent nog niet ingelogd.

Op deze website maken wij gebruik van cookies.