Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Construction and annotation of a corpus of contemporary Nepali
Högskolan i Borås, Institutionen Handels- och IT-högskolan.
Visa övriga samt affilieringar
2008 (Engelska)Ingår i: Corpora, ISSN 1749-5032, E-ISSN 1755-1676, Vol. 3, nr 2, s. 213-225Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

In this paper, we describe the construction of the 14-million-word Nepali National Corpus (NNC). This corpus includes both spoken and written data, the latter incorporating a Nepali match for FLOB and a broader collection of text. Additional resources within the NNC include parallel data (English–Nepali and Nepali–English) and a speech corpus. The NNC is encoded as Unicode text and marked up in CES-compatible XML. The whole corpus is also annotated with part-of-speech tags. We describe the process of devising a tagset and retraining tagger software for the Nepali language, for which there were no existing corpus resources. Finally, we explore some present and future applications of the corpus, including lexicography, NLP, and grammatical research.

Ort, förlag, år, upplaga, sidor
Edinburgh University Press , 2008. Vol. 3, nr 2, s. 213-225
Nyckelord [en]
corpus linguistics, nepali, spoken language, Corpus linguistics, linguistic resources
Nationell ämneskategori
Studier av enskilda språk Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:hb:diva-2507DOI: 10.3366/E1749503208000166Lokalt ID: 2320/4365OAI: oai:DiVA.org:hb-2507DiVA, id: diva2:870601
Tillgänglig från: 2015-11-13 Skapad: 2015-11-13 Senast uppdaterad: 2018-01-10Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltext

Personposter BETA

Allwood, Jens

Sök vidare i DiVA

Av författaren/redaktören
Allwood, Jens
Av organisationen
Institutionen Handels- och IT-högskolan
I samma tidskrift
Corpora
Studier av enskilda språkData- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 478 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf