Korpus

Wikipediasta
Tämä on arkistoitu versio sivusta sellaisena, kuin se oli 1. tammikuuta 2009 kello 13.24 käyttäjän Sovereign92 (keskustelu | muokkaukset) muokkauksen jälkeen. Sivu saattaa erota merkittävästi tuoreimmasta versiosta.
Siirry navigaatioon Siirry hakuun

Korpus on tarkoin määrätty ja koottu joukko kirjoitetun kielen tekstejä (tekstikorpus) tai puhutun kielen nauhoitteita (puhekorpus), jotka on poimittu aidoista teksteistä ja tilanteista. Niitä käytetään oletuksen tarkistamiseen[1] yhdestä tai useammasta kielestä tai jostain niiden ominaisuuksesta, esimerkiksi kuinka usein sana esiintyy kyseisessä tekstissä, missä yhteydessä se esiintyy, mitkä sanat tai fraasit esiintyvät usein sen lähellä, mitä sanaa tai fraasia yhdellä kielellä käytetään yleisimmiten toisen kielen sanan tai fraasin vastineena, jne.

Viitteet

  1. Antti Arppe: Korpukset ja kieli (Powerpoint) ling.helsinki.fi. Viitattu 31.12.2008.
Tämä kieliin tai kielitieteeseen liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.