Ero sivun ”Korpus” versioiden välillä
Siirry navigaatioon
Siirry hakuun
[arvioimaton versio] | [arvioimaton versio] |
Poistettu sisältö Lisätty sisältö
Ei muokkausyhteenvetoa |
termin alkuperä: latinan corpus |
||
Rivi 1: | Rivi 1: | ||
{{yhteistyöartikkeli}} |
{{yhteistyöartikkeli}} |
||
'''Korpus''' on tarkoin määrätty ja koottu joukko kirjoitetun kielen tekstejä ([[tekstikorpus]]) tai puhutun kielen nauhoitteita ([[puhekorpus]])<!--mihin nauhoitteista transkriboidut tekstit?-->, jotka on poimittu aidoista teksteistä ja tilanteista. Niitä käytetään oletuksen tarkistamiseen<ref name="Arppe">{{Verkkoviite | Osoite = http://www.ling.helsinki.fi/kit/2004k/ctl310corp/Material/luennot-2004k.ppt | Nimeke = Korpukset ja kieli | Tekijä = Antti Arppe | Tiedostomuoto = [[Powerpoint]] | Selite = | Julkaisu = | Ajankohta = | Julkaisupaikka = | Julkaisija = | Viitattu = 31.12.2008 | Kieli = }}</ref> yhdestä tai useammasta kielestä tai joistakin niiden ominaisuuksista, esimerkiksi kuinka usein sana esiintyy kyseisessä tekstissä, missä yhteydessä se esiintyy, mitkä sanat tai fraasit esiintyvät usein sen lähellä tai mitä sanaa tai fraasia yhdellä kielellä käytetään yleisimmin toisen kielen sanan tai fraasin vastineena. |
'''Korpus''' ([[latina]]n sanasta ''corpus'', kokoelma) on tarkoin määrätty ja koottu joukko kirjoitetun kielen tekstejä ([[tekstikorpus]]) tai puhutun kielen nauhoitteita ([[puhekorpus]])<!--mihin nauhoitteista transkriboidut tekstit?-->, jotka on poimittu aidoista teksteistä ja tilanteista. Niitä käytetään oletuksen tarkistamiseen<ref name="Arppe">{{Verkkoviite | Osoite = http://www.ling.helsinki.fi/kit/2004k/ctl310corp/Material/luennot-2004k.ppt | Nimeke = Korpukset ja kieli | Tekijä = Antti Arppe | Tiedostomuoto = [[Powerpoint]] | Selite = | Julkaisu = | Ajankohta = | Julkaisupaikka = | Julkaisija = | Viitattu = 31.12.2008 | Kieli = }}</ref> yhdestä tai useammasta kielestä tai joistakin niiden ominaisuuksista, esimerkiksi kuinka usein sana esiintyy kyseisessä tekstissä, missä yhteydessä se esiintyy, mitkä sanat tai fraasit esiintyvät usein sen lähellä tai mitä sanaa tai fraasia yhdellä kielellä käytetään yleisimmin toisen kielen sanan tai fraasin vastineena. |
||
<!--==Historia== |
<!--==Historia== |
Versio 26. lokakuuta 2009 kello 19.08
Tämä artikkeli on viikon yhteistyöartikkeli, koska tämä merkittävästä aiheesta oleva artikkeli tarvitsee laajennusta. Voit auttaa Wikipediaa laajentamalla artikkelia. |
Korpus (latinan sanasta corpus, kokoelma) on tarkoin määrätty ja koottu joukko kirjoitetun kielen tekstejä (tekstikorpus) tai puhutun kielen nauhoitteita (puhekorpus), jotka on poimittu aidoista teksteistä ja tilanteista. Niitä käytetään oletuksen tarkistamiseen[1] yhdestä tai useammasta kielestä tai joistakin niiden ominaisuuksista, esimerkiksi kuinka usein sana esiintyy kyseisessä tekstissä, missä yhteydessä se esiintyy, mitkä sanat tai fraasit esiintyvät usein sen lähellä tai mitä sanaa tai fraasia yhdellä kielellä käytetään yleisimmin toisen kielen sanan tai fraasin vastineena.
Viitteet
- ↑ Antti Arppe: Korpukset ja kieli (Powerpoint) ling.helsinki.fi. Viitattu 31.12.2008.