Ero sivun ”Korpus” versioiden välillä
Siirry navigaatioon
Siirry hakuun
[arvioimaton versio] | [arvioimaton versio] |
Poistettu sisältö Lisätty sisältö
ylim. rivinvaihto --> |
==Kotimaiset korpukset== lisätty |
||
Rivi 31: | Rivi 31: | ||
==Tekijänoikeusongelmia== |
==Tekijänoikeusongelmia== |
||
⚫ | |||
--> |
--> |
||
⚫ | |||
*[http://www.csc.fi/tutkimus/alat/kielitiede Suomen kielen kielipankki] |
|||
*[http://www.helsinki.fi/varieng/ VARIENG] |
|||
*[http://www.kotus.fi/aineistot/ KOTUKSEN korpukset] |
|||
*[http://www.ling.helsinki.fi/uhlcs/ Helsingin yliopiston monikielinen korpuspalvelin UHLCS] |
|||
==Viitteet== |
==Viitteet== |
||
<references /> |
<references /> |
Versio 4. joulukuuta 2009 kello 11.59
Korpus (latinan sanasta corpus, kokoelma) on tarkoin määrätty ja koottu joukko kirjoitetun kielen tekstejä (tekstikorpus) tai puhutun kielen nauhoitteita (puhekorpus), jotka on poimittu aidoista teksteistä ja tilanteista. Niitä käytetään kieltä koskevien hypoteesien testaamiseen yhdestä tai useammasta kielestä tai joistakin niiden ominaisuuksista.[1]
Tarkastelun kohteina voivat olla esimerkiksi seuraavanlaiset kysymykset:
- kuinka usein sana esiintyy tekstissä, (frekvenssi)
- missä yhteydessä se esiintyy tai mitkä sanat tai fraasit esiintyvät usein sen lähellä, (konkordanssi)[2]
- mitä sanaa tai fraasia yhdellä kielellä käytetään yleisimmin toisen kielen sanan tai fraasin vastineena.
Kotimaiset korpukset
- Suomen kielen kielipankki
- VARIENG
- KOTUKSEN korpukset
- Helsingin yliopiston monikielinen korpuspalvelin UHLCS
Viitteet
- ↑ Antti Arppe: Korpukset ja kieli (Powerpoint) ling.helsinki.fi. Viitattu 31.12.2008.
- ↑ Mikko Lounela: Konkordanssi UNIXin alkeet ja tekstikorpusten tietojenkäsittely. KIT. Viitattu 04.12.2009.