ISO 639-3
ISO 639[1]-3:2007, Kod perlambangan nama bahasa — Bahagian 3: Kod Alfa-3 untuk liputan tuntas bahasa, ialah piawai antarabangsa untuk kod bahasa dalam siri ISO 639. Ia memerikan kod tiga huruf bagi mengenal pasti bahasa. Piawai ini memperluas kod alfa-3 ISO 639-2 demi meliputi semua bahasa sejadi yang diketahui. ISO 639-3 diterbitkan pada 5 Februari 2007 [1] dan bertujuan untuk pelbagai penggunaan, khususnya sistem komputer yang mendokong banyak bahasa. Ia memberikan hitungan bahasa dengan seberapa lengkap yang mungkin, baik bahasa moden mahupun bahasa pupus, bahasa kuno atau bahasa binaan, bahasa utama atau bahasa minor, serta bahasa tulisan mahupun yang bukan.[1] Bagaimanapun, ISO 639-3 tidak merangkumi bahasa binaan semula seperti bahasa Proto-Indo-Eropah.[2]
ISO 639-3 ialah superset kepada ISO 639-1 dan bahasa-bahasa individu dalam piawai ISO 639-2. ISO 639-[2][1]1 dan ISO 639-2 menumpukan bahasa utama yang dilambangkan oleh seluruh kepustakaan dunia. Oleh sebab ISO 639-2 juga merangkumi kumpulan bahasa tetapi Bahagian 3 tidak, namun ISO 639-3 bukannya superset kepada ISO 639-2. Jika kod B dan T wujud dalam ISO 639-2, piawai ISO 639-3 akan menggunakan kod T. Contoh:
Bahasa | 639-1 | 639-2 (B/T) | Jenis | 639-3 |
---|---|---|---|---|
Inggeris | en | eng | individu | eng |
Jerman | de | ger/deu | individu | deu |
Arab | ar | ara | makro | ara: arb + banyak lagi |
Minnan | individu | nan |
Piawai ISO 639-3 mengandungi 7,589 masukan.[3] Masukannya berasal daripada pelbagai sumber, termasuk:
- bahasa-bahasa individu yang terkandung dalam piawai ISO 639-2;
- bahasa-bahasa moden daripada edisi ke-15 Ethnologue;
- bahasa kuno dan kelainan bersejarah;
- bahasa buatan daripada Senarai LINGUIST yang dicipta oleh Anthony Aristar; dan
- bahasa-bahasa yang disyorkan oleh orang awam pada tempoh pengulasan yang ditetapkan.
Peralihan daripada ISO 639-1 boleh dilakukan melalui Senarai kod ISO 639-1.
Ruang kod
[sunting | sunting sumber]Oleh sebab kod ISO 639-3 terdiri daripada tiga huruf abjad, batas atas teori untuk bilangan bahasa yang dapat dilambangkan ialah 26 × 26 × 26 = 17,576. Bagaimanapun, 547 kod tidak boleh digunakan dalam Bahagian 3 kerana ISO 639-2 mentakrifkan 4 kod khas, 520 kod simpanan dan 23 kod B-sahaja. Justera, batas atas yang mungkin ialah 17576 − 547 = 17030. Batas ini menjadi lebih rendah lagi jika kita tolak kumpulan bahasa yang ditakrifkan dalam piawai ISO 639-2 serta kumpulan-kumpulan bahasa yang belum ditakrifkan dalam Piawai ISO 639-5.
Makrobahasa
[sunting | sunting sumber]Terdapat 56 buah bahasa dalam ISO 639-2 yang dianggap sebagai "makrobahasa" dalam ISO 639-3 [4]. Sesetengah makrobahasa ini tidak mempunyai sebarang bahasa individu, sebagaimana ditakrifkan oleh ISO 639-3 dalam set kod ISO 639-2, misalnya 'ara' (bahasa Arab Generik). Bahasa-bahasa lain seperti 'nor' (Norway) mempunyai dua bahagian yang berasingan ('nno' (Nynorsk), 'nob' (Bokmål)) yang telah dimasukkan ke dalam ISO 639-2. Ini bermakna bahawa sesetengah bahasa (misalnya 'arb', bahasa Arab Baku) yang dianggap oleh ISO 639-2 sebagai dialek untuk sesuatu bahasa ('ara') kini dianggap sebagai bahasa tersendiri dalam ISO 639-3.
Terdapat percubaan untuk mengolah kelainan-kelainan yang berbeza antara satu sama lain daripada segi linguistik, tetapi dianggap oleh penuturnya sebagai dua bentuk untuk bahasa yang sama, misalnya dalam kes-kes diglosia. Untuk contoh, lihat:
- http://www.sil.org/iso639-3/documentation.asp?id=ara Diarkibkan 2012-05-16 di Wayback Machine (bahasa Arab Jenerik, 639-2)
- http://www.sil.org/iso639-3/documentation.asp?id=arb Diarkibkan 2010-10-13 di Wayback Machine (bahasa Arab Baku, 639-3)
Untuk senarai yang lengkap, lihat Pemetaan Makrobahasa (sil.org) Diarkibkan 2012-06-13 di Wayback Machine.
Bahasa kolektif
[sunting | sunting sumber]Sesetengah kod ISO 639-2 yang umum digunakan tidak melambangkan bahasa atau sesetengah bahasa yang berkait (berbeza dengan makrobahasa di atas) yang dirujuk. Ia dianggap sebagai bahasa kolektif [5] dan tidak dimasukkan ke dalam ISO 639-3.
Penggunaan ISO 639-3
[sunting | sunting sumber]- Ethnologue, LinguistList
- Rangka kerja markap leksikal, spesifikasi ISO yang mengesyorkan penggunaannya
- Tag bahasa IETF
- Dicadangkan sebagai bahasa TLD (lcTLD) [1] [2]
Lihat juga
[sunting | sunting sumber]Rujukan
[sunting | sunting sumber]- ^ a b c d ISO 639-3 status and abstract (iso.org)
- ^ a b "Types of individual languages - Ancient languages (sil.org)". Diarkibkan daripada yang asal pada 2012-04-26. Dicapai pada 2009-09-20.
- ^ "ISO 639-3 Code Set". Diarkibkan daripada yang asal pada 2008-10-24. Dicapai pada 2009-09-20.
- ^ Scope of denotation: Macrolanguages (sil.org)
- ^ Scope of denotation: Collective languages (sil.org)