Daftar Isi
Daftar Isi
Kata Pengantar…………………….………………………………………………………………………… 2
1. Pendahuluan ……………………………….………………………………………………………………………………………. 3
Latar Belakang……………………………….…………………………………………………………………………………… 3
2. Isi……………………………….………………………………………………………………………………………………………… 5
1. Pengertian……………………………….………………………………………………………………………………………5
2. Bahasa Alami……………………………….……………………………………………………………………………… 6
2.1 Komponen Utama Pengolahan Bahasa Alami ………………………………………………….. 6
2.2 Sistem Pemrosesan Bahasa Alami ……………………………………………………………………… 6
2.2.1 Sistem Speech Recognition…………………………………………………………………… 7
2.2.2 Sistem Text to Speech……………………………………………………………………………. 9
2.2.3 Natural Language Processing………………………………………………………………… 11
2.3 Aplikasi Pengolahan Bahasa Alami …………………………………………………………………… 12
3. Bidang Pengetahuan Dalam Natural Language………………………………………………………… 15
3.1 Proses Sintaksis……………………………………………………………………………………………………… 17
3.2 Gramatika ……………………………….……………………………………………………………………………… 17
3.3 Chomsky Hierarchy Of Generative Grammar……………………………………………………… 19
3.4 Parsing………………………………………………………………………………………………………………………20
3.5 Semantik……………………………………………………………………………………………………………………21
3. Penutup……………………………….……………………………………………………………………………………………… 27
1. Kesimpulan……………………………….…………………………………………………………………………… 27
2. Daftar Pustaka……………………………….……………………………………………………………………… 29
1
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan rahmat serta
hidayah-Nya kepada penulis sehingga dapat menyelesaikan makalah ini dengan baik dan tepat
waktu.
Makalah ini merupakan tugas mata kuliah Kecerdasan Buatan dengan materi “Natural
Language Processing” atau Pemrosesan Bahasa Alami. Yang didalamnya membahas secara
menyeluruh tentang Natural Language Processing. Makalah ini dibuat untuk memenuhi tugas
kelompok pada mata kuliah Kecerdasan Buatan.
Terima kasih kami sampaikan kepada Bapak Victor Amrizal selaku dosen mata kuliah
Kecerdasan Buatan yang telah memberikan kuliah demi lancarnya tugas ini. Serta rekan-rekan
yang memeberikan masukkan dan motivasinya kepada kelompok kami.
Demikianlah tugas ini kami susun semoga bermanfaat untuk kita semua.
Penulis
2
Bab I
PENDAHULUAN
Teknologi berkembang semakin cepat dari waktu ke waktu karena penemuan satu
teknologi baru dapat mempercepat penemuan teknologi berikutnya. Dalam sejarah peradaban
manusia, terdapat banyak penemuan yang dapat menghasilkan teknologi yang berpengaruh besar
terhadap kehidupan manusia. Sebagai contoh, penemuan teknologi mesin uap oleh Thomas
Savery (1689) yang selanjutnya disempurnakan oleh James Watt menjadi bentuk yang lebih
memungkinkan digunakan pada berbagai aplikasi, penemuan teknologi telpon oleh Alexander
Graham Bell (1876), atau penemuan teknologi komputer.
Sebagai contoh perkembangan komputer saat ini adalah munculnya PDA (Personal
Digital Asistant). PDA pada awalnya hanya dirancang untuk menjalankan fungsi-fungsi praktis
seperti pencatatan serta pencarian daftar alamat dan telpon, pencatatan jadual kegiatan, atau
catatan singkat. Namun, sesuai dengan kebutuhan yang berkembang, disertai dengan tersedianya
prosesor mikro yang semakin tinggi kemampuannya, PDA mulai mampu menjalankan berbagai
aplikasi yang tadinya hanya dapat dijalankan di atas PC. Bahkan, kini telah terjadi perkawinan
antara PDA dengan telepon selular menjadi PDA-phone atau smart phone. Kini, peradaban
manusia telah sampai pada suatu keadaan dimana kita tidak mungkin melepaskan diri dari
teknologi komputer digital.
Pertanyaan yang menarik untuk dipikirkan adalah ‘akan seperti apa bentuk komputer
pada akhir abad ini?’. Berbagai film fiksi ilmiah mencoba menggambarkan bentuk komputer
masa depan tersebut. Salah satunya mengggambarkan sebuah computer berbentuk kartu kredit
yang dilengkapi dengan :
• prosesor yang sangat kuat dan memori yang sangat besar,
• berbagai sensor untuk menerima masukan dan mendeteksi keadaan di sekitarnya,
• perangkat untuk menghasilkan suara dan memproyeksikan gambar, serta teknologi
telekomunikasi nirkabel untuk mengakses jaringan nirkabel yang berada disekitarnya,
• batere yang tahan lama dan manajemen energi yang baik, serta
3
• kemampuan untuk berinteraksi secara lisan dengan pemakaianya menggunakan ucapan
menggunakan bahasa sehari-hari, bukan bahasa khusus yang rumit.
Melihat keadaan teknologi yang sudah dicapai saat ini serta kesadaran bahwa teknologi
yang ada sekarang berkembang terus dengan cepat, tidak berlebihan jika berharap computer yang
mendekati ’komputer masa depan’ tersebut akan tersedia sebelum abad ini berakhir.
Tentunya, komputer tersebut juga tetap harus dilengkapi dengan perangkat lunak untuk
mengedalikan semua sistem serta menjalankan fungsi-fungsinya. Perangkat keras serta sebagian
perangkat lunak akan bersifat generik, tetapi sebagian komponen perangkat lunaknya akan
bersifat ’language dependent’, yaitu perangkat lunak yang melakukan pemrosesan bahasa alami
secara lisan. Bagian berikutnya dari tulisan ini akan difokuskan pada pembahasan teknologi yang
berkaitan dengan pemrosesan bahasa alami tersebut.
Dewasa ini aplikasi konsep AI terus berkembang. Salah satunya adalah bagaimana
membuat komputer memahami perintah yang diberikan pengguna dalam bahasa sehari-hari
(natural language), dan merespon perintah tersebut dalam bahasa sehari-hari. Untuk itulah
penulis mencoba mengangkat tema Natural Language Processing dalam makalah ini.
Bab II
4
ISI
1. Pengertian
Agar komputer bisa memahami pertanyaan dalam bahasa alami, komputer harus
mempunyai pengetahuan analisis dan interpretasi input dalam mengakuisisi data knowledgenya.
Komputer harus mengerti gramatika dan definisi kata-kata. Dalam hubungan ini teknik AI
digunakan untuk menampilkan pengetahuan internal dan mengolah input. Pelacakan klasik dan
teknik penyocokan pola (pattern matching) digunakan bersama dengan basis pengetahuan agar
komputer bisa mengerti apa yang kita masukkan dalam bahasa alami. Bila komputer sudah
mengerti input kita, maka ia bisa melakukan hal-hal yang kita harapkan/output. Kita harapkan
agar outputnya pun akan dinyatakan atau diekspresikan dalam bahasa alami juga. Untuk alasan-
alasan inilah maka komputer harus bisa mengoutputkan bahasa alami yang memadai dengan cara
yang paling mudah. Untuk bisa mencapai keinginan di atas maka perlu adanya teknik-teknik
“pengemasan” kalimat, frase dan output lainnya.
Pada prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan yang
ingin dikomunikasikan antar manusia. Bentuk utama representasinya adalah berupa suara/ucapan
(spoken language), tetapi sering pula dinyatakan dalam bentuk tulisan. Inti dari pemrosesan
bahasa alami adalah penguraian kalimat atau sering disebut dengan parser. Parser berfungsi
untuk membaca kalimat, kata demi kata dan menentukan jenis kata apa saja yang boleh
mengikuti kata tersebut. Dalam pemahaman suatu bahasa ada beberapa bidang yang harus
disertakan yaitu morfologi, sintaksis, semantik, pragmatik, fonologi,dan pengetuhuan tentang
dunia sekitar.
5
2. Bahasa Alami
“Bahasa adalah suatu sistem untuk komunikasi yang tardiri atas simbol dan aturan yang
digunakan untuk mengekspresikan ide, pikiran dan perasaan. Bahasa alami adalah bahasa yang
dipakai manusia dalam kehidupan sehari-hari misalnya Bahasa Indonesia, Bahasa Inggris dan
sebagainya.
Bahasa merupakan fenomena yang rumit yang melibatkan proses pengenalan bunyi atau
huruf, sintaksis, kalimat, inferensi semantik tingkat tinggi bahkan komunikasi emosi lewat irama
bicara. Untuk mengelola kerumitan ini, para ahli bahasa telah mendefinisikan tingkat analisis
yang berbeda untuk bahasa alami yaitu persanjakan, fonologi, morfologi, sintaksis, semantik,
pragmatik, dan pengetahuan tentang dunia sekitar.
a. Parser
Yaitu suatu system yang mengambil kalimat input dan menguraikannya kedalam
beberapa bagian gramatika (kata benda kerja, kata sifat dll)
b. System Representasi Pengetahuan
Suatu system yang menganalisis output parser untuk menentukan maknanya.
c. Output Translator
Suatu terjemahan yang merepresentasikan system pengetahuan dan melakukan langkah-
langkah yang bisa berupa jawaban atas bahasa alami atau output khusus dengan program
computer lainnya.
6
translator bahasa alami (misalnya dari Bahasa Inggris ke Bahasa Indonesia), sistem pemeriksa
sintaks bahasa, sistem yang dapat ”menyimpulkan” suatu
narasi, dan sebagainya.
2) Sub-sistem Text to Speech (TTS), berfungsi untuk mengubah text (bahasa tulisan) menjadi
ucapan (bahasa lisan).
3) Sub-Sistem Speech Recognition (SR), merupakan kebalikan teknologi Text to Speech, yaitu
sistem yang berfungsi untuk mengubah atau mengenali suatu ucapan (bahasa lisan) menjadi text
(bahasa tulisan). Berbeda dengan kebanyakan sistem lain yang bersifat generik, teknik-teknik
yang digunakan dalam pemrosesan bahasa alami bersifat sangat ‘language dependent’. Suatu
sistem atau teknik yang berlaku untuk suatu bahasa tidak mudah diterapkan untuk bahasa
lainnya.
7
Gambar 1. Diagram Blok Sistem Pengenal Ucapan
Penganalisis sintaks biasanya melakukan transformasi sinyal ucapan dari domain waktu
ke domain frekuensi. Pada domain frekuensi, untuk kurun waktu yang singkat, setiap sinyal
dapat terlihat memiliki ciri-ciri yang unik. Namun demikian, pengucapan suatu unit bunyi
ucapan (fonem) seringkali bervariasi antar orang yang berbeda, juga terpengaruh oleh fonem-
fonem disekitarnya, kondisi emosi, noise, dan faktor-faktor lainnya.
Sistem Speech Recognition yang dapat mengenali seluruh kata dalam suatu bahasa
melakukan pengenalan untuk setiap unit bunyi pembentuk ucapan (fonem), selanjutnya mencoba
mencari kemungkinan kombinasi hasil ucapan yang paling dapat diterima. Sistem yang lebih
sederhana adalah sistem yang hanya dapat mengenal sejumlah kata yang jumlahnya terbatas.
Sistem ini biasanya lebih akurat dan lebih mudah dilatih, tetapi tidak dapat mengenal kata yang
berada di luar kosa kata yang pernah diajarkan.
Sistem Speech Recognition biasanya dapat dioperasikan pada dua mode yang berbeda.
Pertama adalah mode belajar. Pada mode ini, sistem akan dilatih menggunakan sejumlah kata
atau kalimat yang memenuhi suatu kriteria tertentu. Setiap contoh kata atau kalimat ajar tersebut
akan menghasilkan pola tertentu yang akan dipelajari oleh sistem dan disimpan sebagai template
atau referensi.
Kedua adalah mode produksi atau pengenalan ucapan. Pada mode ini, setiap kalimat yang
ingin dikenali akan dianalisis polanya. Berdasarkan hasil perbandingan dengan template atau
referensi, modul klasifikasi pola serta pengambil keputusan akan mengidentifikasikan kata atau
kalimat yang diucapkan tersebut. Pada prinsipnya, teknik-teknik atau algoritma yang digunakan
pada sistem Pengenal Ucapan tidak bersifat sensitif terhadap bahasa. Artinya, sistem yang sama
dapat digunakan untuk bahasa apapun. Namun demikian, kemampuan sistem untuk mengenali
ucapan pada bahasa tertentu sangat tergantung dari template atau referensi yang diperoleh
melalui proses belajar di dalam sistemnya itu sendiri.
Untuk melatih sistem Pengenal Ucapan agar dapat digunakan untuk suatu bahasa yang
baru, maka diperlukan korpus untuk melatih sistem tersebut. Korpus yang dimaksud adalah
berupa rekaman ucapan yang heterogen dalam volume yang sangat besar serta memenuhi kriteria
teknis tertentu.
8
Semakin besar korpus yang digunakan untuk melatih sistem, akan dihasilkan sistem Speech
Recognition yang cenderung lebih handal. Sistem yang handal, paling tidak harus dilatih dengan
ratusan rekaman pembicara.
9
Bagian Konverter Teks ke Fonem berfungsi untuk mengolah kalimat masukan dalam
suatu bahasa tertentu yang berbentuk teks menjadi urutan kode-kode bunyi yang
direpresentasikan dengan kode fonem, durasi serta pitch-nya.
Kode-kode fonem adalah kode yang merepresentasikan unit bunyi yang ingin diucapkan.
Pengucapan kata atau kalimat pada prinsipnya adalah urutan bunyi atau secara simbolik adalah
urutan kode fonem.
Setiap fonem harus dilengkapi dengan informasi durasi dan pitch. Informasi durasi
diperlukan untuk menentukan berapa lama suatu fonem diucapkan, sedangkan informasi pitch
diperlukan untuk menentukan tinggi rendahnya nada pengucapan suatu fonem.
Durasi dan pitch bersama-sama akan membentuk intonasi suatu ucapan. Kedua informasi
ini dalam suatu sistem TTS biasanya dibangkitkan oleh modul pembangkit/model intonasi.
Setiap bahasa memiliki aturan cara pembacaan dan cara pengucapan teks yang sangat
spesifik. Hal ini menyebabkan implementasi unit konverter teks ke fonem menjadi sangat
spesifik terhadap suatu bahasa (language dependent). Bagian Konverter Fonem ke Ucapan akan
10
menerima masukan kode-kode fonem serta pitch dan durasi yang telah dihasilkan oleh bagian
sebelumnya. Berdasarkan kode-kode tersebut, bagian ini akan menghasilkan bunyi atau sinyal
ucapan yang sesuai dengan kalimat yang ingin diucapkan.
Ada beberapa alternatif teknik yang dapat digunakan untuk implementasi bagian
konverter fonem ke ucapan. Dua teknik yang paling banyak digunakan adalah formant
synthesizer, serta diphone concatenation. Saat ini, teknik kedua lebih banyak digunakan karena
dapat menghasilkan ucapan dengan kualitas yang lebih alami.
Teknik diphone concatenation melakukan pembangkitan ucapan dengan cara
menggabung-gabungkan segmen-segmen bunyi yang berupa diphone (dua fonem). Untuk
mencapai kualitas yang lebih tinggi, beberapa TTS menggunakan penggabungan segmen bunyi
yang berupa multi-phone.
Banyak manfaat yang dapat dicapai dari ketersediaan Aplikasi Teknologi Bahasa,
khususnya untuk Bahasa Indonesia. Berikut
• Alat bantu membaca untuk tunanetra. Alat bantu membaca bagi tunanetra mempunyai
masukan berupa teks tercetak (misalnya buku) dan mempunyai keluaran berupa ucapan dari teks
tercetak yang diberikan. Pada prinsipnya ada dua komponen utamanya, yaitu bagian “pengenal
karakter” yang menggunakan teknologi OCR (Optical Character Recognition), serta bagian
TTS. Dengan alat bantu ini, orang tunanetra dapat membaca suatu buku atau dokumen. Bahkan,
jika teks yang ingin dibacakan sudah tersedia di dalam komputer, dengan teknologi Text to
Speech dapat langsung diucapkan.
12
Gambar 4. Aplikasi Alat Bantu Baca
13
• Online translator. Online translator yang dimaksud disini adalah translator yang secara
otomatis dapat menerjemahkan kalimat lisan dari suatu bahasa alami (misalnya Bahasa Inggris)
menjadi ucapan hasil terjemahannya dalam bahasa alami lainnya (misalnya Bahasa Indonesia).
Online translator terdiri dari 3 bagian. Bagian pertama, speech recognition, berfungsi untuk
mengenali rangkaian kata dari bahasa sumber menjadi teks dalam bahasa sumber. Bagian
berikutnya adalah translator teks ke teks. Hasil bagian kedua ini adalah kalimat bahasa tujuan
yang masih berupa teks. Bagian ketiga berupa
sistem TTS dalam bahasa tujuan. Aplikasi seperti ini mungkin untuk dikembangkan, karena
teknologi speech recognition sudah banyak dikembangkan. Translator bahasa pun sudah
banyak dikembangkan, termasuk translator Bahasa Inggris ke Indonesia .
Talking email atau aplikasi lainnya. TTS juga memungkinkan diintegrasikan dengan berbagai
program aplikasi, seperti email, web browser, aplikasi-aplikasi multimedia atau aplikasi-aplikasi
lainnya.
• Aplikasi Telephony. TTS dapat digunakan pada aplikasi telephony, seperti sistem informasi
billing atau sistem informasi lainnya yang diucapkan secara lisan. TTS juga dapat
digunakan untuk konversi dari SMS (Short Message System) ke ucapan sehingga pesan SMS
dapat didengar. Dengan demikian memungkinkan untuk mendengar pesan SMS sambil
melakukan aktivitas yang menyulitkan untuk membacanya, seperti sedang mengendarai mobil.
Dengan TTS tersebut, memungkinkan pula untuk meneruskan pesan SMS ke system telepon
biasa (PSTN). Speech Recognition memungkinkan pencarian informasi secara lisan.
14
Contoh aplikasi NLP lainnya :
Eliza yang dibelkali pengetahuan psikologi, sehingga beberapa orang terdorong untuk
mampu merubah sikap dan perilakunya.
Jupiter yang mampu memberikan informasi cuaca melalui telepon.
Alvin yang mampu menjawab pertanyaan mengenai DOS
SEXPERT yang dirancang untuk perbincangan mengenai pendidikan seksual.
Email translator : alat yang akan menjawab masalah perbedaan bahasa, karena email
translator mampu menterjemahkan bahasa, seperti yang kita inginkan. Email translator
akan menterjemahkan kaimat- kalimat didalam mail box, jika email yang kita terima
tidak sesuai dengan bahasa kita sehari-hari.
Web translator : suatu mesin aplikasi berbasis World Wide Web yang dapat
menterjemahkan bahasa dalam suatu web site. Web translator akan menterjemahkan
bahasa didalam semua link-link, page per page menjadi bahasa seperti yang kita
inginkan.
World translator : suatu pengembangan dari word translator yang sudah ada, diharapkan
dengan teknis ini hasil terjemahan bahasa akan menjadi lebih sempurna, mengikuti
kaidah tata bahasa. Terjemahan akan lebih cepat, akurat bukan lagi dengan system
menterjemahkan per kata, tapi perkalimatdengan melihat Subjek-Prediket-Objek.
Dalam dunia kecerdasan buatan pengolahan bahasa alami merupakan aplikasi terbesar
setelah sistem pakar. Banyak para ahli Artificial Intelligence berpendapat bahwa bidang
yang penting yang dapat dipecahkan oleh Artificial Intelligence adalah Natural Language
Processing (Pengolahan Bahasa Alami).
15
1. Fonetik dan Fonologi : berhubiungan dengan suara yang menghasilkan kata yang dapat
dikenali. Bidang ini menjadi penting dalam proses aplikasi yang memakai metoda speech
system.
2. Morfologi : yaitu pengetahuan tentang kata dan bentuknya dimanfaaatkan untuk
membedakan satu kata dengan lainnya. Pada tingkat ini juga dapat dipisahkan antara kata
dan elemen lain seperti tanda baca. Sebagai contoh kata membangunkan :
Bangun (kata dasar)
Mem (prefix)
Kan (suffix)
3. Sintaksis : yaitu pemahaman tentang urutan kata dalam pembentukan kalimat dan
hubungan antar kata tersebut dalam proses perubahan bentuk darikalimat menjadi bentuk
yang sistematis. Meliputi proses pengaturan letak suatu kata dalam kalimat yangdapat
dikenali. Selain itu dapat pula dikenali bagian-bagian kalimat dalam sutu kalimat yang
lebih besar. Sebagai contoh :
Kalimat subjek, predikat
Subjek determinan, kataBenda
Predikat kataKerja, kataBanda
4. Semantik : mempelajari ari suatu kata dan bagaimana arti kata-arti kata tersebut
membentuk suatu arti kata dari kalimat yang utuh. Contoh :
Ayahku datang membawa buah tangan.
5. Pragmatik : pengetahuan pada tingkatan ini berkaitan dengan masing-masing konteks
yang berbeda tergantung pada situasi dan tujuan pembuatan system. Contoh :
Ayah datang (diucapkan dengan nada datar)
Ayah datar! (diucapkan dengan nada tinggi)
Ayah datang ? (diucapkan dengan tempo cepat)
6. Discourse knowledge : melakukan pengenalan apakah suatu kalimat yang telah dikenali
mempengaruhi kalimat selanjutnya. Penting untuk kata ganti orang, keterangan tempat
atay aspek sementara dari informasi. Contoh:
Ibu pergi ke pasar. Ia membeli makanan disana.
16
7. World knowledge : mencakup arti sebuah kata secara umum dan apakah ada arti khusus
bagi suatu kata dalam suatu percakapan dengan konteks tertentu.
Selain yang sudah disebutkan diatas masih ada lagi satu masalah yang cukup menantang
dalam natural language yaitu ambiguitas atau makna ganda dari suatu kata atau kalimat. Dari
satu masukan yang sama dapat menjadi beberapa arti yang berbeda dan masing-masing dapat
bernilai benar tergantung pada keperluan pemakai. Hal ini dapat terjadi pada hampir semua
tingkatan pendekatan di atas.
3.2 Gramatika
Grammar suatu bahasa dapat dilihat sebagai suatu aturan yang menentukan apakah suatu
kumpulan kata dapat diterima sebagai kalimat oleh bahasa tersebut. Sebuah kalimat yang dapat
dikenali bentuk dengan berdasarkan aturan-aturan yang ada yang biasa disebut grammar.context
Free Grammar (CFG) adalah representasi grammar dari chomsky hierarchi yang mudah
dipahami dan diolah dalam bentuk program. Sebuah grammar G dapat dibentuk dari 4 tuple yaitu
17
: symbol non terminal, symbol terminal, symbol awal dan aturan penulisan atau (rules).
Defininya adalah :
G = (Vn,Vt, s, p)
Sebagai contoh dapat dilihatdari grammar G sederhana berikut :
DictJenis = {Kata_Benda, Kata_Kerja, Frasa_Benda, Frasa_kerja, Keterangan}
DictKata = {Orang, Makan, telur, Ayam, Terbang, Tinggi}
Dengan aturan :
S Frasa_Benda Frasa_Kerja
Frasa_Benda Kata_Benda Kata_Benda
Frasa_Kerja Kata_Kerja Keterangan
Kata_benda {Orang, Telur, Ayam}
Kata_Kerja {Makan, Terbang}
Keterangan {Tinggi}
18
menyatakan string kosong
Simbol-simbol yang diperluas oleh aturan-aturan disebut nonterminal symbols, sedangkan
simbol-simbol yang berhubungan langsung dengan string yang ditemukan pada kalimat masukan
disebut terminal symbols.
19
3.4 Parsing
Suatu proses menganalisa suatu kumpulan kata dengan memisahkan kata tsb dan
menentukan struktur sintaksis dari tiap kata tsb. Gramatika yang dipakai juga sangat berkaitan
dengan proses parsing apa yang digunakan. Bottom-Up Parsing gramatika yang dipakai akan
lebih banyak bercabang ke arah simbol non-terminal. Hal lain yang juga berkaitan erat dengan
proses parsing adalah kamus atau leksikon yang digunakan. Dalam leksikon disimpan daftar kata
yang dapat dikenali sebagai symbol terminal dalam grammar dan informasi yang diperlukan
untuk tiap kata tersebut untuk proses parsing yang bersangkutan.
Pendekatan dalam mengenali struktur suatu kalimat, proses parsing dapat dibagi menjadi
dua bagian besar yaitu Top Down parsing dan Bottom Up parsing. Top Down parser memulai
pemeriksaan dari simbol awal s dan mencoba untuk mencari bentuk simbol terminal berikutnya
yang sesuai dengan jenis kata dari kalimat masukan. Cara sebaliknya diterapkan untuk Bottom
Up parser yaitu mencari dari simbol-simbol terminal menuju ke arah pembentukan simbol awal
s.
3.5 Semantik
20
Semantic analyzer mempunyai himpunan rule dalam basis pengetahuan untuk
menginterprestasikan sebuah kalimat.
Rule 1 :
IF determiner adalah bagian pertama dalam kalimat dan diikuti oleh noun THEN noun tersebut
dianggap sebagai subyek.
Rule 2 :
IF verb diikuti subyek THEN verb menjelaskan tentang apa yang dikerjakan oleh subyek.
Rule 3 :
IF noun diikuti subyek dan verb THEN noun tersebut dianggap sebagai obyek
Rule 4 :
IF kalimat mempunyai bentuk subyek, ver, obyek THEN subyek mengerjakan (verb) yang ada
hubungannya dengan obyek.
Kalimat 'A plane flew home' mentrigger rule 1 yang mengidentifikasi plane sebagai
subyek, lalu rule 2 menjelaskan bahwa plan flew. Rule 3 dan 4 mengidentifikasikan home
sebagai obyek.
Natural Language Processing dapat dipakai sebagai front (bagian depan) pada sistem AI,
dimana data dilewatkan secara verbal.
Tetapi perlu diingat bahwa grammar tersebut masih bersifat umum, masih memungkinkan terjadi
kesalahan karena luasnya jangkauan grammar seperti :
the city to Chicago
the 8 o’clock city
Untuk itu maka dilakukan pembatasan dengan jalan memberikan kategori leksikal baru pada
suatu kata yang berdasar pada keperluan semantis. Dapat kita gambarkan bahwa pada :
22
NP → DET CNP (the flight) diubah menjadi
FLIGHT-NP → DET FLIGHT-CNP
CNP → N (flight) diubah menjadi
FLIGHT-CNP → FLIGHT-N
Dengan demikian kita sudah melakukan pembatasan bahwa yang mungkin dibentuk untuk kata
benda dari sistem adalah ‘the flight’ dan ‘flight’ tidak untuk yang lain. Perlu diingat perubahan
ini juga akan merubah kata yang lain misal ‘Chicago’ dari NP menjadi misalnya CITY-NAME.
Secara lengkap maka grammar di atas tadi berubah menjadi :
FLIGHT-NP → DET FLIGHT-CNP
FLIGHT-CNP → FLIGHT-N
FLIGHT-CNP → FLIGHT-CNP FLIGHT-DEST
FLIGHT-CNP → FLIGHT-CNP FLIGHT-SOURCE
FLIGHT-CNP → FLIGHT-N FLIGHT-PART
FLIGHT-CNP → FLIGHT-PRE-MOD FLIGHT-CNP
FLIGHT-NP → FLIGHT-N NUMB
CITY-NP → CITY-NAME
CITY-NP → DET CITY-CNP
CITY-CNP → CITY-N
CITY-CNP → CITY-MOD CITY-CNP CITY-MOD-ARG
Dari grammar dasar di atas dapat dibentuk grammar tambahan misalnya untuk pertanyaan
TIME-QUERY → When does FLIGHT-CNP (When does flight to Chicago)
Dengan pendekatan ini, interpretasi dari rule yang bersangkutan menjadi lebih mudah
karena sebagian besar dari informasi semantic yang diperlukan dapat dilihat dari rule yang
digunakan. Kekurangan dari pendekatan ini adalah domainsistem yang tidak begitu besar,
dimana domain yang baru akan memerlukan aturan yang baru yang sesuai. Selain itu terjadi
pembengkakan jumlah rule yang diperlukan, hal ini karena dengan langsung mengacu ke
semantik maka banyak generalisasi linguistik yang harus diperinci lebih jauh. Seperti pada
23
contoh di atas kita harus memisahkan antara NP untuk ‘flight’ dan ‘Chicago’ menjadi FLIGHT-
NP dan CITY-NAME.
24
Gambar 3. : Sebuah Jaringan ATN untuk Fragmen Bahasa Inggris
Cara kerja ATN pada kalimat: ‘The long file has printed’
1. Mulai pada keadaan S
2. Masuk ke NP
3. Kerjakan tes kategori untuk melihat jika ‘the’ merupakan determiner
4. Tes sukses, maka register DETERMINER diset ke DEFINITE lalu ke keadaan Q6
5. Kerjakan tes kategori untuk melihat jika ‘long’ merupakan adjective
6. Tes sukses, maka register ADJS ditambahkan ‘long’. Tetap tinggal di Q6
7. Kerjakan tes kategori untuk melihat jika ‘file’ merupakan adjective. Tes gagal
8. Kerjakan tes kategori untuk melihat jika ‘file’ merupakan noun. Tes sukses,
register NOUN diset ke ‘file’ dan lalu ke keadaan Q7.
9. Masuk ke PP
10. Kerjakan tes kategori untuk melihat ‘has’ merupakan preposition. Tes gagal,
sehingga keluar
11. Tidak ada lagi yang dikerjakan di Q7, lalu keluar dan kembali ke struktur
(NP(FILE(LONG)DEFINITE)), sehingga kembali ke keadaan Q1, dengan
register SUBJ diset ke struktur yang dikembalikan dan register TYPE diset ke
DCL
12. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan verb. Tes sukses,
sehingga register AUX diset ke NIL dan register V diset ke ‘has’. Lanjut Q4
13. Masuk ke keadaan NP, dikarenakan kata ‘printed’ bukan determiner ataupun
noun murni, maka NP dikeluarkan
14. Masih tersisa input, berarti analisis belum selesai. Lalu diperlukan backtracking.
15. Pilihan terakhir terdapat pada Q1, sehingga kembali ke Q1. Register AUX dan V
tidak diset
16. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan auxiliary. Tes sukses
sehingga ‘has’ diset ke register AUX dan lalu ke Q3.
17. Kerjakan tes kategori untuk melihat jika ‘printed’ merupakan verb. Tes sukses,
maka register V diset ke ‘printed’. Lanjut ke Q4.
25
18. Karena input telah habis, maka Q4 merupakan keadaan terakhir. Lalu keluar dan
kembali ke struktur
(S DCL (NP(FILE(LONG)DEFINITE)) HAS (VP PRINTED))
Struktur ini merupakan output dari analisis
Bab III
PENUTUP
1. Kesimpulan
“Natual Language Processing (NLP) atau Pengolahan Bahasa Alami (PBA) merupakan
salah satu bidang ilmu kecerdasan buatan (Artificial Intelligence) yang mempelajari
komunikasi antara manusia dengan komputer”. Sandi Setiawan [1993:3].
Pengolahan bahasa alami terdiri dari tiga bagian utama yaitu:
a. Parser
b. System Representasi Pengetahuan
26
c. Output Translator
Kategori Aplikasi Pengolahan Bahasa Alami yaitu:
1. Natural Language Translator
2. Translator bahasa alami ke bahasa buatan, yaitu translator yang mengubah perintah-
perintah dalam bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin
atau komputer. Sebagai contoh, translator yang memungkinkan kita memberikan
perintah bahasa alami kepada komputer. Dengan sistem seperti ini, pengguna sistem
dapat memberikan perintah dengan bahasa sehari-hari, misalnya, untuk menghapus
semua file, pengguna cukup memberikan perintah ”komputer, tolong hapus semua
file !” Translator akan mentranslasikan perintah bahasa alami tersebut menjadi
perintah bahasa formal yang dipahami oleh computer, yaitu “dir *.*”.
3. Text Summarization, yaitu suatu sistem yang dapat ”membuat ringkasan” hal-hal
yang penting dari suatu wacana yang diberikan.
Aplikasi Pengolahan Bahasa Alami yaitu:
1. Text based application
2. Speech based application
Bidang Pengetahuan Dalam Bahasa Alami yaitu:
1. Fonetik dan Fonologi
2. Morfologi
3. Sintaksis
4. Semantik
5. Pragmatik
6. Discourse knowledge
7. World knowledge
27
2. Daftar Pustaka
1. http://lecturer.eepis-its.edu/~kangedi/materi%20kuliah/Kecerdasan%20Buatan/Bab
%205%20Natural%20Language%20Processing.pdf
2. http://mtg.upf.edu/files/publications/9d0455-ACM-MM-2005-JPGMahedero-PCano-
AMartinez.pdf
3. http://cobian.lib.itb.ac.id/focus/focus_file/Pidato%20Ilmiah%20pada%20Sidang%20Terbuka
%20PMB%202004.pdf
28