Question Answering System Menggunakan Semantic Web Dan Algoritma Porter
Question Answering System Menggunakan Semantic Web Dan Algoritma Porter
Question Answering System Menggunakan Semantic Web Dan Algoritma Porter
S E M A N T IC W E B D A N A L G O R IT M A P O R T E R
SE B A G A I STE M M E R K A T A
S K R IP S I
O le h :
D Z A K IY A T U R R O S Y ID A H
N IM . 1 0 65 0 07 7
J U R U S A N T E K N IK IN F O R M A T IK A
F A K U L T A S S A IN S D A N T E K N O L O G I
U N IV E R S IT A S IS L A M N E G E R I M A U L A N A M A L IK
IB R A H IM M A L A N G
2014
H A L A M A N PE N G A J U A N
Q U E S T IO N A N S W E R IN G S Y S T E M M E N G G U N A K A N
S E M A N T IC W E B D A N A L G O R IT M A P O R T E R
SE B A G A I STE M M E R K A T A
S K R IP S I
D ia ju k a n k e p a d a :
F a k u lta s S a in s d a n T e k n o lo g i
U n iv e r sita s Islam N e g e r i M a u la n a M alik Ib ra h im M ala n g
U n tu k M e m e n u h i S a la h S a tu P e r sy a r a ta n D a lam
M e m p e r o l e h G e l a r S a r j a n a K o m p u t e r ( S .K o m )
o le h :
D Z A K IY A T U R R O SY ID A H
N IM . 1 0 6 5 0 0 7 7 / S -1
JU R U S A N T E K N IK IN F O R M A T IK A
FA K U L T A S SA IN S D A N T E K N O L O G I
U N IV E R SIT A S ISL A M N E G E R I M A U L A N A M A L IK IB R A H IM
M A L A N G
2014
ii
iii
iv
v
M O TTO
“D o yo u r b e st a t a n y m o m e n t
th a t y o u h a v e , c a u se e v e ry
e f f o r t h a s it r e w a r d s ”
“ T i d a k a d a u s a h a y a n g s ia - s i a ”
vi
PERSEM BA H A N
A lh a m d u lilla h , s e g a la p u ji s y u k u r a t a s r a h m a t , h id a y a h d a n in a y a h
A lla h S W T , k a ry a in i k u p e r s e m b a h k a n u n t u k o r a n g - o r a n g is t im e w a
d a la m h id u p k u
| A y a h a n d a d a n Ib u n d a T e r c in ta |
H a r u n N u r R a s y it d a n Z u lia t i
T e r i m a k a s i h a t a s k a s i h s a y a n g , s e m a n g a t , d a n k e i k h l a s a n h a ti t e l a h
m e n d id ik d a n m e m b im b in g k u
| A d ik - a d ik k u T e r s a y a n g |
A h m a d M u b a r o k u l W a jid
F a iz N u r I h s a n A r if
F a u z a n R o s y id i
M . R iz q y R o s y id
T e r im a k a s ih a ta s s e m a n g a t d a n d o a n y a
| P a r a D o s e n T I U IN M a l ik i M a l a n g |
T e r i m a k a s i h t e l a h m e m b i m b i n g d a n m e n d i d i k s a y a s e m o g a il m u y a n g
s a y a t e rim a b a r o k a h d u n ia a k h ira t
| IN F IN IT Y ( T I 2 0 1 0 ) |
K it a le b ih d a r i t e m a n s e p e rju a n g a n m e n u n t u t ilm u ,
k i t a a d a la h k e l u a r g a
v ii
K A T A PE N G A N T A R
S e g a l a p u ji b a g i A l la h S W T y a n g t e l a h m e l im p a h k a n ra h m a t , h i d a y a h d a n
k a r u n i a - N y a k e p a d a p e n u l i s . S h a l a w a t s e rt a s a l a m j u g a te t a p t e rc u r a h k a n k e p a d a
A l g o r i tm a P o rt e r s e b a g a i S t e m m e r K a t a ” d e n g a n b a i k .
S e l a n j u t n y a p e n u l is h a t u r k a n u c a p a n te r im a k a s i h s e i ri n g d o ’ a d a n h a r a p a n
t e r s e l e s a i k a n n y a s k ri p si i n i . U c a p a n t e ri m a k a s i h i n i p e n u l i s s a m p a i k a n k e p a d a :
m e lu a n g k a n w a k tu u n tu k m e m b i m b i n g , m e m o t i v a s i , s e rt a m e m b e ri k a n
m e m b e ri k a n s a r a n d a n m a s u k a n d a l a m p e n y u s u n a n s k ri p s i .
3. D r . C a h y o C r y s d i a n , s e l a k u K e t u a J u r u s a n T e k n i k I n f o r m a t i k a U n i v e rs i ta s
m e n g a r a h k a n d a l a m p e n g e rj a a n s k ri p s i i n i .
v iii
4. S e g e n a p s i v it a s a k a d e m i k a J u r u s a n T e k n i k I n f o rm a ti k a , t e r u t a m a s e l u r u h
d o s e n , t e ri m a k a s i h a t a s s e g e n a p il m u d a n b i m b i n g a n y a n g t e l a h d i b e r i k a n .
s e g a l a y a n g t e l a h d i b e ri k a n k e p a d a p e n u l i s d a n d a p a t m e n j a d i p e l a j a r a n .
k e k u r a n g a n d a n p e n u li s b e r h a r a p s e m o g a s k r i p s i i n i d a p a t m e m b e ri k a n m a n f a a t
k e p a d a p a r a p e m b a c a . A m i n Y a R a b b a l A la m i n .
M a la n g , 9 N o v e m b er 2 0 1 4
P e n u lis
ix
D A F T A R ISI
H A L A M A N J U D U L .............................................................................................. i
H A L A M A N P E N G A J U A N .................................................................................. i i
H A L A M A N P E R S E T U J U A N ............................................................................. i i i
H A L A M A N P E N G E S A H A N .............................................................................. i v
H A L A M A N P E R N Y A T A A N ................................................................................v
H A L A M A N M O T T O .......................................................................................... v i
H A L A M A N P E R S E M B A H A N .......................................................................... v i i
K A T A P E N G A N T A R ........................................................................................ v i i i
D A F T A R I S I ...........................................................................................................x
D A F T A R G A M B A R ........................................................................................... x i i
D A F T A R T A B E L ............................................................................................... x i i i
A B S T R A K .......................................................................................................... x i i i
B A B I PE N D A H U L U A N
1 .1 L a t a r B e l a k a n g ...........................................................................................1
1 .2 R u m u s a n M a s a l a h ......................................................................................8
1 .3 B a t a s a n M a s a l a h ........................................................................................8
1 .4 T u j u a n P e n u l is a n ................................ ................................ ........................9
1 .5 M a n f a a t P e n u l is a n ................................ ................................ ......................9
1 .6 S i s t e m P e n u l is a n ................................ ................................ ........................9
1 .7 M e t o d e P e n e l i ti a n ................................ ................................ ....................1 0
B A B II T IN J A U A N P U ST A K A
2 .1 P e n e l i ti a n T e r k a i t ................................ ................................ .....................1 1
2 .2 S e m a n t i c W e b ...........................................................................................1 4
2 .3 K o m p o n e n - k o m p o n e n S e m a n ti c W e b ................................ ......................1 5
2 .4 O n t o l o g y ...................................................................................................1 8
2 .5 T e m u K e m b a li I n f o r m a s i ( I n f o r m a ti o n R e t r i e v a l) ................................ ...1 9
2 .6 Q u e s t i o n A n s w e r i n g .................................................................................2 0
2 .7 D B P e d i a ...................................................................................................2 1
2 .7 .1 L i n k e d D a t a .....................................................................................2 1
2 .7 .2 S P A R Q L E n d p o i n t ..........................................................................2 1
2 .7 .3 R D F D u m p s ....................................................................................2 2
2 .8 P a r s i n g .....................................................................................................2 2
2 .9 S t e m m i n g ..................................................................................................2 2
2 .1 0 S P A R Q L ..................................................................................................2 3
x
3 .1 .1 .5 M e n g h a p u s S t o p w o r d s ..........................................................2 9
3 .1 .1 .6 P o r t e r S t e m m i n g ...................................................................2 9
3 .1 .2 D a t a M i n i n g ....................................................................................3 4
3 .1 .2 .1 C a r i R e s o u r c e d i W i k i p e d i a ..................................................3 5
3 .1 .2 .2 S P A R Q L Q u e r y ....................................................................3 5
3 .1 .3 M e n a m p il k a n J a w a b a n ................................ ................................ ....3 6
3 .2 D e s a i n I n t e r f a c e ........................................................................................3 7
3 .3 K e b u t u h a n S i s t e m .....................................................................................3 8
B A B IV H A SIL D A N P E M B A H A S A N
4 .1 I m p l e m e n ta s i S i s t e m ................................ ................................ .................4 0
4 .1 .1 I m p l e m e n ta s i P o r t e r S te m m i n g ........................................................4 2
4 .1 .2 I m p l e m e n ta s i P r o s e s P e n c a r i a n R e s o u r c e ........................................4 5
4 .1 .3 I m p l e m e n ta s i S P A R Q L p a d a D B P e d i a I n d o n e s i a ...........................4 6
4 .2 I m p l e m e n ta s i T a m p i la n ................................ ................................ .............4 7
4 .3 U j i C o b a ....................................................................................................5 0
4 .4 A n a l i s a H a s il ................................ .............................................................5 1
4 .5 I n t e g r a s i Q u e s ti o n A n s w e r i n g S y s t e m d e n g a n Is l a m ................................ .6 8
B A B V PE N U T U P
5 .1 K e s i m p u l a n ...............................................................................................7 1
5 .2 S a r a n .........................................................................................................7 1
D A FT A R PU ST A K A
L A M P IR A N
xi
D A FT A R G A M B A R
G a m b a r 1 .1 H a s i l P e n c a r ia n d a ri Y a h o o S e a r c h E n g i n e ................................ .........3
G a m b a r 1 . 2 H a s i l P e n c a r ia n d a ri W o l fr a m A l p h a Q u e s t i o n A n s w e r i n g S y s t e m ......5
G a m b a r 1 .3 H a s i l P e r a n k i n g a n W i k i p e d i a d i A l e x a ................................................7
G a m b a r 1 .4 D e m o g r a f i P e n g g u n a d i W i k i p e d i a ......................................................7
G a m b a r 2 .1 L a y e r S e m a n ti c W e b ................................ ................................ ...........1 6
G a m b a r 2 .2 M e a n i n g T r i a n g l e ...............................................................................1 8
G a m b a r 3 .1 B l o k D i a g r a m Q u e s ti o n A n s w e r i n g S y s t e m ........................................2 6
G a m b a r 3 .2 B l o k D i a g r a m T e x t P r o c e s si n g ...........................................................2 7
G a m b a r 3 .3 B l o k D i a g r a m P o r t e r S t e m m i n g .........................................................3 0
G a m b a r 3 .4 B l o k D i a g r a m D a t a M i n i n g ................................................................3 5
G a m b a r 3 .5 S t r u k t u r K u e ri S P A R Q L ....................................................................3 6
G a m b a r 3 .6 C o n t o h K u e r i S P A R Q L ......................................................................3 6
G a m b a r 3 .7 H a s i l d a r i K u e ri S P A R Q L ..................................................................3 6
G a m b a r 3 .8 D e s a i n I n t e r f a c e Q u e s ti o n A n s w e r i n g S y s t e m ................................ ....3 7
G a m b a r 4 .1 I m p l e m e n t a si U s e r I n t e rf a c e ..............................................................4 8
G a m b a r 4 .2 S i st e m M e n a m p i l k a n Ja w a b a n k e p a d a P e n g g u n a ..............................4 9
x ii
D A FT A R T A B E L
T a b e l 3 .1 A t u r a n u n t u k I n fl e c ti o n P a r ti c l e ............................................................3 1
T a b e l 3 .2 A t u r a n u n t u k I n fl e c ti o n P o s s e s i v e P r o n o u n ................................ ...........3 1
T a b e l 3 .3 A t u r a n u n t u k F i r s t O r d e r D e r i v a t i o n a l P r e fi x ................................ .......3 1
T a b e l 3 .4 A t u r a n u n t u k S e c o n d O r d e r D e r r iv a t i o n a l P r e fi x ................................ .3 2
T a b e l 3 .5 A t u r a n u n t u k D e r r i v a t i o n a l S u f fi x .........................................................3 2
T a b e l 4 .1 R e k a p i t u l a si U j i C o b a ............................................................................5 1
x iii
A B ST R A K
Q u e s tio n A n s w e r in g S y s te m (Q A S ) m e ru p a k a n b a g ia n d a ri p e n e litia n m e n g e n a i N a tu r a l
Language P r o c e s s in g (N L P ), d im a n a s is te m in i m e n g iz i n k a n pengguna m e n y a ta k a n
k e b u tu h a n in fo r m a s in y a d a la m b e n tu k n a tu ra l la n g u a g e q u e s tio n (p e rta n y a a n d a la m
s e m a k in m e n i n g k a t d iiri n g i p u la d e n g a n p e n in g k a ta n d a ta y a n g a d a p a d a w e b . U n tu k in i
d ig u n a k a n a d a la h D B P e d ia In d o n e s ia , d im a n a D B P edia m e ru p a k a n b a s is d a ta d a ri
u n tu k m e l a k u k a n k u e ri p a d a D B P e d ia In d o n e s ia u n t u k m e m p e ro le h ja w a b a n n y a . D a ri u ji
c o b a y a n g te la h d ila k u k a n , Q A S y a n g d ib u a t m e m b e r ik a n n ila i a k u ra s i s e b e s a r 7 1 ,5 0 % .
x iv
A B ST R A C T
R o s y i d a h , D z a k i y a t u r . 2 0 1 4 . Q u e s ti o n A n s w e r i n g S y st e m U s i n g S e m a n t i c W e b
a n d P o r te r A lg o r ith m fo r W o r d S te m m er . T h e sis. In form atics D e p a rtm e nt o f
F a c u lty of S cie n c e and T e c h n olo g y . M a ula n a M a li k I b r a h im Sta te Isla m ic
U n i v e r s it y , M a la n g .
A d v i s e r : (I ) A ’l a S y a u q i , M .K o m , M .K o m ( II ) F a tc h u r r o c h m a n , M .K o m
Q u e s tio n A n s w e rin g S y s te m (Q A S ) is p a rt o f th e re se a rc h on th e N a tu ra l L a n g u a g e
P ro c e s s in g ( N L P ), w h e re th e s y s te m is a llo w u s e r s to e x p re s s th e ir in fo rm a tio n n e e d s in
th e fo rm o f n a t u ra l la n g u a g e q u e s tio n (q u e s tio n s i n n a tu ra l l a n g u a g e ), a n d re tu rn s t h e te x t
o r a p h ra s e a s th e a n s w e r. C u rre n tl y , th e n e e d to g e t in fo rm a tio n q u ic k ly a n d a c c u ra te ly
in c re a s in g l y a c c o m p a n ie d b y a n i n c re a s e in t h e e x is tin g d a ta o n th e w e b . F o r th is s tu d y ,
re se a rc h e rs a re b u ild i n g a Q u e s t io n A n s w e rin g S y s te m using th e P o rt e r a lg o rit h m fo r
s te m m in g . P o rte r s te m m in g a lg o rith m is used to s te m s e n te n c e e n te re d b y th e u se r.
S o u rc e o f d a ta to b e u s e d is th e D B P e d ia In d o n e s ia , w h e re D B P e d ia is a d a ta b a s e th a t
h o ld s m il lio n s o f W i k ip e d ia in fo r m a tio n . R e s e a rc h e rs a ls o use SPA R Q L to query on
D B P e d ia In d o n e s ia to g e t th e a n s w e r. F ro m t h e e x p e rim e n ts th a t h a v e b e e n c a r rie d o u t,
Q A S g iv e a n a c c u ra c y 7 1 ,5 0 % .
xv
ال مل خ ص
ا ن ش ش ُ ذ ح ,ر ك ُ خ . 2 0 1 4 .ا ن ن ظ ب و ا ن س ؤ ا ل و ا ن ج ى ا ة ع ن ط ش َ ق ب ن ذ ال ن ٍ ا ن ى َ ت و ا ن خ ى ا س ص ي ُ ب د
أ ط ش و د خ .ق س ى ان ً عه ى ي برُ خ ،كهُ خ ان عه ى و (s te e m e r ث ى سر ش ين بن خ ر غُ شان كه ً خ (
S P A R Q L ، D b p e d ia ان كه ً ب د انج ذ ث :ي ع بن ج خ انه غ بر بن طجُ عُ خ ،ان س ؤا ل ان ج ىا ة ،وَ كُجُ ذَ ب ،
،دُ ث انن ظ ب و ه ى ان س ً ب ح نه ً سز خ ذ يُن بنز عجُ ش عن ب دزُ ب ج بر ه ى ي ن خ) (N L P انه غ بر بن طجُ عُ
ا ن ً ع ه ى ي ب ر ف ٍ ش ك م ي ع ب ن ج خ ا ن ه غ خ ا ن ط ج ُ ع ُ خ ( ا أل س ئ ه خ ف ٍ ا ن ه غ خ ا ن ط ج ُ ع ُ خ ) ،
وإ س ج ب ع ً قز ط ف برن صُ خ ق صُ ش حأ و دز ي عج ب س ح ي بان ج ىا ة .ف ٍ ان ى ق ذ ان ذ ب ض ش ،وان ذ ب ج خ إن ً
ان ذ ص ى ل عه ي بن ً عه ى ي ب د ث س ش ع خ وث ذ ق خ صا درُ شا ف ق ه ضَ ب د ح فُ بنجُ بن ب د ان ً ى ج ى د ح عه ً شج ك خ
ا إل ن ز ش ن ذ .ن ه ز ه ا ن ذ س ا س خ ،و ث ن ً ا ن ج ب د ث ا ن ن ظ ب و ا ن س ؤ ا ل و ا ن ج ى ا ة ث ب س ز خ ذ ا و خ ى ا س ص ي ُ خ
.ا ن خ ى ا س ص ي ُ خ ث ى س ر ش ا ن ن ب ث ع خ ا ن ً س ز خ ذ ي خ ن ه ج ً ه خ ا ال س ز ف ه ب ي ب ن ً ذ خ ه خ ث ى سر ش ي ن ان خ ر غُ ش ان كه ً خ
ه ٍ قب عذح D B P e d ia انذ ونُ سُب ،دُ ث D B P e d ia ث ب ن ً س ز خ ذ و .ي ص ذ س ا ن ج ُ ب ن ب ر ال س ز خ ذ ا ي ه ب ه ى
SPA R Q L .انج ب دث أَ ض ب ا سز خ ذا و ث ُ ب ن ب ر ً ن ى َ ك ُ ج ُ ذ َ ب ا ن ز ٍ ر ذ ً ال ن ً ال َ ُ ن ي ن ب ن ً ع ه ى ي ب د
xvi
امللخص
الرشيدة ,ذكية .4102 .النظام السؤال واجلواب عن طريق الداليل الويب واخلوارزميات بورتر من الة تغري
الكلمة ( (stemmerأطروحة .قسم املعلوماتية ،كلية العلوم والتكنولوجيا ،اجلامعة اإلسالمية احلكومية
موالنا مالك إبراهيم ماالنج .املشرف :أعلى شوقي املاجستري و فتح الرمحن املاجستري
ال كلمات البحث :معاجلة اللغات الطبيعية ،السؤال اجلواب ،ويكيبيدياSPARQL ،Dbpedia ،
النظام السؤال واجلواب )(QASهو جزء من البحث حول معاجلة اللغات الطبيعية)، (NLP
حيث النظام هو السماح للمستخدمني التعبري عن احتياجاهتم من املعلومات يف شكل معاجلة اللغة
الطبيعية (األسئلة يف اللغة الطبيعية) ،وإرجاع مقتطفات نصية قصرية أو حىت عبارة ما اجلواب .يف الوقت
احلاضر ،واحلاجة إىل احلصول على املعلومات بسرعة وبدقة زادت يرافقه زيادة يف البيانات املوجودة على
شبكة اإلنرتنت .هلذه الدراسة ،وبىن الباحث النظام السؤال واجلواب باستخدام خوارزمية بورتر من الة تغري
الكلمة .اخلوارزمية بورتر النابعة املستخدمة للجملة االستفهام املدخلة باملستخدم .مصدر البيانات
الستخدامها هو DBPediaاندونيسيا ،حيث DBPediaهي قاعدة بيانات من ويكيبيديا اليت حتمل
املاليني من املعلومات .الباحث أيضا استخدام SPARQLاالستعالم على DBPediaاندونيسيا
للحصول على اجلواب .من التجارب اليت مت القيام هبا ،األمر الذي جعل QASتعطي دقة .٪71.50
ABSTRACT
Rosyidah, Dzakiyatur. 2014. Question Ans wering System Using Semantic Web
and Porter Algorithm for Word Ste mmer. Thesis. Informatics Department of
Faculty of Science and Technology. Maulana Malik Ibrahim State Islamic
University, Malang.
Adviser: (I) A’la Syauqi, M.Kom, M.Kom (II) Fatchurrochman, M.Kom
Question Answering System (QAS) is part of the research on the Natural Language
Processing (NLP), where the system is allow users to express their information needs in
the form of natural language question (questions in natural language), and returns the text
or a phrase as the answer. Currently, the need to get information quickly and accurately
increasingly accompanied by an increase in the existing data on the web. For this study,
researchers are building a Question Answering System using the Porter algorithm for
stemming. Porter stemming algorithm is used to stem sentence entered by the user.
Source of data to be used is the DBPedia Indonesia, where DBPedia is a database that
holds millions of Wikipedia information. Researchers also use SPARQL to query on
DBPedia Indonesia to get the answer. From the experiments that have been carried out,
QAS give an accuracy 71,50 %.
xv
ABSTRAK
Question Answering System (QAS) merupakan bagian dari penelitian mengenai Natural
Language Processing (NLP), dimana sistem ini mengizinkan pengguna menyatakan
kebutuhan informasinya dalam bentuk natural language question (pertanyaan dalam
bahasa alami), dan mengembalikan kutipan teks singkat atau bahkan frase sebagai
jawaban. Saat ini, kebutuhan untuk mendapatkan informasi secara cepat dan akurat
semakin meningkat diiringi pula dengan peningkatan data yang ada pada web. Untuk ini
pada penelitian ini, peneliti membangun sebuah Question Answering System
menggunakan algoritma Porter sebagai stemmer kata. Algor itma Porter digunakan untuk
stemming pada kalimat tanya yang diinputkan oleh pengguna. Sumber data yang akan
digunakan adalah DBPedia Indonesia, dimana DBPedia merupakan basis data dari
Wikipedia yang menampung jutaan informasi. Peneliti juga menggunakan SPARQL
untuk melakukan kueri pada DBPedia Indonesia untuk memperoleh jawabannya. Dari uji
coba yang telah dilakukan , QAS yang dibuat memberikan nilai akurasi sebesar 71,50%.
xiv
BAB I
PENDAHULUAN
menuntut ilmu, bahkan jika menginginkan kebahagiaan dunia akhirat maka wajib
menuntut ilmu, seperti hadits yang diriwayatkan oleh Turmudzi berikut ini.
َو َم ْن أَ َرا َدهُ َما ف َ َع لَيْ ِه ِبا, اخ َرة َ ف َ َعلَيْ ِه ِب ا لْ ِعلْ ِمَ ْ َو َم ْن أَ َرا َد, الدنْيَا ف َ َعلَيْ ِه ِب ا ْل ِعلْ ِم
ِ اْل ُّ َم ْن أَ َرا َد
لْ ِعلْ ِم
Artinya: “Barang siapa yang menghendaki kehidupan dunia maka wajib baginya
memiliki ilmu, dan barang siapa yang menghendaki kehidupan akhirat, maka
wajib baginya memiliki ilmu, dan barang siapa menghendaki keduanya maka
wajib baginya memiliki ilmu”. (HR. Turmudzi)
Dari hadits tersebut jelas bahwa sebagai umat muslim wajib untuk
menuntut ilmu. Ada berbagai cara untuk memperkaya ilmu pengetahuan dan
memperoleh informasi, antara lain dengan membaca, berguru kepada seorang ahli,
ataupun secara otodidak melalui media elektronik, seperti internet, televisi, radio,
dan sebagainya. Semua hal tersebut dapat dilakukan sebaga i media pembelajaran
berikut.
1
2
Artinya:
3. Bacalah, dan Tuhanmulah yang Maha pemurah,
4. Yang mengajar (manusia) dengan perantaran kalam,
5. Dia mengajar kepada manusia apa yang tidak diketahuinya.
Menurut terjemah tafsir jalalain, makna bacalah pada la fal ayat ini ialah
mengukuhkan makna lafal pertama yang sama (dan Rabbmulah Yang Paling
Lafal ayat ini sebagai Haal dan Dhamir yang terkandung di dalam lafal Iqra’.
Selanjutnya, terjemah dari ayat keempat adalah yang mengajar (manusia) dengan
perantaraan kalam, manusia pertama yang menulis dengan memakai kalam atau
pena ialah Nabi Idris a.s. Pada ayat kelima, (Dia mengajarkan kepada manusia)
atau jenis manusia (apa yang tidak diketahuinya) yaitu sebelum Dia mengajarkan
kepadanya hidayah, menulis dan berkreasi serta hal- hal lainnya (As Suyuthi,
2008).
Dari ayat tersebut, dapat diilhami bahwa proses pembelajaran atau proses
pentransferan pengetahuan kepada manusia dari yang semula tidak tahu menjadi
tahu menggunakan perantara berupa pena. Pena yang dimaksud disini adalah baca
pengetahuan kepada manusia tidak secara langsung begitu saja. Akan tetapi Allah
Mesin pencari (search engine) merupakan salah satu fasilitas yang sering
dan lain sebagainya. Cara kerja search engine adalah sistem akan menampilkan
daftar dokumen yang berkaitan dengan keyword yang telah diinput oleh pengguna
(Gunawan, 2006). Gambar 1.1 menunjukkan daftar dokumen dari hasil pencarian
kueri secara mendalam. Search engine akan menampilkan daftar dokumen atau
harus memeriksa dan membaca setiap dokumen di daftar tersebut. Tidak jarang
yang tepat sesuai dengan keyword dicari. Hal ini dipengaruhi oleh tingginya
peningkatan data pada web, sehingga semakin banyak informasi dan pengetahuan
atau data yang ada pada internet, maka search engine akan mengembalikan daftar
dokumen yang banyak pula. Hal yang demikian kurang efisien dari segi waktu
Answering System (QAS), antara lain: tingginya peningkatan data web, kemajuan
mendapatkan informasi dengan cepat dan akurat (Tahri, 2013, hal. 23). Gambar
Gambar 1.2 Hasil Pencarian dari Wolfram Alpha Question Ansering System
(sumber: Wolfram Alpha, 10 Maret 2014)
(pertanyaan dalam bahasa alami), dan mengembalikan kutipan teks singkat atau
(QAS) atau sistem tanya jawab berupaya mencari jawaban spesifik terhadap
sebuah QAS harus dapat menghadirkan jawaban akhir kepada pengguna. Secara
menggunakan tema atau topik tertentu, misalnya: QAS seputar NBA (National
Basketball Association). QAS ini dibangun oleh Calvin Irwan, Dr. Eng. Ayu
liga bola basket pria di Amerika Serikat yang paling bergengsi di dunia. QAS lain
dikembangkan oleh Gunawan dan Gita Lovina. QAS ini menggunakan Alkitab
QAS yang akan dibangun tidak terpaku pada topik atau tema tertentu seperti pada
penelitian sebelumnya.
peringkat keenam secara global dan di United States (US). Wikipedia masuk ke
dalam top 10 sites. Hasil perankingan tersebut dapat dilihat pada Gambar 1.3.
7
Question Answering System (QAS) yang akan dibuat. Resource yang akan
informasi tersebut dalam sebuah web. DBPedia yang akan digunakan pada
penelitian ini adalah DBPedia Indonesia. DBPedia Indonesia mer upakan web
yang menyediakan data hasil ekstraksi dari Wikipedia Indonesia. Sehingga dapat
dilakukan pencarian yang kompleks terhadap data di Wikipedia. Ada 3 cara yang
Linked Data, SPARQL Endpoint dan RDF Dumps. Linked Data adalah
pada knowledge base. Sedangkan RDF Dumps merupakan hasil dari ekstraksi
Triple. Pada pembuatan QAS ini akan dilakukan pengaksesan DBPedia Indonesia
dapat membantu pengguna untuk menemukan informasi dengan cepat dan akurat.
adalah DBPedia
Indonesia
9
Answering System.
BAB I Pendahuluan
tugas akhir ini. Adapun yang dibahas dalam bab ini adalah dasar teori yang
SPARQL.
disusun sebelumnya serta pengujian Question Answering System yang telah dibuat
beserta pembahasannya.
BAB V Penutup
metode penelitian kuantitatif untuk mengukur akurasi jawaban dari QAS yang
akan dibuat.
BAB II
TINJAUAN PUSTAKA
oleh Meynar pada tahun 2007. Proses awal pada QAS adalah dengan mengambil
token-token pada setiap kalimat dokumen dan kalimat kueri. Setiap token yang
sama dari kalimat kueri akan memberikan nilai clue (+3) pada kalimat dokumen
tersebut. Selanjutnya masuk ke dalam proses rule sesuai dengan tipe kueri yang
diberikan. Dari proses tersebut, masing- masing kalimat akan memperoleh nilai
jawaban adalah kalimat yang memiliki nilai paling tinggi. Akurasi rata-rata rule
11
12
terhadap kueri oleh peneliti adalah 85,69 % dan akurasi rata-rata rule terhadap
kueri yang diberikan pengguna umum adalah 53,14 %. Kelebihan dari penelitian
ini antara lain: sistem ini berbasis web, kuerinya menggunakan bahasa alami, dan
Adapun kekurangan dari penelitian ini antara la in: jika terdapat penambahan
string dilanjutkan dengan pemotongan string untuk pengambilan data basis data.
stopwords, Expected Answer Type (EAT), dan keywords. Selanjutnya pada modul
Query Processor digunakan query basis data biasa. Query menggunakan EAT
sebagai kolom elemen tabel dan keywords untuk dicocokan pada elemen tabel
bahwa akurasi kebenaran aplikasi berdasarkan skenario uji mencapai 93, 18%,
13
2012).
menggunakan arsitektur umum dari QAS yang dibuat oleh Monz, yaitu Question
(Monz, 2003). Pada tahap Question Analysis menghasilkan dua buah representasi
pertanyaan sebagai output. Representasi pertama berupa sebuah query yang akan
adalah representasi semantik yang mengarah pada jenis informasi atau tipe
jawaban yang diinginkan oleh pertanyaan yang dijadikan input. Tahap Candidate
dokumen, daftar paragraf, daftar kalimat, atau daftar frase jawaban sebagai
System ini terdiri dari 3 proses utama, yaitu Question Classification and Decision
Ada 7 kelas utama untuk klasifikasi pertanyaan, yaitu human, location, entity,
description, abbreviation, number, dan boolean. Karena ada beberapa kelas untuk
Machine (SVM) untuk multi-class SVM yaitu Directed Acrylic Graph. Tahap
yang digunakan pada penelitian ini adalah linear karena kernel ini mampu bekerja
dengan cepat dalam menangani data yang besar. Penggunaan kernel ini memiliki
dari bahasa Yunani sema (nomina) ‘tanda’: atau dari verba samaino ‘menandai’,
‘berarti’. Istilah tersebut digunakan para pakar bahasa untuk menyebut bagian
Sedangkan web sendiri yaitu bagian visual dari internet. Web didasarkan
halaman majalah yang dilengkapi dengan gambar, teks, dan foto. Pembuat web,
komputer yang disebut dengan Hypertext Markup Languange atau HTML, yang
dan website. Semantic web merupakan web data yang memungkinkan mesin
untuk memahami suatu informasi pada World Wide Web sesuai maknanya atau
secara struktural. Ini dapat memperluas jaringan hyperlink suatu halaman web
dalam web tersebut dan bagaimana mereka saling berhubungan satu sama lain.
Hal tersebut memungkinkan suatu agen untuk otomatis mengakses web secara
lebih cerdas dan melakukan tugas-tugas atas nama pengguna (Berneers, 2001).
Semantic web sedikit berbeda apabila digambarkan seperti web pada umumnya.
Penggunaan semantic web merupakan suatu pergeseran paradigma saat ini dalam
penggunaan web sehari-hari. Maka dari itu, semantic web telah mengilhami
banyak orang untuk menciptakan aplikasi dan teknologi semantik yang inovatif.
Web yang telah dikoordinasi oleh World Wide Web Consortium (W3C). Beberapa
(RDF), RDF Schema, Web Ontology Language (OWL), dan SPARQL. Layer dari
16
(misalnya web page) dimana URI sebagai suatu penamaan unik untuk
merupakan sintaks yang berfungsi untuk menyajikan struktur data pada web.
disebut dengan istilah N-triple. Subjek mengacu pada resource yang ingin
RDF. Hal ini dapat digunakan dalam pembuatan hirarki properties dan classes-
nya.
d. Query
Sebuah query digunakan untuk mengakses data pada repository yang tersedia.
e. Ontology Vocabulary
adalah OWL Web Ontology Language, merupakan bahasa yang lebih kaya dan
Layer ini berupa rule dan sistem untuk melakukan reasoning pada ontology
g. Trust
2.4 Ontology
Definisi ontologi dalam ilmu komputer yang sering dirujuk berasal dari
Tom Gruber (2007) yang menyatakan “An ontology is an explicit and formal
Symbol Thing
stands for
Ada tiga komponen pada meaning triangle yang berupa symbol, concept
dan thing. Symbol merupakan kata atau istilah yang digunakan dalam bahasa
(syntax).
Thing (referent) adalah sesuatu yang diwakilkan oleh symbol, namun tidak
terdapat relasi langsung dari symbol menuju thing. Untuk memahami thing yang
istilah (term) atau konsep yang dinyatakan secara eksplisit. Semua istilah dalam
koleksi dari kata atau frase dengan satu set relasi linguistic. Thesauri juga
kueri yang diberikan pengguna, tujuan utama dari sistem temu kembali informasi
adalah mengembalikan informasi yang relevan dengan kueri dan informasi yang
Language Processing (NLP). Tujuan utama dari Question Answering (QA) adalah
pada pertanyaan
2.7 DBPedia
tersebut dalam sebuah web. DBPedia Indonesia merupakan sebuah web yang
dapat dilakukan pencarian yang kompleks terhadap data dari Wikipedia. Adapun
21
cara pengaksesan knowledge DBPedia Indonesia ada 3 cara, yaitu Linked Data,
o http://id.dbpedia.org/resource/Universitas_Indonesia
o http://id.dbpedia.org/resource/Indonesia
o http://id.dbpedia.org/resource/Soekarno
o http://id.dbpedia.org/resource/Jawa_Tengah
o http://id.dbpedia.org/resource/The_Beatles
Hasil dari query tersebut akan menampilkan nama dari gubernur dan wakil
2.8 Parsing
Parsing adalah proses untuk menguraikan kalimat menjadi per kata. Atau
dengan kata lain parsing adalah proses parser atau pemisahan dari elemen-elemen
pembentuk dokumen ke dalam satuan terkecil, yaitu kata (Zainal, 2009). Pemisah
antar kata yang umum digunakan dalam sebuah kalimat adalah spasi. Sehingga
pada penelitian ini akan digunakan spasi sebagai pemisah untuk menguraikan
2.9 Stemming
root wordnya yaitu “sama”. Proses stemming pada teks berbahasa Indonesia
berbeda dengan stemming pada teks berbahasa Inggris (Keke, 2012). Pada
2.10 SPARQL
protocol dan bahasa query untuk Semantic Web’s resources. Sebuah query yang
menggunakan SPARQL dapat terdiri atas triple patterns, konjungsi (or) dan
disjungsi (and). Berikut ini adalah contoh query yang menghasilkan semua ibu
kota di Indonesia:
APIs seperti: ARQ, Rasqal, RDF::Query, twingql, Pellet, dan KAON2. Tools
query dengan berbagai aplikasi yang ada. Namun, sebagai standar dapat
W3C (Beckett, 2013). Hasil dari query di atas adalah (Ibrahim, 2007):
<?xml version="1.0"?>
<sparql xmlns="http://www.w3.org/2005/sparql-results#">
<head>
<variable name="capital"/>
<variable name="province"/>
24
</head>
<results>
<result>
<binding name="capital">
<literal
datatype="http://www.w3.org/2001/XMLSchema#string">
Bandung
</literal>
</binding>
<binding name="province">
<literal
datatype="http://www.w3.org/2001/XMLSchema#string">
Jawa Barat
</literal>
</binding>
</result>
<!-- more results -->
</results>
</sparql>
BAB III
1. Text Processing
Ini merupakan tahap awal untuk mengolah kalimat tanya yang d iinput
2. Data Mining
adalah kata yang telah dilakukan text processing pada tahap pertama.
25
26
3. Menampilkan jawaban
Menghapus Stop
Porter Stemming Cari Resource
Words
yang akan dibangun. Penjelasan dari masing- masing proses pada blok diagram di
Blok diagram dari text processing dapat dilihat pada Gambar 3.2.
Kalimat tanya
Tokenizing
Menghapus
stopword
Porter Stemming
Kandidat kata
beberapa macam kata tanya, antara lain: apa atau apakah, siapa atau
3.1.1.2 Casefolding
semua. Proses ini juga dapat dinamakan sebagai case folding (membuat
Setelah diubah menjadi huruf kecil semua, tanda tanya (?) yang
3.1.1.4 Parsing
kalimat yang telah diinput oleh pengguna menjadi per kata. Proses parsing
kata-kata yang tidak mempunyai makna, misalnya: di, yang, pada, ke, dan
disimpan ke dalam suatu tabel pada database dan dicocokkan satu persatu
stopwords dari kalimat yang diinput oleh pengguna maka kata tersebut
akan dihapus.
Frakes pada tahun 1992. Stemming kata dilakukan pada kata yang
word
Remove Particle
A rule i s fired
stem
Gambar 3.3 Blok diagram Porter Stemming
(sumber: Agusta, 2009)
1. Hapus Particle
3. Hapus awalan pertama. Jika tidak ada lanjutkan ke langkah 4a, jika ada
langkah 5b
31
word
root word
ini. Aturan tersebut dapat dilihat pada Tabel 3.1, Tabel 3.2, Tabel 3.3,
mendapatkan kata dasar yang benar dari hasil pemenggalan imbuhan dari suatu
(Mandala, 2004):
seharusnya. Contoh: kata masalah menjadi masa. Kesalahan ini dapat timbul
seharusnya. Contoh: kata belajar menjadi lajar. Kesalahan ini dapat timbul
pemenggalan kata dasar yang didapat tetap telapak. Kesalahan ini dapat
Spelling exception: yaitu huruf pertama kata dasar yang didapat tidak benar
ukul. Kesalahan ini dapat timbul karena ada beberapa imbuhan yang berubah
bentuk ketika ditempelkan pada suatu kata dasar. Misalnya awalan berR-,
meN-, teR-, peR-, akan bergantung pada huruf pertama kata dasar dimana
meng- dan karang atau men- / pen- meluluhkan huruf ‘p’. Contoh: menuai
Hal ini dapat terjadi karena morfologi bahasa Indonesia yang kompleks,
sehingga sangat sulit atau bahkan tidak mungkin untuk merumuskan aturan
yang sempurna.
34
yang dapat dirumuskan, maka proses temu kembali akan semakin efektif.
dalam stopwords. Setelah dilakukan stemming, maka akan diperoleh kata dasar
atau akar kata yang akan diproses ke tahap selanjutnya. Dari beberapa langkah
pada text processing ini selanjutnya diperoleh kandidat kata. Kandidat kata ini
yaitu data mining. Data mining ini dilakukan untuk mencari resource di
Wikipedia.
dimaksud pada QAS ini adalah untuk menemukan kata yang dapat
pengguna. Data yang akan di-mining adalah data pada DBPedia Indonesia.
dari text processing pada proses sebelumnya. Sehingga pada tahap ini
endpoint DBPedia Indonesia. Blok diagram dari data mining dapat dilihat
Keyword
Cari resource di
Wikipedia
Kueri SPARQL
Abstrak dari
resource di
DBPedia
Indonesia
digunakan untuk parsing kueri SPARQL. Hasil dari proses pencarian ini
ditemukan. Hasil dari kueri pada Gambar 3.6 dapat dilihat pada Gambar
3.7.
Desain interface untuk tampilan awal dari sistem dapat dilihat pada
ke dalam sistem. Berikut penjelasan untuk kolom Your Question, Keyword Found,
pengguna
stemming.
Wikipedia
SPARQL
untuk mendukung pembuatan dan uji coba Question Answering System (QAS).
yang terdiri atas program Apache HTTP Server, MySQL database dan
Perl.
- Notepad++
- Mozilla Firefox
39
aplikasi
- Adobe Photoshop
Pada bab ini membahas tentang implementasi dari perancangan yang telah
dibuat sebelumnya.
Sistem yang dibuat terdiri dari 3 proses utama, yaitu text processing, data
mining dan menampilkan jawaban. Text processing terdiri dari beberapa langkah,
yaitu:
- Mengubah string menjadi huruf kecil semua (lower) atau case folding
- Mencari kata dasar dari masing- masing kata yang telah di-parsing dengan
$i = 0;
while($split[$i] != null) {
40
41
$dicari=
hapussStopword(hapusakhiran(hapusawalan2(hapusawalan1(hap
uspp(hapuspartikel($pecah[0])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[1])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[2])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[3])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[4])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[5])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[6])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[7])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[8])))))).'
'.hapusStopword(hapusakhiran(hapusawalan2(hapusawalan1(ha
puspp(hapuspartikel($pecah[9]))))));
$i++;
if(mysql_num_rows($sql) == 1) {
$stopword = $kata;
$katabaru = str_replace($kata," ",$kata);
return $katabaru;
}
else {
$katabaru = $kata;
return $katabaru;
}}
42
1. Hapus Particle
3. Hapus awalan pertama. Jika tidak ada lanjutkan ke langkah 4a, jika
ke langkah 5b
word
root word
}
}
return $kata;
}
if(substr($kata,0,4)=="meng"){
if(substr($kata,4,1)=="e"||substr($kata,4,1)=
="u"){
$kata = "k".substr($kata,4);
}else{
$kata = substr($kata,4);
}
}else if(substr($kata,0,4)=="meny"){
$kata = "s".substr($kata,4);
}else if(substr($kata,0,3)=="men"){
$kata = substr($kata,3);
}else if(substr($kata,0,3)=="mem"){
if(substr($kata,3,1)=="a" || substr($kata,3,1)=="i"
|| substr($kata,3,1)=="e" || substr($kata,3,1)=="u"
|| substr($kata,3,1)=="o"){
$kata = "p".substr($kata,3);
}else{
$kata = substr($kata,3);
}
44
}else if(substr($kata,0,2)=="me"){
$kata = substr($kata,2);
}else if(substr($kata,0,4)=="peng"){
if(substr($kata,4,1)=="e" ||
substr($kata,4,1)=="a"){
$kata = "k".substr($kata,4);
}else{
$kata = substr($kata,4);
}
}else if(substr($kata,0,4)=="peny"){
$kata = "s".substr($kata,4);
}else if(substr($kata,0,3)=="pen"){
if(substr($kata,3,1)=="a" ||
substr($kata,3,1)=="i" || substr($kata,3,1)=="e" ||
substr($kata,3,1)=="u" || substr($kata,3,1)=="o"){
$kata = "t".substr($kata,3);
}else{
$kata = substr($kata,3);
}
}else if(substr($kata,0,3)=="pem"){
if(substr($kata,3,1)=="a" ||
substr($kata,3,1)=="i" || substr($kata,3,1)=="e" ||
substr($kata,3,1)=="u" || substr($kata,3,1)=="o"){
$kata = "p".substr($kata,3);
}else{
$kata = substr($kata,3);
}
}else if(substr($kata,0,2)=="di"){
$kata = substr($kata,2);
}else if(substr($kata,0,3)=="ter"){
$kata = substr($kata,3);
}else if(substr($kata,0,2)=="ke"){
$kata = substr($kata,2);
}
}
return $kata;
}
if(substr($kata,0,3)=="ber"){
$kata = substr($kata,3);
}else if(substr($kata,0,3)=="bel"){
$kata = substr($kata,3);
}else if(substr($kata,0,2)=="be"){
$kata = substr($kata,2);
45
return $kata;
}
?>
curl_setopt($ch,
CURLOPT_RETURNTRANSFER,
true);
/*
Here you find more options for curl:
http://www.php.net/curl_setopt
*/
$response = curl_exec($ch);
curl_close($ch);
return $response;
}
$retValue = $retValue."<br/>";
foreach(array_keys($array) as $key)
{
$retValue = $retValue.$spaces
."<strong>".$key."</strong>"
.printArray($array[$key],
$spaces);
}
$spaces = substr($spaces, 0, -30);
}
else $retValue =
$retValue." - ".$array."<br/>";
return $retValue;
}
?>
dibuat dengan beberapa kolom yaitu kolom your question, keyword found,
Implementasi tampilan awal dari sistem ini dapat dilihat pada Gambar 4.1.
48
karena jika menggunakan salah satu saja, jawaban yang ditampilkan terkadang
tidak cocok dengan pertanyaan yang dimasukkan oleh pengguna. Hal ini
teratas.
pada kolom Keyword Found menampilkan kata kunci untuk proses pencarian link
Engine (GCSE). Kata yang ditampilkan pada Wikipedia endpoint digunakan pada
diperoleh adalah maksud sholat jamak. Selanjutnya keyword ini digunakan untuk
50
http://id.wikipedia.org/wiki/Salat_Jamak
http://id.wikipedia.org/wiki/Salat_Qashar
http://id.wikipedia.org/wiki/Majelis_Tafsir_Al_Quran
Setelah itu dilakukan kueri SPARQL dan jawaban pada tampilan kepada
abstrak dari link Wikipedia yang pertama yaitu mengenai salat jamak, paragraf
kedua menampilkan abstrak dari link Wikipedia yang kedua yaitu salat qasar, dan
paragraf ketiga menampilkan abstrak dari link Wikipedia yang ketiga yaitu
dicek ketepatan jawabannya. Ada 200 pertanyaan yang diujikan dengan beberapa
kata tanya yang berbeda, yaitu: apa atau apakah, siapa atau siapakah, dimana atau
Jawaban dari hasil uji coba terbagi menjadi 2 yaitu, jawaban tepat dan
jawaban tidak tepat. Jawaban tepat adalah kolom untuk jawaban yang dijawab
dengan tepat oleh sistem, sedangan kolom jawaban tidak tepat adalah untuk
jawaban yang salah atau sistem tidak mengembalikan jawaban sama sekali kepada
pengguna.
51
pertanyaan yang dijawab dengan tepat adalah 143 pertanyaan, sedangkan jawaban
yang tidak tepat sebanyak 57 pertanyaan. Rekapitulasi dari uji coba dapat dilihat
Dari hasil uji coba terhadap 200 pertanyaan, nilai akurasi jawaban yang
adalah huruf pertama kata dasar yang didapat tidak benar ini diakibatkan
antara lain:
stemming dan penghapusan stopwords adalah planet pilik cincin. Kata dasar
Kata dasar dari memulai seharusnya adalah mulai. Memulai merupakan kata
dan penghapusan stopwords adalah kukur presisi. Kata dasar dari mengukur
listrik. Kata dasar dari penemu seharusnya adalah temu. Penemu merupakan
kata yang mempunyai awalan pe-. Keyword yang ditemukan adalah te listrik
pertanyaan yaitu:
dan penghapusan stopwords adalah aya natal. Kata dasar dari perayaan
tanam. Menanam adalah kata yang memiliki awalan me-. Kesalahan yang
pertanyaan.
adalah didi dan kata ini mengalami overstem. Kata dasar dari pendidikan
adalah didik. Kata pendidikan memiliki awalan pe- dan akhiran –an.
pertanyaan, yaitu:
ditemukan ada yang sesuai dengan pertanyaan namun ab strak yang disajikan
endpoint yang tidak sesuai, seperti yang terjadi pada beberapa pertanyaan,
antara lain:
55
Daftar_lagu_nasional_Indonesia, Satu_Nusa_Satu_Bangsa,
Lagu_Bangsa_Johor
Dari ketiga endpoint tersebut tidak ada jawaban yang sesuai dengan
pertanyaan.
Pertanyaan no 104 (Berapa warna yang ada p ada pelangi?). Keyword yang
Pertanyaan no 118 (Apa saja dampak dari bom nuklir?). Keyword yang
antara lain:
56
Daya_ledak_senjata_nuklir,
Serangan_bom_atom_di_Hiroshima_dan_Nagasaki, Senjata_nuklir
Abstrak yang ditampilkan dari ketiga endpoint tersebut masih kurang sesuai
menjawab pertanyaan.
ditemukan sesuai yaitu organisasi nu. Wikipedia endpoint nya juga sesuai,
yaitu:
Akan tetapi dari ketiganya, abstrak yang ditampilkan tidak dapat menjawab
pertanyaan.
ditemukan adalah cipta lagu rasa sayange. Tiga Wikipedia endpoint yang
didapat yaitu:
menjawab pertanyaan.
didapatkan yaitu:
Pesta_Olahraga_Asia_Tenggara, Pesta_Olahraga_Asia_Tenggara_2013,
Pesta_Olahraga_Asia_Tenggara_2011
Daftar_negara_menurut_luas_wilayah, Indonesia,
Daerah_Khusus_Ibukota_Jakarta
pertanyaan.
ditemukan adalah berapa jumlah album arie lasso. Kata-katanya tetap tidak
yaitu:
Ari_Lasso, Keseimbangan_(album_Ari_Lasso),
Selalu_Ada_(album_Ari_Lasso)
antara lain:
Kota_Malang,
Daftar_kota_di_Indonesia_menurut_hari_jadi, Muhammad_Anton
pertanyaan.
ditemukan sudah sesuai dengan pertanyaan. Namun data yang tersaji pada
Konferensi_Asia%E2%60%93Afrika,
Konferensi_Tingkat_Tinggi_Asia%E2%80%93Afrika_2005, Gerakan_Non-
Blok
ada yang sesuai dengan pertanyaan namun abstrak yang disajikan belum
pertanyaan.
wajib bayar zakat bulan. Wikipedia endpoint yang ditemukan ada yang
menjawab pertanyaan.
ada yang sesuai dengan pertanyaan namun abstrak yang disajikan belum
pengguna.
yaitu:
Merdeka_17805, Merah_Putih_(film),
Daftar_negara_dengan_pengakuan_terbatas
Johannes_Suryo_Prabowo, Universitas_Syiah_Kuala,
Usulan_ibu_kota_Indonesia_masa_depan
62
yang ditemukan yaitu bangkit nasional ingat. Tiga Wikipedia endpoint yang
1945?). Keyword yang ditemukan yaitu jepang serah hadap belanda 1945,
Sumatera_Barat_pada_masa_pendudukan_Jepang.
Kinali,_Pasaman_Barat,Sudungdewo,_Kertek,_Wonosobo,Kabupaten_Hulu
_Sungai_Tengah
endpoint yang ditemukan tidak sesuai dan tidak ada jawabannya yaitu:
Kinali,_Pasaman_Barat, Kabupaten_Hulu_Sungai_Tengah,
Tokoh_dari_Jombang
yang ditemukan sungai dunia dan Wikipedia endpoint tidak ada yang sesuai
yaitu:
ditemukan adalah alat napas serangga. Wikipedia endpoint dan abstrak yang
dengan pertanyan.
Keyword yang ditemukan adalah berapa jumlah kadar air tubuh manusia.
Laksana,_Pakuhaji,_Tangerang, Pakuhaji,_Tangerang,
Raden_Aria_Wira_Tanu_II
kata belajar menjadi lajar. Kesalahan ini dapat timbul karena kekurangan
pada aturan pola imbuhan yang didefinisikan. Kesalahan seperti ini dijumpai
Pesta_Olahraga_Asia_Tenggara, Pesta_Olahraga_Asia_Tenggara_2013,
Pesta_Olahraga_Asia_Tenggara_2011
ditemukan sudah sesuai dengan pertanyaan. Namun data yang tersaji pada
Konferensi_Asia%E2%60%93Afrika,
Konferensi_Tingkat_Tinggi_Asia%E2%80%93Afrika_2005, Gerakan_Non-
Blok
Huruf pertama kata dasar yang didapat tidak benar yang d iakibatkan dari
dapat timbul karena ada beberapa imbuhan yang berubah bentuk ketika
67
ditempelkan pada suatu kata dasar. Pada uji coba yang telah dilakukan,
kasus spelling exception dijumpai pada kata dengan pola sebagai berikut:
(2) Overstemming
masalah menjadi masa. Kesalahan ini dapat timbul karena bentuk kata
dasar yang menyerupai imbuhan. Pada uji coba yang telah dilakukan kasus
menjadi te.
menjadi anam.
(3) Understemming
kata belajar menjadi lajar. Kesalahan ini dapat timbul karena kekurangan
pada aturan pola imbuhan yang didefinisikan. Pada uji coba yang telah
68
berikut:
Awalan pe- dan akhiran –an, seperti pada kata diadakan mengalami
muslim. Seperti apa yang telah dikatakan pada hadits yang diriwayatkan oleh
Hadits tersebut secara jelas juga menerangkan bahwa jika kita sebagai
akhirat, maka kita juga wajib menuntut ilmu. Ada berbagai cara menuntut
ilmu, antara lain: berguru secara langsung kepada ahlinya atau belajar melalui
dalam Al Qur’an surat Al A’laq ayat 3-5 termaktub ayat mengenai media
pembelajaran, yaitu:
69
Artinya:
pembelajaran atau pentransferan ilmu kepada manusia dari yang semula tidak tahu
jalalain, makna bacalah pada lafal ayat ini ialah mengukuhkan makna lafal
pertama yang sama (dan Rabbmulah Yang Paling Pemurah) artinya tiada seorang
pun yang dapat menandingi kemurahan-Nya. Lafal ayat ini sebagai Haal dan
Dhamir yang terkandung di dalam lafal Iqra’. Selanjutnya, terjemah dari ayat
pertama yang menulis dengan memakai kalam atau pena ialah Nabi Idris a.s. Pada
ayat kelima, (Dia mengajarkan kepada manusia) atau jenis manusia (apa yang
digunakan menjadi salah satu media pembelajaran atau sarana untuk memperoleh
ilmu tentang Islam. Berdasarkan hasil uji coba, QAS yang dibuat dapat menjawab
beberapa pertanyaan seputar agama Islam seperti: kapan sholat Idul Adha
berlangsung?, kapan terjadinya perang badar?, apa yang dimaksud dengan haji?,
apa yang dimaksud dengan shalat?, apa yang dimaksud dengan zakat?, apa ya ng
dimaksud dengan puasa?, kapan waktu yang diharamkan untuk berpuasa?, dimana
letak masjid nabawi?, apa saja rukun islam itu?, apa saja rukun iman itu?, kapan
waktu shalat dhuha?, apa yang dimaksud dengan shalat istikharah?, dan apa yang
PENUTUP
5.1 Kesimpulan
Dari proses perancangan, implementasi hingga uji coba yang telah peneliti
lakukan dapat disimpulkan bahwa Question Answering System yang telah dibuat
sebesar 71,50 % dari 200 pertanyaan yang telah diujikan. Algoritma Porter
sebagai stemmer kata mempunyai andil dalam menentukan keyword atau kandidat
kata untuk proses pencarian jawaban. Jika keyword yang diperoleh dari proses
stemming tidak mengalami kesalahan, maka dapat diperoleh jawaban yang sesuai
dengan pertanyaan.
5.2 Saran
Dari beberapa kelemahan yang telah dipaparkan pada bab sebelumnya, sistem
40
BAB V
PENUTUP
5.1 Kesimpulan
Dari proses perancangan, implementasi hingga uji coba yang telah peneliti
lakukan dapat disimpulkan bahwa Question Answering System yang telah dibuat
sebesar 71,50 % dari 200 pertanyaan yang telah diujikan. Algoritma Porter
sebagai stemmer kata mempunyai andil dalam menentukan keyword atau kandidat
kata untuk proses pencarian jawaban. Jika keyword yang diperoleh dari proses
stemming tidak mengalami kesalahan, maka dapat diperoleh jawaban yang sesuai
dengan pertanyaan.
5.2 Saran
Dari beberapa kelemahan yang telah dipaparkan pada bab sebelumnya, sistem
71
DAFTAR PUSTAKA
Agusta, L. 2009. Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief &
Adriani untuk Stemming Dokumen Teks Bahasa Indonesia. Konferensi Nasional
Sistem dan Informatika, November 14. Bali: Universitas Kristen Satya Wacana.
As Suyuthi, J., & Muhammad Ibnu, J. 2008. Tafsir Jalalain. Tasikmalaya: Pustaka Al-
Hidayah.
Berners-Lee, T., Hendler, J., & Lassila, O. 2001. The Semantic Web. American Scientific.
Djajasudarman, & Fatimah. 1993. Semantik 1: Pengantar ke Arah Ilmu Makna. Bandung:
PT. REFIKA.
Dolarosa, R. 2008. Implementasi Question Answering System dengan Metode Rule-Based
Pada Banyak Dokumen Berbahasa Indonesia. Bogor : Institut Pertanian Bogor
(IPB).
Gunawan, & Lovina, G. 2006. Question Answering System dan Penerapannya Pada
Alkitab. Jurnal Informatika Vol. 7 No. 1 Mei .
Handojo, A., Lie, E., & Intan, R. 2012. Aplikasi Question Answering System dengan
Metode Rule-Based Question Answering System pada Alkitab. Jurnal Informatika
Vol. 11 No. 1 Mei .
Ibrahim, N. 2007. Pengembangan Apikasi Semantic Web Untuk Membangun Web yang
Lebih Cerdas. Jurnal Informatika, Vol. 3 No. 1 Juni , 27-39.
Irwan, C., & Ayu Purwarianti, E. 2012. Studi dan Implementasi Question Answering
System Bahasa Indonesia pada Perangkat Bergerak Domain National Basketball
Association. Jurnal Sarjana Institut Teknologi Bandung bidang Teknik Elektro dan
Informatika Vol. 1, No. 3 Oktober .
Keke, D., Chikita, R., & Prayogo, A. D. 2012. Sistem Temu Balik Informasi "Algoritma
Nazief dan Adriani". Jurusan Ilmu Komputer, Fakultas MIPA, Universitas Gadjah
Mada .
Koivunen, M. R., & Miller, E. 2002. W3C Semantic Web Activity. Semantic Web Kick-
Off in Finland (Vision, Technologies, Research, and Applications) (hal. 27-43).
Helsinki: HIIT Publications.
Monz, C. 2003. From Document Retrieval to Question Answering. ILLC Dissertation
Series .
1. Daftar Stopword
yang, mampu, tentang, di, setelah, semua, hampir, juga, am, antara, dan, ada,
seperti, jadi, karena, sudah, tetapi, oleh, bisa, tidak, sayang, melakukannya,
lakukan, memang , baik, lain, pernah, setiap, untuk, dari, mendapatkan, punya,
telah, memiliki, dia, miliknya, bagaimana, bagaimanap un, i, jika, ke, dalam,
itu, sama, paling, biarkan, mungkin, aku, sebagian, besar, harus, saya, off,
sering, pada, hanya, atau, kita, sendiri , agak, kata, begitu, beberapa, mereka,
kemudian, sana, ini, tis, sungguh, keinginan, adalah, kami, apa, kapan, mana,
sementara, siapa, mengapa, akan, dengan, belum, anda, sebuah, atas, menurut,
sesuai, seberang, sebenarnya, sekali, lagi, terhadap, memungkinkan, sendirian,
bersama, meskipun, selalu, apapun, siapapun, anyways, saja, selain, muncul,
menghargai, tepat, sekitar, samping, bertanya, terkait, tersedia, jauh, sangat,
menjadi, sebab, sebelum, sebelumnya, belakang, percaya, bawah, terbaik,
lebih, luar, keduanya, singkat, namun, ayo, c, datang, cant, penyebab, tertentu,
tentu, perubahan, jelas, co, com, akibatnya, mempertimbangkan, berisi,
mengandung, saat, pasti, dijelaskan, berbeda, melakukan, dilakukan, selama,
edu, misalnya, delapan, tempat, cukup, seluruhnya, terutama, et, dll, bahkan,
orang, semuanya, mana- mana, mantan, kecuali, sedikit, kelima, pertama, lima,
diikuti, berikut, sebagainya, empat, lanjut, mendapat, diberikan, memberi,
pergi, salam, terjadi, halo, membantu, maka, sini, inilah, selanjutnya, disini,
sesudah, dirinya, hi, nya, mudah- mudahan, howbeit, yaitu, diabaikan,
langsung, lantaran, inc, menunjukkan, ditunjukkan, batin, sejauh, sebaliknya,
bukan, terus, tahu, diketahui, terakhir, akhir-akhir, kurang, supaya, mari, suka,
kemungkinan, kecil, lihat, mencari, tampak, ltd, banyak, berarti, apalagi,
diriku, nama, nd, dekat, perlu, butuh, kebutuhan , baru, berikutnya, sembilan,
satu, biasanya, novel, sekarang, oh, ok, oke, tua, keluar, secara, keseluruhan,
khususnya, per, ditempatkan, silahkan, plus, menyediakan, que , qv, rd,
kembali, benar-benar, mengenai, tanpa, memandang, menganggap, relatif,
masing- masing, benar, melihat, berkata, mengatakan, kedua, tampaknya,
dilihat, masuk, akal, dikirim, serius, tujuh, seharusnya, boleh, sejak, enam,
seseorang, entah, sesuatu, kadang, kadang-kadang, suatu, segera, maaf,
ditentukan, tentukan, menentukan, masih, sub, sup, t, menerima, mengambil,
katakan, cenderung, th, terima, kasih, thanx, thats, situ, demikian, dalamnya,
theres, d, berpikir, ketiga, teliti, seksama, tiga, melalui, seluruh, sehingga,
bersama-sama, arah, mencoba, dua, kali, un, sayangnya, sampai, kepada,
penggunaan, digunakan, berguna, menggunakan, nilai, berbagai, vs, ingin,
cara, selamat, whereafter, sedangkan, dimana, pun, apakah, utuh, mau,
bertanya-tanya, ya, kau, milikmu, dirimu, nol, memperhatikan, a, aduh, agar,
akhir, antaranya, apa-apa, awal, ayolah, b, bagian, bahwa, bapak, barang, tadi,
baru-baru, barusan, bekas, beliau, berakhir, berbalik, bergerak, besok, biasa,
bu, buat, bulat, co, con, contoh, dahulu, lain- lain, depan, detail, detik,
manapun, disisi, tengah-tengah, abaikan, diambil, dibuat, didapat, dimanakah,
dinyatakan, diperlukan, ditindaklanjuti, puluh, belas, e, ex, g, giliran h, hadir,
hadirat, hadirin, hai, haiyaa, hal, hamba, hari, hello, heran, ibu, inc, iya, j,
jangan, jatuh, jenis, juta, k, kanan, karenanya, kemana, kemari, kebanyakan,
kelompok, kemanakah, kemarin, kenapa, kepentingan, keterangan, ketika, kira,
kira-kira, kiranya, kosong, kursus, l, la, pula, lainnya, laki, laki- laki, lalu,
lanjutkan, lawan, layak, tinggi, lewat, lusa, m, malah, malahan, masa, masalah,
masing, melanjutkan, membuat, membuka, meminta, mempunyai, menarik,
menerus, mengisi, menjaga, menyebabkan, menyuruh, merasa, mestinya,
miliar, milikkita, mr, mrs, mulai, n, nampak, nomer, nomor, non, nyonya, o,
on, p, paduka, pak, panjang, penting, penuh, penyajian, perihal, persis, point,
pria, r, rata, rata-rata, ratus, rendah, ribu, runcing, rupiah, s, saudara, saudari,
sebagai, sebagaimana, sebelas, segala, sejumlah, sekelompok, selama-
lamanya, semoga, seorang, sepanjang, sepenuhnya, sepuluh, sesungguhnya,
setengah, setidaknya, siapakah, sisi, nanti, sulung, sungguh-sungguh, tahun,
tak, satupun, seorangpun, tambah, tanya, tapi, tebal, terbaru, terbelakang,
terbesar, terbuka, terkecil, terlalu, terlihat, ternyata, terpanjang, tertarik,
tertinggi, terus-menerus, dapat, tipis, titik, triliun, tuan, u, umum, umumnya, v,
w, www, x, y, oleh, meski, sebanyak, cuma, percuma, para, ia, rp, bagi,
bahwa, tersebut, merupakan,
153
Berapa jumlah korban Tsunami di Aceh
tahun 2004?
177
Mengapa Al Qur’an diturunkan secara
berangsur-angsur?