Μετάβαση στο περιεχόμενο

Σημασιολογικός Ιστός

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Ο Σημασιολογικός Ιστός (Web 3.0 ή Semantic Web στα αγγλικά) είναι μια επέκταση του σημερινού Ιστού, που θα φέρει δομή στο ουσιαστικό περιεχόμενο των ιστοσελίδων. Η λογική πίσω από αυτό είναι ότι η δημοσιευμένη πληροφορία θα περιέχει μεταδεδομένα, τα οποία θα είναι κοινά για όλους, θα μπορούν να «κατανοούνται» και από μηχανές, οι οποίες θα βοηθήσουν στην καλύτερη συλλογή και επεξεργασία τους.

Ο Σημασιολογικός Ιστός βασίζεται σε τεχνολογίες που ήδη υπάρχουν (URI και XML) αλλά και σε νέες τεχνολογίες (RDF, RDFS, OWL, κα.), οι οποίες αναπτύσσονται με την βοήθεια της κοινότητας. Δεδομένου ότι ο νέος Ιστός σκοπεύει να είναι μια μεγάλη βάση όπου δεδομένα από διαφορετικά πεδία θα συνδέονται μεταξύ τους, αναμένεται να παίξει μεγάλο ρόλο στη ζωή μας.

Μερικά από τα πεδία στα οποία αναμένεται να έχει την μεγαλύτερη επίδραση είναι στην υγεία, στην παιδεία και στις επιχειρήσεις. Υπάρχουν ήδη πολλές προσπάθειες από εταιρίες, ερευνητές και μη κερδοσκοπικές οργανώσεις για να παραγάγουν πρότυπα οντολογιών, κυρίως για τα παραπάνω πεδία, για να υπάρχουν κοινές γλώσσες και περισσότερα δεδομένα τα οποία να μπορούν να συνδυαστούν για καλύτερα αποτελέσματα.

Στην υγεία, γίνεται προσπάθεια για τη δημιουργία ενοποιημένων γλωσσών ιατρικής ορολογίας και υπηρεσίες που θα βοηθάνε το ιατρικό προσωπικό και θα κατευθύνουν τους καταναλωτές σε αξιόπιστες πληροφορίες υγείας σχετικά με την κατάστασή τους.

Στην εκπαίδευση, ο Σημασιολογικός Ιστός θα συμβάλει σημαντικά στην μάθηση κυρίως στον τρόπο αναζήτησης πληροφοριών, στην οργάνωση των αποτελεσμάτων και στη δημιουργία ενός προγράμματος μάθησης ειδικό για το καθένα.

Στον επιχειρηματικό τομέα, θα υπάρχει καλύτερη οργάνωση των εταιριών, καλύτερες εμπειρίες για τους χρήστες στις διαδικτυακές αγορές και καλύτερος συντονισμός μεταξύ διαφορετικών εταιριών.

Στην καθημερινότητά θα υπάρχουν επιδράσεις του Web 3.0 στα κοινωνικά δίκτυα και εικονικές κοινότητες. Θα υπάρχουν εφαρμογές, οι οποίες θα δίνουν περισσότερες, πιο έμπιστες, πληροφορίες και θα διευκολύνουν σημαντικά τις διαδικτυακές δραστηριότητες.

Η ιδέα για τον Σημασιολογικό Ιστό πρωτοεμφανίστηκε στις αρχές της δεκαετίας του '60 και προέρχεται από τον γνωστικό επιστήμονα Άλαν Κόλλινς (Allan M. Collins), τον γλωσσολόγο M. Ross Quillian και την ψυχολόγο Elizabeth F. Loftus μέσα από πολλές δημοσιεύσεις [1][2][3][4][5], ως ένας τρόπος παρουσίασης της σημασιολογικής γνώσης. Επεκτείνει το διαδίκτυο, το οποίο αποτελείται από απλές σελίδες που μπορούν να αναγνωστούν μόνο από ανθρώπους, σε σελίδες που περιέχουν πληροφορίες ανάγνωσης για τις μηχανές (μεταδεδομένα) και στο πως συνδέονται μεταξύ τους οι σελίδες, δημιουργώντας έτσι αυτόματες υπηρεσίες που χρησιμοποιούν τον Ιστό πιο έξυπνα και πραγματοποιούν εργασίες για τους χρήστες. Ο όρος "Σημασιολογικός Ιστός" εφευρέθηκε από τον Τιμ Μπέρνερς Λι,[6] δημιουργό του παγκόσμιου ιστού (World Wide Web) και διευθυντή του World Wide Web Consortium ("W3C"), το οποίο επιβλέπει την ανάπτυξη των προτάσεων για τα στάνταρ του Σημασιολογικού Ιστού. Ο ίδιος ορίζει τον σημασιολογικό ιστό ως:" ένας ιστός από πληροφορίες ο οποίος μπορεί να επεξεργαστεί άμεσα και έμμεσα από μηχανές."

Ο κύριος σκοπός του σημασιολογικού ιστού είναι να εξελίξει τον τωρινό ιστό. Αυτό πραγματοποιείται κάνοντας του χρήστες να βρίσκουν, να μοιράζονται και να συνδυάζουν πληροφορίες πιο εύκολα. Οι άνθρωποι είναι ικανοί να χρησιμοποιούν τις δυνατότητες του ιστού, όπως να βρίσκουν μεταφράσεις για άλλες γλώσσες, να δεσμεύουν ένα βιβλίο από την βιβλιοθήκη, να ψάχνουν την χαμηλότερη τιμή για ένα DVD, κ.α. Παρόλα αυτά, οι μηχανές δεν μπορούν να χρησιμοποιήσουν αυτές τις δυνατότητες χωρίς την καθοδήγηση από κάποιον άνθρωπο, επειδή οι ιστοσελίδες είναι σχεδιασμένες να διαβάζονται από ανθρώπους και όχι από μηχανές. Το σημασιολογικό διαδίκτυο είναι μία μορφή πληροφορίας η οποία μπορεί να χρησιμοποιηθεί και από μηχανές, έτσι ώστε να αναλαμβάνουν οι ίδιοι οι υπολογιστές τις κουραστικές δουλειές που περιλαμβάνουν εύρεση, ένωση και επεξεργασία πάνω στις πληροφορίες που βρίσκονται στο διαδίκτυο.

Το σημασιολογικό διαδίκτυο, όπως αρχικά οραματίστηκε, είναι ένα σύστημα το οποίο επιτρέπει στις μηχανές να "καταλαβαίνουν" τα πολύπλοκα ανθρώπινα αιτήματα βασισμένα στο νόημά τους. Τέτοιου είδους "κατανόηση" απαιτεί από τις συσχετιζόμενες πηγές πληροφοριών να έχουν μία σημασιολογική δομή.

Ο Tim Berners-Lee αρχικά οραματίστηκε το σημασιολογικό διαδίκτυο ως εξής: [7]

I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A "Semantic Web", which makes this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The "intelligent agents" people have touted for ages will finally materialize.

Το σημασιολογικό διαδίκτυο θεωρείται ότι ολοκληρώνει διαφορετικά περιεχόμενα μεταξύ τους, πληροφορίες εφαρμογών και συστημάτων. Επίσης έχει εφαρμογές και στην δημοσίευση, στα blog και σε πολλούς άλλους τομείς.

Συχνά οι όροι "σημασιολογία","μεταπληροφορία", "οντολογία" και "Σημασιολογικό διαδίκτυο" χρησιμοποιούνται με ασυνέπεια. Πιο συγκεκριμένα, αυτοί οι όροι υπάρχουν και χρησιμοποιούνται στην καθημερινή ορολογία ερευνητών και επαγγελματιών, οι οποίοι επεκτείνονται σε μεγάλο αριθμό πεδίων, τεχνολογιών και εφαρμογών. Επί πλέον, υπάρχει μία σύγχυση σχετικά με την τρέχουσα κατάσταση που επιτρέπει στις τεχνολογίες να οραματίζονται το Σημασιολογικό Διαδίκτυο. Σε ένα άρθρο οι Gerber, Barnard and Van der Merwe[8] παρομοίασαν το Σημασιολογικό Διαδίκτυο ως ένα τοπίο και παρουσίασαν την χαρτογράφησή του, καθώς και μία σύντομη περίληψη με τους συσχετιζόμενους όρους. Το αρχιτεκτονικό μοντέλο το οποίο προτάθηκε από τον Tim Berners-Lee, χρησιμοποιείται ως βάση για να παρουσιάσει ένα μοντέλο κατάστασης το οποίο αντανακλά τις τρέχουσες και αναδυόμενες τεχνολογίες.[9]

Κάποιες από τις προκλήσεις που έχει να αντιμετωπίσει το Σημασιολογικό Διαδίκτυο είναι η απεραντοσύνη, η ασάφεια, η αβεβαιότητα, η ασυνέπεια και η εξαπάτηση. Αυτόματα συστήματα λογικής θα πρέπει να αντιμετωπίσουν όλα αυτά τα προβλήματα έτσι ώστε να μπορέσουν να ανταπεξέλθουν σε όλα αυτά που υπόσχεται το Σημασιολογικό Διαδίκτυο.

  • Απεραντοσύνη: Το παγκόσμιο διαδίκτυο περιέχει πάρα πολλές δισεκατομμύρια σελίδες. Ο ιατρικός όρος οντολογία SNOMED CT περιέχει από μόνος του 370.000 ονόματα κλάσεων και η υπάρχουσα τεχνολογία δεν έχει καταφέρει ακόμα να μειώσει όλους τους σημασιολογικούς διπλούς όρους. Οποιοδήποτε λογικό σύστημα θα πρέπει να έρθει αντιμέτωπο με έναν πραγματικά τεράστιο αριθμό από δεδομένα εισαγωγής.
  • Ασάφεια: Όροι όπως "νέος" ή "ψηλός" είναι ασαφείς. Αυτό προέρχεται από την ασάφεια των ερωτημάτων του χρήστη, από έννοιες που εμφανίζονται από παρόχους περιεχομένων, από ταίριασμα των όρων των ερωτημάτων με τους όρους των παρόχων και από την προσπάθεια συνδυασμού διαφορετικών βάσεων γνώσης με επικαλυπτόμενες αλλά διακριτά διαφορετικές έννοιες. Η ασαφής λογική είναι η πιο κοινή τεχνική με την οποία αντιμετωπίζουμε την ασάφεια.
  • Αβεβαιότητα: Τέτοιοι όροι είναι ακριβείς με αβέβαιες τιμές. Για παράδειγμα, ένας ασθενής μπορεί να εμφανίσει ένα σύνολο από συμπτώματα τα οποία ανταποκρίνονται σε έναν αριθμό από διαφορετικές διαγνώσεις όπου η κάθε μία έχει διαφορετική πιθανότητα να είναι αληθής. Οι πιθανοτικές λογικές τεχνικές εφαρμόζονται γενικότερα για να διευθετήσουν την αβεβαιότητα.
  • Ασυνέπεια: Αυτές είναι λογικές αντιφάσεις οι οποίες εμφανίζονται εντελή κατά την διάρκεια ανάπτυξης μεγάλων οντολογιών ή και όταν οντολογίες από διαφορετικές πηγές ενώνονται. Ο παραγωγικός συλλογισμός αποτυγχάνει καταστροφικά όταν αντιμετωπίζει την ασυνέπεια.
  • Εξαπάτηση: Αυτό συμβαίνει όταν ο δημιουργός της πληροφορίας εσκεμμένα παραπληροφορεί τον καταναλωτή για την πληροφορία. Οι κρυπτογραφικές τεχνικές είναι αυτές που χρησιμοποιούνται για να μειώσουν αυτήν την απειλή.

Η λίστα με τις προκλήσεις είναι περισσότερο ενδεικτική παρά εξαντλητική και εστιάζει στις προκλήσεις για τα στάδια της "ενωτικής λογικής" και της "απόδειξης" του Σημασιολογικού διαδικτύου. Το γκρουπ του κονσόρτσιουμ του παγκόσμιου ιστού για την αβέβαιη λογική του παγκόσμιου ιστού final report μαζεύει αυτά τα προβλήματα κάτω από την ομπρέλα της "αβεβαιότητας". Πολλές από τις τεχνικές που αναφέρονται εδώ θα χρειαστούν επεκτάσεις στην γλώσσα οντολογίας του ιστού. Αυτή είναι μία περιοχή ενεργής έρευνας.[10]

Η τυποποίηση του Σημασιολογικού Ιστού για το Web 3.0 είναι υπό την φροντίδα του W3C.[11]

Συστατικά Στοιχεία

[Επεξεργασία | επεξεργασία κώδικα]

Ο όρος "Σημασιολογικό Διαδίκτυο" αναφέρεται συχνά σε μορφές και τεχνολογίες που μπορούν να το υποστηρίξουν. Η συλλογή των δομών δεδομένων που είναι συνδεδεμένα υποστηρίζονται από τις τεχνολογίες που παρέχουν μία τυπική περιγραφή εννοιών, όρων και σχέσεων μέσα σε ένα δεδομένο domain γνώσεων. Αυτές οι τεχνολογίες έχουν καθοριστεί ως W3C τυποποίηση και περιέχουν:

  • Resource Description Framework (RDF),μία γενική μέθοδο περιγραφής πληροφοριών
  • RDF Schema (RDFS)
  • Simple Knowledge Organization System (SKOS)
  • SPARQL, ως μία RDF γλώσσα ερωτημάτων
  • Notation3 (N3), σχεδιάστικε με βάση την ανθρώπινη ικανότητα να διαβάζουμε
  • N-Triples, μία μορφή για αποθήκευση και μετάδοση πληροφοριών
  • Turtle (λιτή τριπλή γλώσσα RDF)
  • Web Ontology Language (OWL),οικογένεια απεικόνισης γλώσσεων γνώσης
  • Rule Interchange Format (RIF), ένα πλαίσιο κανόνων γλωσσών του διαδικτύου για την υποστήριξη εναλλασσόμενων κανόνων.

Τρέχουσα κατάσταση τυποποίησης

[Επεξεργασία | επεξεργασία κώδικα]

Σωστά υφιστάμενες τυποποιήσεις:

Όχι ακόμα απόλυτα κατανοητές τυποποιήσεις:

  • Στρώματα ενοποιημένης λογικής και απόδειξης

Ο στόχος είναι να εισάγουμε την χρηστικότητα και την χρησιμότητα του διαδικτύου, όπως επίσης και τους διασυνδεδεμένους πόρους του μέσα σε:

  • Εξυπηρέτες (Servers) οι οποίοι δίνουν υπάρχοντα συστήματα δεδομένων χρησιμοποιώντας τυποποίηση RDF & SPARQL.
  • Έγγραφα τα οποία έχουν προσημανθεί ως σημασιολογικές πληροφορίες.
  • Κοινά λεξιλογικά μεταδεδομένα και χάρτες μεταξύ τέτοιων λεξιλογίων, για να επιτρέπεται στους δημιουργούς εγγράφων να προ σημαίνουν τα έγγραφά τους,έτσι ώστε πράκτορες να μπορούν να χρησιμοποιήσουν αυτές τις πληροφορίες για να προμηθεύσουν αυτά τα μεταδεδομένα.
  • Αυτόματοι πράκτορες να εκτελούν καθήκοντα για χρήστες του σημασιολογικού διαδικτύου, χρησιμοποιώντας αυτά τα δεδομένα.
  • Υπηρεσίες βασισμένες στο διαδίκτυο(συχνά με δικούς τους πράκτορες) να προμηθεύουν πληροφορίες ειδικά στους πράκτορες. Για παράδειγμα, μία υπηρεσία εμπιστοσύνης όπου ο χρήστης θα μπορεί να ρωτάει αν κάποιο online κατάστημα έχει προϊστορία κακής εξυπηρέτησης.
  1. Collins, Allan M.; Quillian, M. R. (1969). «Retrieval time from semantic memory». Journal of verbal learning and verbal behavior 8 (2): 240–247. doi:10.1016/S0022-5371(69)80069-1. PMID 615603750. 
  2. Collins, Allan M.; Quillian, M. R. (1970). «Does category size affect categorization time?». Journal of verbal learning and verbal behavior 9 (4): 432–438. doi:10.1016/S0022-5371(70)80084-6. 
  3. Collins, Allan M.; Loftus, Elizabeth F. (1975). «A spreading-activation theory of semantic processing». Psychological Review 82 (6): 407–428. doi:10.1037/0033-295X.82.6.407. https://archive.org/details/sim_psychological-review_1975-11_82_6/page/407. 
  4. Quillian, MR (1967). «Word concepts. A theory and simulation of some basic semantic capabilities». Behavioral Science 12 (5): 410–430. doi:10.1002/bs.3830120511. PMID 6059773. https://archive.org/details/sim_behavioral-science_1967-09_12_5/page/410. 
  5. Semantic memory |book:Marvin Minsky (editor): Semantic information processing, MIT Press, Cambridge, Mass. 1988. 
  6. Berners-Lee, Tim; Hendler, James; Lassila, Ora (May 17, 2001). «The Semantic Web». Scientific American Magazine. Αρχειοθετήθηκε από το πρωτότυπο στις 2008-11-14. https://web.archive.org/web/20081114135540/http://www.sciam.com/article.cfm?id=the-semantic-web&print=true. Ανακτήθηκε στις March 26, 2008. 
  7. Berners-Lee, Tim· Fischetti, Mark (1999). Weaving the Web. HarperSanFrancisco. chapter 12. ISBN 978-0-06-251587-2. 
  8. Gerber, AJ, Barnard, A & Van der Merwe, Alta (2006), "A Semantic Web Status Model, Integrated Design & Process Technology", Special Issue: IDPT 2006
  9. Gerber, Aurona; Van der Merwe, Alta; Barnard, Andries; (2008), "A Functional Semantic Web architecture", European Semantic Web Conference 2008, ESWC'08, Tenerife, June 2008.
  10. Lukasiewicz, Thomas· Straccia, Umberto. «Managing uncertainty and vagueness in description logics for the Semantic Web». [νεκρός σύνδεσμος]
  11. Semantic Web Standards published by the W3C