Web Semantik Web Engineering 2010 Pertemuan ke-14 Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com
Outline Dari Web ke Web Semantik Pendekatan Web Semantik Arsitektur Web Semantik Contoh-contoh Implementasi Roadmap Aplikasi Web (1990 – 2030) Rangkuman
Dari web ke web semantik Mengapa kita memerlukan Web Semantik? Dari web ke web semantik
Web Hari Ini Web kini mendeskripsikan informasi menggunakan Bahasa alami (Inggris, Jerman, Indonesia,…) Gambar, multimedia, layout halaman Orang dapat memroses ini dengan mudah Dapat menarik kesimpulan fakta dari informasi parsial Dapat membuat asosiasi mental Digunakan untuk berbagai informasi yang berhubungan dengan panca-indera (… orang dengan keterbatasan mungkin punya masalah serius pada web yang kaya media!)
Web Hari Ini Kita sering harus memadukan banyak data pada Web Informasi hotel dan travel mungkin datang dari situs berbeda Pencarian dalam pustaka digital berbeda Dll... Lagi, orang menggabungkan informasi ini dengan mudah Bahkan jika digunakan terminologi berbeda!
Namun… Mesin itu bodoh! Informasi parsial tak dapat dimanfaatkan Sulit untuk membangun pengertian dari, misal: suatu gambar (image) Penggambaran analogi secara otomatis sulit Susah memadukan informasi secara otomatis Apakah <foo:creator> sama denga <bar:author>? Bagaimana menyatukan hirarki XML berbeda? …
Bagaimana Meningkatkan Web Kini? Meningkatkan linking otomatis antar data Menaikkan recall & precision pencarian Meningkatkan otomasi dalam integrasi data … Menyertakan semantika ke data dan layanan adalah solusi!
5 Pendekatan Semantika Tagging Statistics Linguistics Semantic Web Artificial Intelligence
Pendekatan Tagging Pro & Kontra Del.icio.us Pengguna mudah menambahkan & membaca tag Tag hanya berupa string Tak ada algoritma atau ontologi yang perlu ditangani Tak ada teknologi yang harus dipelajari Del.icio.us Flickr Wikipedia
Pendekatan Statistik Pro Kontra Google Lucene Autonomy Algoritma matematika murni Sangat Scalable Tak tergantung bahasa Kontra Tak ada pemahaman dari content Sulit merumuskan query yang bagus Paling baik untuk mendapatkan hal yang benar-benar popular – tidak baik untuk memperoleh yang penting dalam tumpunan Tidak bagus bagi data terstruktur Google Lucene Autonomy
Pendekatan Linguistik Pro Pemahaman bahasa sejati Mengekstrak pengetahuan dari teks Paling baik untuk mencari fakta atau hubungan tertentu Query lebih tepat Kontra Intensif secara komputasional Sulit diskalakan (unscalable) Banyak errornya Tergantung pada bahasa Powerset Hakia Inxight Attensity …
Pendekatan Web Semantik Pro Query lebih tepat Aplikasi lebih cerdas, kerja lebih sedikit Tidak sebagai komputasional intensif Share & link data antar aplikasi Bekerja terhadap data terstruktur maupun tidak Kontra Kurangnya perangkat (tool) Sulit diskalakan Who makes all the metadata? FOAF Project DBpedia Project Metaweb … Kontra akan terpecahkan, hanya masalah waktu!
Pendekatan Kecerdasan Buatan Pro Cerdas dalam domain yang sempit Menjawab pertanyaan secara cerdas Penalasan dan pembelajaran Kontra Intensif secara komputasional Sulit diskalakan Sangat sulit diprogram Tidak bekerja baik diluar dari domain yang sempit Traning mengambil banyak pekerjaan Cycorp
Arsitektur web semantik Ayo kita nikmati “daging” sebenarnya hari ini! Arsitektur web semantik
Apa itu Web Semantik? “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001
… “well-defined meaning” … “An ontology is an explicit specification of a conceptualization” Gruber, “Toward principles for the design of ontologies used for knowledge sharing?” , Int. J. Hum.-Comput. Stud., vol. 43, no. 5-6,1995. Ontologi adalah fondasi pemodelan untuk Web Semantik Menyediakan pengertian yang terdefinisi baik bagi informasi
… explicit, … specification, … conceptualization, … Ontologi adalah... Konseptualisasi: Model dari konsep yang paling relevan dari suatu fenomena dari dunia nyata Explicit: Model secara eksplisit menyatakan jenis dari konsep, hubungan antar konsep dan batasan yang digunakan Formal: Ontologi harus bersifat machine readable (tidak memanfaatkan natural language) Shared: Pengetahuan yang terkandung dalam ontologi bersifat consensual, yaitu telah diterima oleh kelompok orang. Studer, Benjamins, D. Fensel, “Knowledge engineering: Principles and methods”, Data Knowledge Engineering, vol. 25, no. 1-2, 1998.
Web Semantik adalah mengenai.... Anotasi data Web Menghubungkan (sintaktis) obyek Web, seperti potongan teks, image, … ke maksud semantiknya (Misal: ini ini mengenai Innsbruck, Dieter Fensel adalah professor) Linking Data di Web (Web Data) Jaringan pengetahuan global melalui URI, RDF dan SPARQL (Misal: menghubungkan kalender saya dengan rss feed saya, gambar-gambar saya, ...) Integrasi data di Web Integrasi data berdasarkan model konseptual yang berbeda (misalnya, mengintegrasikan data yang berasal dari dua penjual buku favorit saya )
Menganotasi Data Web http://www.ontoprise.de/
Data Linking pada Web As of Septemer 2007 Linking Open Data Project: http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
Integrasi Data di Web URI Sama = Resource sama http://www.w3.org/People/Ivan/CorePresentations/RDFTutorial
Arsitektur Web Sesuatu dilambangkan dengan URI. Gunakan URI untuk menunjukkan sesuatu. Sajikan informasi yang berguna pada URI. Dereference-kan URI.
Arsitektur Web Semantik Memberikan konsep penting URI. Setiap URI memperkenalkan satu konsep. Share simbol-simbol ini antara banyak bahasa Dukung URI lookup
Stack pada Web Semantik Topik yang sering dibahas!
URI dan XML Uniform Resource Identifier (URI) adalah dual dari URL di Web Semantik Sasarannya adalah untuk mengidentifikasi sumber daya eXtensible Markup Language (XML) adalah suatu bahasa markup yang digunakan untuk menstrukturkan informasi Landasan darirepresentasi data pada Web Semantik Tag tidak menyampaikan informasi semantik
RDF dan OWL Resource Description Framework (RDF) adalah dual dari HTML dalam Web Semantik Cara sederhana mendeskripsikan sumber daya di Web Jenis bahasa ontologu sederhana (RDF-S) Berpijak pada triple (subject; predicate; object) Serialisasi adalah berbasis XML Ontology Web Language (OWL) adalah suatu bahasa ber-layer berdasarkan pada DL Bahasa ontologi yang jauh lebih kompleks Mengatasi beberapa batasan pada RDF(S)
SPARQL & Bahasa Rule SPARQL Bahasa Rule (Misal: SWRL) Bahasa Query bagi triple RDF Suatu protokol untuk mengquery data RDF di Web Bahasa Rule (Misal: SWRL) Mengextend predikat dasar dalam bahasa ontologi dengan predikat proprietary Berpijak pada logika berbeda Logika deskripsi Logika pemrograman
Tidak Hanya Tentang Data Publik Web Semantic tidak hanya tentang data publik. Juga data tentang pribadi, kelompok, instansi dan perusahaan. Secara historis, server intranet mendahului server ekstranet
Dari Halaman Web ke Layanan Web Intelligent Web Services Web Services UDDI, WSDL, SOAP Dynamic Semantic Web RDF, RDF(S), OWL WWW URI, HTML, HTTP Static Syntactic Semantic
Industri & Web Semantik Perusahaan besar menawarkan (atau akan menawarkan) Sistem atau tool Web Semantik: Adobe, Oracle, IBM, HP, Software AG, GE, Northrop Gruman, Altova, Microsoft, Dow Jones, … Pihak lain menggunakannya (atau mempertibangkan untuk menggunakannya) sebagai bagian dari operasinya : Novartis, Boeing, Pfizer, Telefónica, … Beberapa nama aktif dalam W3C SW: ILOG, HP, Agfa, SRI International, Fair Isaac Corp., Oracle, Boeing, IBM, Chevron, Siemens, Nokia, Pfizer, Sun, Eli Lilly, …
Contoh I Menemukan Pakar yang tepat di NASA Hampir 20.000 pegawai NASA menggunakan teknik RDF yang mengintegrasikan lebih dari 6 atau 7 database, sumber data dan layanan web yang terdistribusi secara geografis… From Kendall Clark, Clark & Parsia, LLC
Contoh II Vodafone live! Mengintegrasikan deskripsi produk berbagai vendor via RDF ring tone, game, wallpaper Mengelola kompleksitas handset, format biner Portal dibuat untuk menawarkan content yang tepat Download content naik signifikan setelah diperkenalkan From Kevin Smith, Vodafone Group R&D
Contoh III KIM Browser Plugin Content web dianotasi menggunakan ontologi Content dapat dicari & dijelajah secara cerdas Select one or more concepts from the ontology… … send the currently loaded web page to the Annotation Server Annotated Content Animation Step 1 The user has a particular web page open in the browser Animation Step 2 The user would like to see which countries are referred within this article, so selects countries on the left Animation Step 3 The user selects “Annotate” and the underlying ontologies related to countries of the world are applied on the text in the browser Animation Step 4 The content in the browser is marked up As can be seen all the countries of the world are highlighted in blue Further information can be selected on the left and will be highlighted in a different color in the text
Contoh IV Disco Hyperdata Browser Menavigasi Web Semantik sebagai himpunan sumber data yang tidak terikat Deferenceable URI Disco essentially is just a nice way to represent RDF metadata such that people can actually browse it. So essentially it’s a representation mechanism for RDF triples. All the triples with the same subject are grouped on one page and then the predicates and objects form a table which someone can browse. When you click on an object, that object becomes the subject of the view and all predicates and objects of that subject become the visible. The Dereferencable URI animation just means that the URI you provide must be dereferenceable or in less buzzword terms – the resource identified by the URI must be retrievable (or dereferenceable) from that URI
Contoh V Faceted DBLP Kategorisasi topik otomatis berdasarkan pada keyword yang disediakan dalam anotasi metadata The FacetedDBLP search interface allows to search computer science publications in the DBLP collection starting from some keyword and shows the result set along with a set of facets, e.g., distinguishing publication years, authors, or conferences. The animation shows that the RDF metadata underlies the whole system, the different RDF predicates forming the different facets that the user can use to narrow down the result set. Note that the seminal appear on the WSMT comes first for a DBLP search for Dieter Fensel ;)
Contoh Lain Studi kasus dan kasus pemanfaatan Web Semantik dapat dilihat di: http://www.w3.org/2001/sw/sweo/public/UseCases Cultural Heritage Health Care Life Sciences eCommerce B2B integration …
Roadmap Web (Nova Spivack) Intelligent Web Intelligent personal agents Web 4.0 Web OS 2020 - 2030 Distributed Search Semantic Web Web 3.0 Koneksi Antar Informasi SWRL OWL 2010 - 2020 SPARQL Semantic Databases OpenID AJAX Social Web Semantic Search ATOM Widgets RSS P2P RDF Mashups Web 2.0 Office 2.0 Javascript Flash SOAP XML Weblogs Social Media Sharing The Web Java 2000 - 2010 HTML SaaS Social Networking HTTP Directory Portals Wikis VR Web 1.0 Keyword Search Lightweight Collaboration The PC BBS Websites Gopher 1990 - 2000 MMO’s MacOS SQL Groupware SGML Databases Windows The Internet File Servers PC Era FTP IRC Email 1980 - 1990 USENET PC’s File Systems Koneksi Antar Orang
That’s almost all for day… Ringkasan
Rangkuman Semantic Web bukanlah suatu replacement dari web kini, tetapi suatu evolution-nya Bertujuan mengotomatiskan tugas yang saat ini dilakukan oleh manusia Semantic Web bukanlah AI 2.0 Web Semantik menjadi real (mungkin tidak seperti yang awalnya direncanakan, tetapi begitulah)
Referensi Bacaan Utama Bacaan lanjutan Bab 14 Grigoris Antoniou and Frank van Harmelen, A Semantic Web Primer, MIT Press Bab 1 Bacaan lanjutan Meletakkan Web kembali ke dalam Web Semantik http://www.w3.org/2005/Talks/1110-iswc-tbl
Pertanyaan?