Semantic Web : Linked Open Data (LOD)
LOD LOD merupakan suatu metode untuk mempublikasikan dan menghubungkan data-data terstruktur di web dengan menggunakan model data Resource Description Framework (RDF) dan Hypertext Transfer Protocol (HTTP) sebagai standar. Metode ini pertama kali diperkenalkan oleh Tim-Berners Lee (TBL) dalam dokumen World WideConsortium (W3C) terkait permasalahan desain webpada tahun 2006.
Prinsip LOD Dalam dokumen W3C tersebut, dipaparkan beberapa prinsip LOD ini yakni: 1. Menggunakan Unified Resource Identifier (URI) untuk mengidentifikasi things (segala sesuatu yangdapat dianggap sebagai sumber daya web, sepertinama benda, tempat, kejadian, dan sebagainya). 2. Menggunakan HTTP URI yang memungkinkanpengguna dapat mengakses detil dari things tersebut.
Prinsip LOD 3. Memanfaatkan RDF dan SPARQL (SPARQL Protocol and RDF Query Language) sebagai standaru ntuk menyediakan informasi yang bermanfaat bagi pengguna ketika seseorang melihat detil sebuah URI. 4. Menyediakan tautan ke URI lainnya, sehingga pengguna dapat menemukan informasi terkait lainnya berkenaan dengan things tersebut
Proyek Linking Open Data (LOD) (http://esw.org/topic/SweoIG/TaskForces?CommunityProjects/LinkingOpenData) adalah upaya kolaborasi terbuka diinisiasikan oleh W3C Semantic Web Education dan Outreach Community Project. Bertujuan mengungkapkan data dari web dengan penerbitan keberadaan sekumpulan data dalam RDF pada web dan menciptakan berbagai link diantara mereka. Saat ini proyek meliputi lebih dari 60 sekumpulan data berbeda dengan pasangan milyaran RDF lipat tiga dan jutaan link semnatic pada waktu itu. Ini mewakili implementasi dari prinsip linked data.
LOD Cloud 2009
contoh dataset dengan dereferencable URI pada LOD Adapun beberapa contoh dataset dengan dereferencable URI -nya yang tersedia di LOD cloud, antara lain adalah: 1. Dbpedia merupakan versi LOD dari Wikipedia, situsensiklopedia online terbesar saat ini. 2. CIA Factbook berisi profil negara-negara di duniayang dikumpulkan dan dilaporkan oleh badanintelijen Amerika (CIA) 3. BBC programme berisi data-data terkait programradio dan TV yang disiarkan oleh BBC, yangterhubung dengan dataset MusicBrainz dan Dbpedia
4. Data-gov wiki berisi lebih dari 5 miliar RDF tripleyang diekstrak dari data statsitik pemerintah AmerikaSerikat yang dipulikasikan di http://data.gov. Beberapa statistic yang tersedia di antaranya: anggaran pemerintah, biaya kesehatan, statistic lingkungan, konsumsi energi, populasi, dan lain sebagainya. 5. Drugbank merupakan dataset yang berisi 5000 obat-obatan bioteknologi yang telah diizinkan oleh USFDA ( Food and Drug Admistration). 6. Geonames data set yang berisi lebih dari 6 jutatempat di dunia dalam bentuk data-data geografis
7. Linked sensor data berisi data-data sensor danpusat-pusat obervasi sensor yang terdiri dari 20 ribustasiun pengamatan cuaca dan 160 juta obeservasi.8. 8. DBLP bibliography server Berlin merupakandataset yang berisi informasi bibliografi terkaitmakalah-makalah sains, terdiri dari kurang lebih 800ribu artikel, 400 ribu penulis, dan 15 juta triple
Semantic Link Dalam LOD cloud kita dapat mengelompokkan semantik link kedalam : 1. person-related link seperti floaf:knows dari Frienf of Friend (FOAF) vocabulary http://xmlns.com/foaf/0.1/ 2. Spatial link Seperti geo:lat dari Basic Geo Vocabulary (WGS84 lat / long www.w3.org/2003/01/geo/)
3. Temporal Link seperti Dublin Core’s dc:created property (http://dublincore.org/documents/dcmi-terms/) atau Event Ontology’s event:time property (http://purl.org/NET/c4dm/event.owl) 4. Jenis link seperti dc:isPartOf untuk merepresentasikan struktur semantic 5. Jenis link lain Seperti scovo:dimension dari Statistical Core Vocabulary (SCOVO) http://purl.org/NET/scovo
LOD menggunakan model data RDF yang mendukung model data konseptual. RDF merupakan suatu model data yang diekspresikan dengan menggunakan pernyataan tripleyakni terdiri dari subjek-predikat-objek. Dengan RDF ini, hubungan di antara 2 entitas dapat dinyatakan secara eksplisit dengan menggunakan predikat. Sehingga jika dibandingkan dengan model data relasional, RDF ini akan memiliki konten yang lebihkaya makna karena secara natural data dalam format RDF bersifat self-describe.
Untuk mengkonsumsi RDF data, digunakan suatubahasa query yang disebut sebagai SPARQL yang memungkinkan pengembang aplikasi melakukan query tanpa perlu mengetahui definisi data (skema) terlebih dulu. Hal ini berbeda dengan sistem berbasiskan basis data yang mana untuk meng-query-nya digunakan bahasa SQL. Dengan bahasa ini, pengembang harus memahami secara detil untuk mengkonsumsi data
Keunggulan lain LOD adalah bahwa ia dapatdilihat sebagai suatu sistem basis data global yang menghubungkan banyak macam data set. Jika dibandingkan dengan model data relasional, hal tersebut memberikan keuntungan dalam pengembangan suatu sistem informasi, di antaranya adalah: 1. Memungkinkan berbagi pakai data, sehingga bisa jadi suatu sistem informasi tidak memerlukan untuk membuat skema basisdata sendiri. Hal ini dimungkinkan karena data dan skema pada model ini dapat diakses dan diskalakan secara global
2. Memudahkan agregasi data, karena setiap data dianggap sebagai resource yang memiliki identifikasi yang unik (URI) sehingga setiap item data dapat dihubungkan dengan item data lainnya Selain itu dengan adanya keterhubungan antardomain akan semakin memperkaya domain knowledge dari sistem yang dibuat. 3. Adanya navigasi secara alami dari satu item datake item data lainnya melalui penggunaan typed links. Dengan demikian, untuk menggabungkan data dari berbagai sumber (basis data) tidak perlu dilakukan secara brute force. Hal ini berbeda jika menggunakan model relasional, yang umumnya membutuhkan SQL join dan terkadang pemetaan objek relasiona