3.2 Referensi & Identitas
Semantic Web
mengandalkan konvensi penamaan dengan URI, dan Tentu saja setiap bagian dari
sistem pelabelan Web yang bergantung pada beberapa konvensi atau lainnya.
Masalah dengan label di Web adalah bahwa sistem apapun dasarnya desentralisasi
dan tidak diawasi, sesuai dengan Web yang mengatur prinsip-prinsip, tetapi ini
tidak sentralisasi memungkinkan skema yang berbeda dan konvensi, dan memang
kecerobohan, untuk berkembang, yang pada gilirannya membuka kemungkinan
kegagalan referensi unik.
3.2.1 Referensi: Kapan dua benda yang
sama?
Desentralisasi
adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang
pencipta konten. Kegagalan referensi unik relatif sepele bagi pengguna manusia
untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja
keluar. Dan
jika kita berharap untuk mengekstrak informasi yang berguna dari repositori
yang sangat besar informasi, dimana kerajinan tangan solusi dan referensi
memeriksa oleh mata tidak layak, pengolahan mesin tidak bisa dihindari.
Referensi masalah yang sangat mungkin terjadi ketika sumber-sumber informasi
digabung, masalah di mana-mana tapi yang serius dalam konteks dari Web Semantic.
Dan desentralisasi Web menghalangi membuat asumsi nama yang unik, dalam cara.
Di sisi lain, URI menyediakan Web dengan sumber daya untuk menghindari
setidaknya beberapa masalah grounding tradisional, ketika dapat diatasi bahwa
dua istilah ini menunjuk ke URI yang sama.
Sebuah metode
heuristik untuk menyelesaikan bentrokan tersebut, di dunia nyata,
adalah untuk membuat penilaian
cerdas berdasarkan informasi jaminan, dan ini telah
menirukan online dengan perhitungan komunitas praktek nama, berdasarkan
jaringan hubungan sekitarnya masing-masing instansi yang disengketakan.
Secara umum, manajemen referensi, dan resolusi referensi masalah, akan
selalu sulit mengingat bahwa Web mencakup sejumlah
besar mengumpulkan informasi untuk sejumlah alasan yang berbeda
dan untuk memecahkan berbagai tugas, makna dan interpretasi
sering shift, dan ada mungkin pada kesempatan menjadi kesepakatan
sedikit tentang referen istilah. Sebuah isu penting untuk
Web Sains justru bagaimana memahami referensi dan representasi,
dan menentukan sistem yang manajemen dan formalisms akan
memungkinkan pemahaman yang lebih besar dan pelacakan dari apa
yang Web ini dimaksudkan untuk mengatakan tentang yang objek.
3.2.2 Kapan adalah dua halaman
yang sama?
Alternatif
mengambil masalah referensi adalah bahwa penentuan ketika dua halaman web
adalah halaman yang sama. Hal ini tentu saja akan menjadi sepele dalam banyak
kasus, tetapi sering kali “utama ” teks yang disalin dari satu halaman ke lain,
tetapi dikelilingi oleh iklan yang berbeda, logo, header dan footer. Banyak
metrik yang tersedia yang dimaksudkan untuk menentukan kuantitatif tingkat
hubungan antara dua halaman. Kesamaan penilaian bisa sembarangan dan pragmatis,
tergantung pada konteks (misalnya memutuskan plagiat atau kasus pelanggaran hak
cipta), tetapi teknik dari teori informasi yang ada untuk menghasilkan set
nomor tujuan untuk memberi makan ke dalam proses penilaian – misalnya,
Levenshtein edit jarak, dan varian algoritma, diberikan dengan jumlah minimum
operasi dari beberapa basis yang diperlukan untuk bisa mengubah satu string
menjadi lain.
3.3 Web teknik: arah baru
Pembangunan
Web adalah campuran dari standar-setting, tidak terstruktur,
desentralisasikegiatan dan inovasi, dan rekayasa yang disengaja. Pada bagian
ini kita akan fokus pada yang terakhir, dan review menonjol teknik isu dan
keharusan terbuka. Pertumbuhan Web jelasmerupakan sesuatu yg diinginkan kunci.
Penyimpanan jumlah semakin besar informasi, dalamkonteks perhitungan
pernah-cepat, akan sangat vital untuk masa mendatang. Tanpa lebih cerdas
pengambilan penyimpanan dan cepat untuk mediamemori-lapar seperti video, maka
pada akhirnya akan tumbuh terlalu theWeb besar untukteknologi sendiri. Sebagai
contoh, PageRank membutuhkan merangkak dan caching dari bagian signifikan dari
theWeb; keberhasilan Google tergantung pada kemampuan untuk menjaga
cachepenurut sementara juga ukuran yang signifikan. Greater permintaan untuk
layanan personalisasidan pencari juga akan memberikan tekanan pada sistem.
Memperluas cakupan pencarian untukmencakup item seperti multimedia, jasa atau
komponen ontologi, juga akan memerlukan mengejarprogram penelitian akademik,
interface efektif dan model bisnis yang masuk akal sebelum layanankomersial
mulai beroperasi. Yang ada dan mengembangkan pendekatan untuk memanfaatkanWeb
harus diperluas ke lingkungan Web yang baru sebagaimana yang diciptakan
(seperti P2Pjaringan).
3.3.1 Layanan Web
Layanan area
utama di mana kami rekayasa model kebutuhan Web untuk terlibat dan
jasaextended.Web didistribusikan potongan kode ditulis untuk memecahkan
tugas-tugas tertentu,yang dapat berkomunikasi dengan layanan lain melalui
pesan. Tugas yang berskala lebih luasdapat dianalisis dan secara rekursif
dipecah menjadi sub-tugas yang dengan peta keberuntunganakan ke spesifik
tugas-tugas yang dapat diatasi oleh layanan. Jika itu terjadi, dan jika
layananditempatkan dalam konteks Web, yang berarti bahwa pengguna dapat
memanggil layanan yangbersama-sama dan kooperatif memenuhi kebutuhan mereka.
Software abstrak jauh dari hardwaredan memungkinkan kita untuk menentukan
komputasi mesin dalam hal fungsi logis, yangmemfasilitasi spesifikasi masalah
dan solusi dengan cara yang relatif intuitif. The evolusi dari Webuntuk
memasukkan penyediaan dan difusi layanan membuka prospek abstraksi baru:
pertanyaansekarang adalah bagaimana kita bisa melakukan abstraksi yang sama
jauh dari perangkat lunak.Apa metode menggambarkan layanan akan memungkinkan
kita untuk berhenti khawatir tentangbagaimana mereka akan dilakukan?
Sejumlah metode
proses menentukan telah berkembang selama beberapa tahun terakhirdan diterapkan
pada domain layanan Web. Misalnya, WS-Net adalah bahasa deskripsiarsitektural
berdasarkan teori Petri jaring berwarna (yaitu perluasan dari teori Petri
sederhanabersih dengan terhormat, token diidentifikasi), yang menggambarkan
komponen layanan Webdalam hal jasa yang memberikan untuk komponen lain, layanan
yang diperlukan untuk fungsi, danoperasi internal. Hasil akhirnya adalah model
yang mencakup baik global dan aspek-aspek lokaldari sistem pelayanan,
memfasilitasi integrasi layanan Web untuk mencapai tujuan-tujuan baru,sementara
juga menyediakan sebuah formalisme untuk evaluasi integrasi. Proses aljabar
(lihatBagian 4.2.5) juga telah diterapkan untuk layanan. Sekali lagi, seperti
dengan pendekatan Petrinet, penggunaan formal aljabar memungkinkan baik desain
dan evaluasi untuk mengambil tempat(atau memang salah satu atau yang lain,
tergantung pada apa metode alternatif yang tersedia untukmenghasilkan atau
survei kode). Sebagai contoh, [98] menggambarkan pemetaan antara aljabarproses
ekspresif dan BPEL4WS (yang distandarisasi Berbasis XML notasi
untukmenggambarkan proses bisnis executable), yang memungkinkan baik
pembentukan jasa diBPEL4WS diikuti oleh mereka evaluasi dan verifikasi
menggunakan aljabar proses, atau generasikode BPEL4WS otomatis dari penggunaan
aljabar untuk menentukan layanan yang diinginkan.Secara umum, spesifikasi
aljabar pelayanan pada tingkat abstrak dan penalaran tentang merekatelah
menjadi utama bidang penelitian pada layanan.
BPEL4WS adalah
versi panjang dari Eksekusi Proses Bisnis Bahasa BPEL, yang menjadi cara yang
semakin penting untuk Sun Web layanan dengan proses bisnis. BPEL ada batasnya,
tapi memungkinkan penciptaan layanan komposit dari layanan yang telah ada. The
Tahap selanjutnya adalah menyesuaikan pendekatan ini untuk lingkungan P2P, dan
kendaraan saat ini dalam pengembangan untuk itu adalah CDL, alias WS-CDL,
alias
Koreografi
(Web Services Choreography Description Language), sebuah bahasa berbasis XML
untuk mendefinisikan umum dan saling melengkapi diamati perilaku dalam
kolaborasi P2P. Tujuannya adalah agar interoperable P2P kolaborasi dapat
disusun dengan menggunakan Koreografi tanpa memperhatikan spesifik seperti
platform dasar yang digunakan; bukan fokus pada tujuan umum dari kolaborator.
Sedangkan BPEL memungkinkan ada pelayanan yang akan digabungkan bersama-sama,
Koreografi pergeseran fokus ke deskripsi global kolaborasi, informasi
pertukaran, pemesanan tindakan dan sebagainya, untuk mencapai tujuan yang
disepakati.
3.3.2 Didistribusikan
pendekatan: merasuk komputasi, P2P dan grid
Ada banyak
lingkungan hardware yang akan Web diharapkan untuk menembus, namun di mana
teknik asumsi yang berlaku untuk skala besar, lebih-atau-kurang tetap mesin
komputasikhusus tidak harus berlaku. Contoh nyata termasuk komputasi mobile, di
mana-mana (ataumeresap) komputasi mana interoperabilitas menjadi masalah, P2P
sistem dan komputasi grid.Komputasi Mobile membuat segala macam tuntutan
rekayasa, daya komputasi yang tersediatidak luas dan pengguna harus diasumsikan
terus-menerus bergerak dengan variabel bandwidthdan akses. Selain itu,
menyajikan informasi kepada pengguna
memerlukan paradigma yang berbeda dari PC, misalnya
untuk memungkinkan pengguna untuk menerima informasi yang cukup pada layar
kecil untuk membuat browsing menarik. Akses mobile ke Web dapat menjadi mode
dominan di banyak negara, terutama yang berkembang, terima kasih untuk harga
yang relatif rendah dan keandalan koneksi nirkabel dan baterai kekuasaan.Penelitian
di bidang ini penting untuk adil distribusi sumber daya web.
Mana-mana
komputasi, P2P dan berbagi banyak komputasi grid serius penelitian masalah,
terutama koordinasi perilaku dalam jumlah besar terdistribusi skala sistem.
Mana-mana komputasimembayangkan kecil, relatif perangkat komputasi bertenaga
rendah tertanam di lingkunganpervasively berinteraksi dengan orang. Ada
berbagai kemungkinan imajinatif, seperti benangcerdas yang dapat ditenun
menjadi pakaian. Tapi tanpa menebak-nebak kecenderungan jelaslahbahwa perangkat
yang lebih kecil akan perlu koneksi nirkabel ke jaringan arsitektur yang
memungkinkan otomatis ad hoc konfigurasi, dan ada sejumlah kesulitan rekayasa
yang terkaitdengan masalah. Sebagai contoh, penemuan layanan dalam paradigma meresap
harus mengambiltempat tanpa manusia dalam loop. Layanan harus mampu
mengiklankan diri untuk memfasilitasipenemuan. Standar layanan penerbitan akan
diperlukan untuk menjamin keamanan dan privasi, kepercayaan dari layanan
keandalan,kompensasi untuk penyedia layanan, dan tepat bagaimana layanan akan
terdiri dengan layanan dipanggil lain untuk mencapai beberapa tujuan atau
memecahkan masalah yang dihadapi.
3.3.3 Personalisasi
Personalisasi
penting untuk meningkatkan nilai jaringan , dan peningkatan konsumen kunci .
Recommender sistem yang jelas penerapan teknologi untuk mendapatkan effective
personalisasi, harus ada terpadu penggunaan informasi dari berbagai sumber,
termasuk data tentang pengguna (klik streaming, men-download data pola, online
profiles), sumber daya yang disampaikan (konten situs, struktur situs) dan
domain pengetahuan, bersama dengan data pertambangan teknik sufficient untuk
menciptakan pandangan menyeluruh sumber daya yang mencakup banyak informasi
yang dibutuhkan para pengguna. Mengingat bahwa, di Web, informasi yang relevan
cenderung sangat didistribusikan dan dinamis, personalisasi diharapkan menjadi
salah satu keuntungan besar dari Web semantik, yang adalah pre-nyata struktur
yang memungkinkan penalaran melalui beberapa dan didistribusikan sumber data,
Lain penting untai teknik personalisasi adalah pengembangan alat untuk
mengaktifkan relatif neophytes untuk menciptakan atau meningkatkan artefak
kompleks pengetahuan teknik, seperti ontologi atau pembungkus.
3.3.4 Multimedia
Web adalah
lingkungan multimedia, yang membuat untuk kompleks semantik – ini tentu saja
tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering
menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam
bentuk analog. Misalnya ahli sering menggunakan diagram untuk mengekspresikan
pengetahuan mereka. Ada memiliki upaya telah menghasilkan taksonomi generatif
‘bahasa-seperti’ representasi visual, tetapi ini tidak tampaknya telah menarik
aplikasi. Beberapa peneliti telah mencoba untuk menemukan prinsip-prinsip yang
mungkin mendasari penalaran diagramatik. Adajuga telah aplikasi penting untuk
decoding representasi visual untuk gangguan penglihatan dan koleksi gambar
visualisasi terhadap ontologi domain. Pada akhirnya, integrasi multimodalrepresentasi
adegan yang sama atau badan adalah masalah yang sangat keras. Secara umum,
tidak diketahui bagaimana mengambil semantik dari representasi non-tekstual
andal; fenomena ini dikenal sebagai semantik kesenjangan. Namun demikian,
generasi Web berikutnya tidak harusdidasarkan pada palsu asumsi bahwa teks
adalah pencarian dominan dan kata kunci berbasisakan mencukupi untuk semua
tujuan yang wajar. Memang, isu-isu berkaitan dengan navigasimelalui repositori
multimedia seperti video
arsip dan
melalui theWeb tidak berhubungan: keduanya kebutuhan informasi link
untukmendukung browsing, dan keduanya perlu untuk mendukung mesin manual link
traversal. Namun,pendekatan kata kunci mungkin goyah dalam multimedia konteks
karena kekayaan yang lebih besar dari banyak non-tekstual Media.
3.3.5 Pemrosesan Bahasa Alami
NLP berkaitan
dengan Web dalam beberapa cara. Di tempat pertama, bahasa alami adalah sangat
jarang domain, yang kebanyakan kalimat yang diucapkan atau ditulis terjadi
sekali saja atau sangat jarang, dan skala raksasa Web menyediakan korpus
menarik untuk NLP penalaran.
Kedua,
mengingat masalah skala Web, teknik NLP akan penting dalam tugas-tugas seperti
summarisation (Lihat, misalnya, dokumen pemahaman konferensi tahunan dan [69]),
yang dapat memberikan dukungan berguna untuk bagian manusia dari tugas Cari.
Ketiga, NLP
memiliki potensi besar untuk pembangunan macam antarmuka intuitif yang
heterogen dan tidak selalu melek komputer komunitas pengguna Web memerlukan.
Memang itu mungkin membantu menjembatani kesenjangan antara visi SW Web terdiri
dari data yang dimanipulasi secara logis, dan visi yang lebih tradisional dari
Web sebagai tempat mana berguna dokumen yang diperoleh.
Dengan
demikian kita memiliki disanalogy langsung antara NLP dan SW, yang adalah bahwa
URI, seperti kata-kata, pemilik, dan sehingga dapat diatur. Itu adalah bukan
untuk mengatakan bahwa peraturan tersebut akan memastikan kekebalan dari drift
makna bahwa ahli bahasa mendeteksi, tetapi mungkin menyediakan stabilitas
sufficient atas pendek jangka menengah.