This is Paskalius: Juni 2016

Minggu, 19 Juni 2016

Web Governance, Security & Standard

Masalah umum pemerintahan Web adalah bahwa dengan struktur desentralisasi sulit untuk menegakkan standar, dan dengan jumlah yang sangat besar pengguna tidak terlatih atau relatif tidak tertarik hal harus dipelihara sangat sederhana. Di sisi lain, sama benar bahwa ada sejumlah platform, proto-cols dan arsitektur yang memfasilitasi keamanan informasi, tetapi yang tidak banyak digunakan. Dan kendala tambahan bahwa infrastruktur harus mengaktifkan keamanan, privasi, dan kepercayaan tanpa mengganggu pengguna dengan konstan informasi atau permohonan permissions.

6.1 Standard & Policies (Standar & Kebijakan)

Tujuan dirancangnya Standar & Kebijakan :

· Untuk membuat perilaku yang lebih baik, lebih mudah, dan lebih mungkin.

· Untuk mengidentifikasi pelanggaran dan membasmi perilaku buruk.

Kebijakan kesadaran memastikan pengguna memiliki pandangan yang dapat di akses dan dapat dimengerti kebijakan yang terkait dengan sumber daya web tertentu, Kebijakan kesadaran dapat membuat seseorang menjadi jengkel misalnya seperti penggunaan password rutin yang dikendalikan akses. Weitzner et al menggambarkan dilema seseorang menginginkan sementara akses ke materi yang terbatas. Meningkatkan risiko keamanan kelas, orang itu memungkinkan dia atau dia untuk melihat materi yang terbatas, sementara declassifying risiko-risiko material memungkinkan orang lain mengakses itu Bahasa perwakilan kebijakan berdasarkan OWL, dan Rei.

6.2 Copyrights Issues (Isu-isu Hak Cipta)

Karena Web adalah sebuah ruang informasi, penting membuat sebuah hak cipta dan kekayaan intelektual.

Tujuan dari Hak Cipta:

· Melindungi sebuah ekspresi dari ide.

· Mencegah orang lain membajak, mengatakan bahwa memiliki sebuah konsep web yang sama.

Ada sebuah kasus di AS dan Eropa yaitu sebuah database, diperlakukan sebagai sebuah kompilasi,dan telah menerima perlindungan yang sama sebagai karya sastra (yaitu dilindungi selama 50tahun setelah penciptaan dan 70tahun setelah kematian pencipta Inggris).

Namun pada akhir 1990, database yang dilindungi selama 15 tahun mengalami perubahan besar yaitu mengenai pemilihan informasi dan susunan jumlah harus intelektual(cerdas) untuk memperoleh pemverifikasian atau kehadiran.

Kemudian dari sebuah kasus itu terbentuk komunitas Semantic Web untuk menyatukan pendistribusian informasi dari berbagai relasional database dan untuk mempercepat penerbitan dan akses ke sejumlah besar data yang dikumpulkan oleh pemerintah di berbagai fungsi mereka

6.3 Transgressive Behaviour (Perilaku Transgressive)

Dalam banyak kasus, memahami bagaimana pelanggaran dapat berlangsung akan menyarankan metode untuk meruntuhkan pelanggaran, tetapi satu harus selalu siap untuk perlombaan senjata. Sebagai contoh paling menonjol subjek perlombaan senjata, algoritma Google PageRank adalah ukuran kualitas relevansi hebat yang terkenal. Jadi inﬂuential adalah Google pada pola penggunaan Web, PageRank harus beroperasi di dunia di mana banyak agen aktif berusaha untuk menumbangkan itu.

6.4 Privacy & Identity (Identitas & Privasi)

Masalah lainnya, seperti spam, yang mengkhawatirkan orang banyak adalah privasi. Web memungkinkan pengumpulan data (informasi) yang belum pernah terjadi sebelumnya. Informasi yang sering digunakan untuk tujuan berbeda, dan keamanan data adalah semua terlalu sering diperlakukan sebagai masalah sisi oleh perusahaan. Untuk menjaga privasi dan identitas pribadi maka diperlukan sebuah fitur keamanan yang dapat kita gunakan dalam sebuah web, misalnya kata sandi, pin, ataupun pertanyaan-pertanyaan keamanan yang hanya diketahui oleh pemilik dari suatu web.

6.5 The Economics of Information (Informasi Ekonomi)

Sebuah situs tidak hanya sebuah ruang politik, tapi juga sebuah ruang ekonomis, karena ilmu pengetahuan memiliki harga. Kemajuan Teknologi Informasi mempengaruhi segala Aspek Kehidupan salah satunya yang menonjol adalah penggunaan Teknologi Informasi dalam Bidang Ekonomi. kemajuan ini memberikan dampak positif dalam bidang perekonomian salah satunya, yaitu :

· Pertumbuhan ekonomi yang semakin Tinggi

· Terjadinya Industrialisasi di berbagai daerah

6.6 A Liberal Hegemony (Hegemoni Liberal)

Titik akhir singkat bernilai keputusan adalah bahwa web adalah ruang yang dirancang membiarkan arus informasi, dan untuk menciptakan kesempatan untuk kerjasama dan kolaborasi. Perlu bertanya mengapa arus informasi bebas adalah hal yang baik, dan jawaban yang cukup sederhana, karena ada baiknya untuk memiliki kebebasan untuk mengekspresikan diri agar seseorang dapat mengejar sendiri proyek otonom dan otentik. Tanpa hambatan kritik terhadap pemerintah dan pusat-pusat kekuasaan lainnya cenderung akan menyebabkan tata-pemerintahan yang lebih baik, informasi, dan lebih menggerakan demokrasi.

Mungkinkah ada liberal hegemoni pada Web? Tentu saja ada bertentangan dengan banyak sumber-sumber dari Web (sebagian besar sumber wajar untuk mengatakan, lebih dari senang untuk mempekerjakan Web sebagai alat untuk organisasi, komunikasi dan penyebaran). Dan perlu diketahui, Hegemoni didefinisikan sebagai dominasi satu kelompok terhadap kelompok lainnya dengan atau tanpa ancaman kekerasan.Banyak pemerintah liberal yang membatasi warga-negara mereka menggunakan Web, sering menggunakan adaptasi dari teknologiﬁrewall untuk menciptakan apa yang berlaku intranet raksasa dalam wilayah mereka.

Bahkan non-liberal demokrasi memiliki sesuatu masalah dengan Web. Misalnya, pemerintah Singapura memiliki sentuhan yang relatif ringan di dalam peraturan internet, tapi masih blok 100 atau lebih situs porno, membutuhkan website politik dan agama harus terdaftar dan berlisensi dengan otoritas penyiaran Singapura, dan melarang kegiatan pemilihan di Web selama kampanye pemilihan, meskipun memiliki visi yang kuat ekonomi berbasis pengetahuan dan salah satu pemerintah yang paling antusias di dunia sehubungan dengan IT.

Web Sosiologi

Web adalah cermin untuk masyarakat manusia, dan reﬂects kepentingan, obsesi dan imperatif eksistensi manusia abad ke-21 yang diperpanjang rentang sangat luas (mungkin jangkauan terluas ruang informasi manusia) set nilai, budaya dan asumsi. Analisis istilah pencarian yang dimasukkan ke dalam Google cenderung menjadi sumber kunci untuk sejarawan masa depan. Dalam bagian ini kita akan melihat hubungan antara Web dan pengguna, pembaca dan penulis.

5.4.1 Communities of Interest(Menarik Masyarakat)

Web telah melahirkan sejumlah novel dan menarik masyarakat dengan sifat menarik. Sebagai contoh, Massively Multiplayer Role-Playing Game Online (MMORPG). (90m orang) menggunakan Internet untuk tetap berhubungan dengan semacam kelompok; Laporan itu, oleh proyek penelitian Pew Internet, sangat informatif tentang cara-cara yang Amerika menggunakan Web untuk tetap berhubungan dengan segala macam kelompok-kelompok kepentingan.

5.4.2 Information & Social Structures(Informasi & Struktur Sosial)

Struktur sosial web tergantung pada struktur engineering yang mendasari bagiannya tingkat atas. Hal ini bukan untuk mengatakan bahwa pohon yang berstruktur buruk; di dunia berorientasi pohon XML adalah perbaikan pada baris-orientasi Unix. Pohon memungkinkan banyak kemungkinan yang penting, seperti desain top-down terstruktur, informasi bersembunyi dan tingkat kontrol yang dikombinasikan dengan ﬂexibility. Tetapi perilaku dalam struktur semacam itu dibatasi: GOTO pernyataan dianggap berbahaya, misalnya, karena kontrol dari pengolahan hilang, dan analisis dan veriﬁcation program menjadi sewenang-wenang keras.

Inovasi teknik Web adalah yang menciptakan nilai tambah bagi penggunanya manusia. Dengan kata lain, GOTO ditingkat; Global GOTOs melegitimasi, karena ketika gerakan tersebut diperbolehkan kemungkinan dibuka kebetulan Reuse. Kembali dalam situasi yang dapat diprediksi, seperti yang terjadi dengan struktur hirarkis informasi, dapat juga terjadi di Web, dan GOTOs memiliki biaya mereka. Analisis interaksi dan kerjasama lebih sulit, sebagai Dijkstra diprediksi, dan juga sistem tergantung pada pemeliharaan dan berfungsinya ruang URI.

Struktur informasi tidak hanya sosial berdasarkan struktur pada Web; pengguna lain memiliki satu set yang lebih berorientasi proses persyaratan. Bagi banyak isu yang penting tidak berbagi informasi tetapi agak berbagi pengetahuan; untuk pengguna seperti itu, kunci yang tidak begitu banyak untuk memberikan ontologi sebagai cara mengekspresikan workﬂow. Dan pemodelan informasi ﬂow daripada negara telah memberikan rute yang menarik ke dalam penciptaan dan penemuan layanan Web.

5.4.3 Significance & Its Metric(Sebuah Metrik & Signifikan)

Konsep yang berkaitan dengan penggunaan sumber daya Web tertentu dalam proses adalah signiﬁcance. Signiﬁcance dapat didekomposisi menjadi dua jenis metrik: relevansi dan kualitas :

· Relevansi terhubung ke ide query: Berapa banyak pertanyaan yang menangani halaman? Cara diﬀerent menjawab pertanyaan itu telah menyebabkan perkembangan beberapa algoritma yang penting, tetapi ide dasarnya adalah bahwa halaman menangani permintaan ketika itu berisi informasi yang relevan dengan query atau mengarahkan pembaca ke sumber daya yang berisi informasi tersebut.

· Satu pendekatan adalah untuk melihat struktur hyperlink yang memberikan konteks untuk laman web, dan mencoba untuk menyimpulkan langkah-langkah relevansi dari struktur tersebut.

TFxIDF memberikan Skor relevansi ke dokumen berdasarkan jumlah berat istilah permintaan dinormalisasi oleh panjang vektor Euclidian dokumen; bobot istilah dihitung sebagai cross-produk istilah frekuensi (TF) dan invers dokumen frekuensi (IDF). TF adalah ukuran dari frekuensi istilah kejadian dalam sebuah dokumen, sementara IDF adalah ukuran dari jumlah link dokumen yang mengandung istilah. Ada dua utama teknik untuk mengekstrak informasi berkualitas dari struktur hyperlink:

· Cocitation-berbasis metode didasarkan pada wawasan bahwa link ke atau dari halaman mungkin untuk mengkonotasi beberapa jenis kesamaan.

· Bersama-sama dengan metrik relevansi, kualitas metrik dapat kemudian peringkat hasil pencarian

5.4.4 Trust And Reputation(Kepercayaan Dan Reputasi)

Kepercayaan adalah, tentu saja, faktor penting dalam pengembangan Web, di sejumlah bidang. Scientiﬁc atau makalah dipercaya untuk laporan hasil benar. Penulis halaman dipercaya untuk menjadi diri mereka katakan. Layanan web dipercaya untuk melakukan apa yang mereka katakan akan mereka lakukan tanpa merusak orang lain. Situs E-commerce dipercaya untuk membuat penggunaan yang tepat dari rincian kartu kredit, untuk mengirim barang yang dipesan, dan untuk menjaga data aman. Mengingat pentingnya konten untuk pemetaan Web kepercayaan, maka mungkin saja bahwa teknik menghasilkan kepercayaan dapat memainkan peran yang sama dengan Web semantik sebagai algoritma seperti PageRank, yang ekstrak informasi dari struktur diterjemah link, bermain di WWW.

5.4.5 Trust II : Mechanising Proof(Bukti Mechanising)

Satu pendapat seperti berpendapat Wittgenstein, bukti adalah gambar yang berdiri membutuhkan ratiﬁcation, yang mendapat ketika kita bekerja melalui itu, hal yang meyakinkan kita. Ini menjelaskan dan menunjukkan kebenaran proposisi terbukti secara bersamaan.

Jenis lain dari bukti mekanik dan algoritmik; ini mungkin lebih dapat diandalkan daripada bukti-sebagai-gambar, tapi diterima memerlukan itu harus diambil pada kepercayaan bahwa langkah-langkah dalam bukti dilakukan dengan benar.

· Kepercayaan diperlukan karena bukti mungkin unsurveyable

· bahkan jika tidak tidak eﬃcient atau biaya-eﬀective untuk memeriksa bukti setiap mekanik dengan tangan.

Fetzer berpendapat bahwa ada kebingungan gigih antara dua jenis bukti mekanis, satu urutan logis formula mana setiap rumus adalah aksioma baik berasal dari rumus di atas oleh aturan melestarikan kebenaran, dan lain yang dibuat oleh mesin.

5.4.6 Web Morality(Moralitas Web)

Pertanyaan moral dan etika adalah bagian penting dari agenda Web Science. Mereka diperlukan untuk pemahaman kita tentang cara kerja Web, dan, tidak kalah penting, bagaimana Web dapat tumbuh. Yang terpenting dalam ilmu Web adalah cara yang teknik, hubungan antara URI dan apa yang ditampilkan pada layar, tergantung pada Konvensi tertentu perilaku yang pada tingkat tertentu altruistik. Mungkin ada hal-hal untuk mengatakan tentang sanksi untuk menegakkan seperti perilaku yang baik, tapi itu tidak tempat ilmu Web untuk bekerja di luar cara memberikan kepemimpinan moral, atau bekerja keluar beberapa kali conﬂicts diﬃcult yang keinginan untuk bertindak secara moral sering naik.

Praktek penting, dan bagaimana mereka berhubungan dengan keinginan masyarakat untuk berperilaku dalam mode kooperatif. Analisis semacam itu dapat mengakibatkan kode perilaku yang tidak mungkin dilaksanakan tetapi yang rasa deﬁne perilaku moral dalam konteks Web. Moralitas dan teknik ternyata dihubungkan.

Jumlah link bekerja benar-benar menolak cukup cepat. Percobaan yang disebutkan sebelumnya merangkak halaman web 150m selama 11 minggu, dan Minggu 9 peneliti telah kehilangan akses ke lebih dari 10% dari halaman tersebut (sekitar 4% telah menghilang dalam minggu pertama). Sekitar 3% kembali kesalahan 4XX, sebagian besar orang-404 kesalahan (tidak ditemukan), dan sebagian besar sisanya 403S. (dilarang). Sekitar 3% dari halaman diblokir oleh ﬁles robots.txt server Web yang dideteksi dan ditolak Web crawler. 2-3% dari kegagalan jaringan-terkait, seperti DNS lookup kegagalan, menolak koneksi atau timeout TCP, sementara sekitar 2% kesalahan 3XX, menunjukkan halaman telah dipindahkan. Domain .com dan .net adalah appar-ently oﬀenders terburuk. Ini berarti bahwa memproduksi URI kebutuhan agak lebih berpikir dari satu akan membayangkan sebaliknya, bahwa webmaster harus berpikir secara rasional.

Makna,Supervienince,dan Simbol Grounding

5.2 Web Reasoning(Penalaran Web)

5.2.1 Plus Ca Change ?

Proyek Umum di Artiﬁcial intelijen (AI) berusaha untuk menghasilkan umum pemecah masalah beradaptasi secara simbolis Deskripsi dan penalaran, yang kuat (dan prima facie wajar) driver AI penelitian melalui tahun 1960-an dan 1970-an, pada akhirnya kandas di diﬃculties menentukan segalanya yang dibutuhkan untuk komputer untuk alasan tentang situasi yang

sewenang-wenang. Kegagalan ini menyebabkan nama meremehkan 'GOFAI' (baik Old Fashioned AI) untuk proyek. Beberapa berpendapat bahwa GOFAI terhalang oleh kegagalan untuk memecahkan masalah bingkai, fakta bahwa dunia nyata penalaran tampaknya menjadi sangat terletak, dan bahwa setiap deskripsi atau representasi dapat pernah dibatasi untuk berdamai dengan lokal signiﬁcance – untuk mengerti apa-apa komputer harus mengerti segala sesuatu.

Argumen AI-independen yang tampaknya mendukung yang pro GOFAI, yang (misalnya) ' mengetahui bagaimana ' adalah hanya spesies 'mengetahui bahwa', dan bahwa prosedural pengetahuan adalah, apa pun penampilan, hubungan antara agen dan proposisi, tapi argumen seperti itu tampaknya tidak ditanggung oleh teknologi. Alternatif untuk GOFAI, hal ini berpendapat, relatif bodoh metode berdasarkan sintaks dan perhitungan numerik – metode ini 'bodoh' (seperti PageRank, IR, NLP) ternyata berperilaku lebih efektif. Di sisi lain, klaim bahwa Web, dan Baratdaya khususnya, akan memukul masalah yang sama seperti GOFAI perlu dilihat dalam konteks manipulasi, berbagi dan interogasi terhadap data relasional sebagai dibayangkan oleh program SW.

Secara khusus, Baratdaya tidak mengandalkan, atau selalu bercita-cita untuk, produksi tingkat kecerdasan yang dibayangkan oleh teori GOFAI, Bouquet et al menggambarkan penutup cerobong asap (atau konteks-OWL), perpanjangan Owl yang memungkinkan bergantung pada konteks ontologi harus diwakili. Dan setidaknya satu komentator telah melihat Barat daya sebagai penyelamat potensi sistem pakar penelitian programmer. Sama atau terkait ilmu pengetahuan seharusnya menjadi lebih mudah beradaptasi untuk mengubah dan menggunakan kembali.

5.2.2 Alternative Ways of Reasoning(Cara Alternatif Untuk Penalaran)

Salah satu alternatif penalaran yaitu asosiatif penalaran, dimana penalaran berdasarkan asosiasi-yang dapat menjadi sangat tak terduga dan personalisasi-mengambil satu turun melatih pemikiran. Di Web, potensi asosiatif penalaran sangat besar, mengingat jumlah besar asosiatif hyperlink, dan sifat dunia kecil dari Web. Pencarian Google-seperti, berharga meskipun mereka tidak diragukan lagi, tidak seluruh cerita di dunia perangkat meresap kecil, agen perangkat lunak, dan sistem terdistribusi.

Namun, penalaran asosiatif melalui hyperlink, walaupun metode yang menarik dan penting, bukanlah satu-satunya cara untuk pergi tentang itu. Jenis pemikiran ini tidak ketat asosiatif penalaran yang tepat, karena asosiasi adalah penulis, orang yang menempatkan yang hyperlink ke dokumen. Associativity adalah jelas salah satu pendorong utama dari Web sebagai toko pengetahuan dan sumber informasi. Asosiatif penalaran, misalnya, telah digunakan untuk ﬁltering kolaboratif dalam sistem recommender.

Penalaran dengan analogi bekerja dengan bercak karakteristik yang serupa antara dua sub proyek turnkey, dan kemudian dengan asumsi mata pelajaran yang lebih, Dalam sebuah domain yang digambarkan oleh beberapa ontologi, teknik-teknik penalaran analogis juga mungkin berguna sebagai alasan bergerak dari satu set ontologis Deskripsi lain, meskipun sama-sama perubahan sudut pandang mungkin juga masalah. Ada menarik upaya untuk mendukung analogis penalaran (yaitu CBR) di seberang kompleks pengetahuan desentralisasi struktur tersebut, dan juga ekstensi ke XML untuk mengungkapkan kasus berbasis pengetahuan.

5.2.3 Reasoning Under Incomsistency(Penalaran Di bawah Incomsistency)

Untuk Web klasik prinsip ex falso quodlibet, bahwa konjungsi pernyataan dan penyangkalan yang mensyaratkan setiap proposisi apa pun, adalah jelas terlalu kuat. Menegakkan konsistensi memeriksa dan mencoba untuk melarang kontradiksi adalah non-starter berkat tekanan sosial terhadap inkonsistensi di Web, atau memang sistem terdistribusi berskala besar lainnya. Kemungkinan kesalahan (data yang tidak tepat entries) tentu tinggi. Kekuatan sosial ini membuat inkonsistensi tak terelakkan di berukuran bagian web- dan memang sudah telah mendorong banyak strategi penalaran di AI, dimana sistem dirancang dalam pengharapan harus mengatasi dengan bertentangan pengetahuan dasar, atau di mana ada kemungkinan bahwa pernyataan yang benar dalam model pada satu titik.

Keuntungan utama dari klasik logika adalah bahwa skala. Oleh karena itu salah satu solusi untuk masalah inkonsistensi adalah untuk mengembangkan strategi untuk berurusan dengan kontradiksi seperti yang muncul. Selain itu, ini adalah kesempatan aplikasi untuk paraconsistent logika, yang memungkinkan ekspresi inkonsistensi tanpa bersifat deduktif sesuai. Logika Paraconsistent pelokalan eﬀects inkonsistensi, sering memerlukan semantik relevansi dari proposisi yang digunakan dalam pemotongan (bukti ex falso quodlibet memerlukan konjungsi proposisi yang tidak relevan dengan kontradiktif yang), yang mencegah eﬀects menyebar melampaui hotspot kontradiktif.

Dalam istilah Web Science, masalah logika "benar" untuk Web akan tergantung pada konteks, tujuan analisis dan seterusnya. Tetapi jelas bahwa pemodelan Web sangat penting untuk sejumlah tujuan mana bukti-bukti diperlukan tentang apa dipertanggung jawabkan oleh serangkaian pernyataan.

5.3 Web Epistemology(Epistemologi Web)

Komputer telah merevolusi epistemologi, dan yang paling Web dari semua. Ide seperti Web Semantic bertahan kemungkinan perpanjangan otomatisasi pengolahan informasi. Gerakan e-knowledge telah terbukti sangat menarik. Filosofis, metode ilmiah telah terbukti sulit untuk memakukan, tapi ini sebagian karena logis struktur penelitian dan kesimpulan yang pasti dirusak oleh manusia dan sifat kolektif dari proses, yang berarti bahwa sosial proses, proses politik dan heuristik penemuan setidaknya sebagai penting sebagai logika. Selain itu, dengan memungkinkan penjelasan tentang asal dan lainnya isu-isu yang mendasari pengetahuan generasi, Web memungkinkan yang kuat dan dilembagakan apresiasi konteks pengetahuan (apa yang mengasumsikan, metode apa yang menciptakannya, dan akhirnya apa politik dan sosial berakhir pengetahuan dikembangkan untuk melayani). metadata tersebut seringkali penting dalam evaluasi heuristik pengetahuan, dan Web memberikan kesempatan untuk memahami sejarah sepotong pengetahuan, dan kontribusi bahwa sejarah yang membuat untuk kepercayaan nya. Ada dua pertanyaan epistemologis penting untuk Web Science. Yang pertama adalah sifat-sifat apa yang akan platform masa depan perlu dalam rangka untuk memungkinkan informasi sebanyak mungkin untuk tertarik ke Web tanpa memaksakan teori struktur atau pemerintahan atasnya? Salah satu tujuan dari Web adalah untuk memfasilitasi diskusi rasional ide-ide, bukan jenis penuh benci serangan ad hominem yang membentuk agak terlalu banyak dari apa yang secara longgar disebut perdebatan. Dan kedua, Web memiliki struktur desentralisasi radikal. Mengingat bahwa, tentu saja dapat digunakan frivolously atau jahat. Bagaimana bisa kita buat lebih mungkin daripada kurang, yang baik ilmu dan baik epistemologi berakhir di Web, dan bukan takhayul? Memang, adalah bahwa hal yang baik? Pada umumnya, kebanyakan orang berperilaku dengan itikad baik dengan menghormati satu sama lain di sebagian kalangan. Dan pendapat berbeda, bahkan dengan itikad baik. Tapi ada tetesan konstan bukti bahwa Web sedang digunakan untuk semen pendapat, dalam situasi politik yang terpolarisasi, dalam kelompok-kelompok marjinal, dan bahkan di kalangan teroris. Bisakah kita menemukan keseimbangan terbaik antara pertukaran bebas dari pendapat dan membatasi kesempatan untuk marginalisasi disengaja diri?

Analisis Web

4.1 Topologi Web

4.1.1 Struktur Web

Topologi penyelidikan berusaha untuk membedakan struktur dari elemen dasar dari arsitektur dan hubungan antara mereka. Web topologi berisi lebih kompleksitas dari sederhana rantai linier, Dalam bagian ini, kita akan membahas percubaan untuk mengukur struktur global dari Web, dan bagaimana masing-masing halaman web ﬁt ke dalam konteks itu. Ada pernyataan menarik bahwa deﬁne atau menyarankan properti penting? Misalnya, mungkin mungkin untuk memetakan pengetahuan di Web? Seperti peta mungkin mengizinkan kemungkinan pemahaman komunitas online, atau untuk terlibat dalam 'plume melacak'-mengikuti sebuah meme, atau ide, atau desas-desus, atau factoid, atau teori, dari pengecambahan untuk berbuah, atau sebaliknya, dengan menelusuri jalan ini muncul dalam berbagai halaman dan link mereka

Metode analisis web mencari pola link ternyata menjadi sangat menarik, mencerahkan dan kuat dalam struktur mereka mengungkap. Misalnya, beberapa situs tampaknya diambil sebagai otoritatif di beberapa cara-dengan kata lain, banyak situs lain link ke mereka. Situs lainnya mengandung banyak link keluar-salah satu cara untuk hamil ini akan bahwa situs tersebut indeks otoritas pada beberapa topik- dan situs-situs berguna ini bertindak sebagai hub. Hub tersebut juga mungkin pihak berwenang, tapi sama mereka mungkin akan menunjuk ke beberapa halaman atau bahkan tidak ada halaman sama sekali. Ketika metode seperti yang dipelopori oleh Kleinberg, Brin dan Page mengambil matriks link Web dan studi eigenvectors, ternyata bahwa mereka sesuai dengan cluster di sekeliling konsep yang halaman sekitar. Struktur otoritas-hub seperti besar penting kepada pemahaman kita tentang Web, dan memerlukan analisis matriks link ke studi. Memang, asli Kleinberg's Tujuannya adalah untuk menemukan otoritas, dan kehadiran online struktur otoritas-hub lebih kompleks awalnya kejutan

4.1.2 Teori Grafik Penyelidikan

Mungkin paling terkenal paradigma untuk mempelajari Web adalah teori grafik. Berbagai struktur makroskopik telah melihat dan diukur; misalnya satu merangkak dari lebih dari 200 juta halaman menemukan bahwa 90% dari Web benar-benar terhubung, jika link diambil sebagai non-directional, dan bahwa 56m Halaman ini adalah sangat terhubung cf. . Struktur yang dengan demikian ditemukan sering disebut sebagai bentuk bowtie,seperti ditunjukkan pada gambar 'Simpul' dasi adalah sangat terhubung cluster (SCC) webgraph di mana ada sebuah jalan antara setiap pasangan node. SCC adalah ﬂanked oleh dua set cluster, orang-orang yang link ke SCC tetapi dari yang ada tidak ada link kembali (ditandai sebagai dalam di ﬁgure), dan orang-orang yang terhubung ke dari SCC tetapi tidak menghubungkan kembali (keluar). Hubungan antara SCC, masuk dan keluar memberikan bentuk bowtie. Memang, struktur bowtie lazim di berbagai skala. Dill di al telah menemukan bahwa subset kecil dari Web juga memiliki bentuk bowtie, petunjuk bahwa Web memiliki sifat fraktal menarik-yaitu bahwa masing-masing daerah tematis-uniﬁed menampilkan (banyak) karakteristik yang sama dengan Web besar . Dengan cara ini sifat fraktal Web memberikan kita sebuah indikasi dari seberapa baik membawa kompromi antara stabilitas dan keragaman; sejumlah cukup konstan koneksi pada berbagai tingkat skala berarti komunikasi yang lebih eﬀective.

Rekayasa Web

3.2 Referensi & Identitas

Semantic Web mengandalkan konvensi penamaan dengan URI, dan Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi atau lainnya. Masalah dengan label di Web adalah bahwa sistem apapun dasarnya desentralisasi dan tidak diawasi, sesuai dengan Web yang mengatur prinsip-prinsip, tetapi ini tidak sentralisasi memungkinkan skema yang berbeda dan konvensi, dan memang kecerobohan, untuk berkembang, yang pada gilirannya membuka kemungkinan kegagalan referensi unik.

3.2.1 Referensi: Kapan dua benda yang sama?

Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta konten. Kegagalan referensi unik relatif sepele bagi pengguna manusia untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja keluar. Dan
jika kita berharap untuk mengekstrak informasi yang berguna dari repositori yang sangat besar informasi, dimana kerajinan tangan solusi dan referensi memeriksa oleh mata tidak layak, pengolahan mesin tidak bisa dihindari. Referensi masalah yang sangat mungkin terjadi ketika sumber-sumber informasi digabung, masalah di mana-mana tapi yang serius dalam konteks dari Web Semantic. Dan desentralisasi Web menghalangi membuat asumsi nama yang unik, dalam cara. Di sisi lain, URI menyediakan Web dengan sumber daya untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat diatasi bahwa dua istilah ini menunjuk ke URI yang sama.

Sebuah metode heuristik untuk menyelesaikan bentrokan tersebut, di dunia nyata, adalah untuk membuat penilaian cerdas berdasarkan informasi jaminan, dan ini telah menirukan online dengan perhitungan komunitas praktek nama, berdasarkan jaringan hubungan sekitarnya masing-masing instansi yang disengketakan. Secara umum, manajemen referensi, dan resolusi referensi masalah, akan selalu sulit mengingat bahwa Web mencakup sejumlah besar mengumpulkan informasi untuk sejumlah alasan yang berbeda dan untuk memecahkan berbagai tugas, makna dan interpretasi sering shift, dan ada mungkin pada kesempatan menjadi kesepakatan sedikit tentang referen istilah. Sebuah isu penting untuk Web Sains justru bagaimana memahami referensi dan representasi, dan menentukan sistem yang manajemen dan formalisms akan memungkinkan pemahaman yang lebih besar dan pelacakan dari apa yang Web ini dimaksudkan untuk mengatakan tentang yang objek.

3.2.2 Kapan adalah dua halaman yang sama?

Alternatif mengambil masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan menjadi sepele dalam banyak kasus, tetapi sering kali “utama ” teks yang disalin dari satu halaman ke lain, tetapi dikelilingi oleh iklan yang berbeda, logo, header dan footer. Banyak metrik yang tersedia yang dimaksudkan untuk menentukan kuantitatif tingkat hubungan antara dua halaman. Kesamaan penilaian bisa sembarangan dan pragmatis, tergantung pada konteks (misalnya memutuskan plagiat atau kasus pelanggaran hak cipta), tetapi teknik dari teori informasi yang ada untuk menghasilkan set nomor tujuan untuk memberi makan ke dalam proses penilaian – misalnya, Levenshtein edit jarak, dan varian algoritma, diberikan dengan jumlah minimum operasi dari beberapa basis yang diperlukan untuk bisa mengubah satu string menjadi lain.

3.3 Web teknik: arah baru

Pembangunan Web adalah campuran dari standar-setting, tidak terstruktur, desentralisasikegiatan dan inovasi, dan rekayasa yang disengaja. Pada bagian ini kita akan fokus pada yang terakhir, dan review menonjol teknik isu dan keharusan terbuka. Pertumbuhan Web jelasmerupakan sesuatu yg diinginkan kunci. Penyimpanan jumlah semakin besar informasi, dalamkonteks perhitungan pernah-cepat, akan sangat vital untuk masa mendatang. Tanpa lebih cerdas pengambilan penyimpanan dan cepat untuk mediamemori-lapar seperti video, maka pada akhirnya akan tumbuh terlalu theWeb besar untukteknologi sendiri. Sebagai contoh, PageRank membutuhkan merangkak dan caching dari bagian signifikan dari theWeb; keberhasilan Google tergantung pada kemampuan untuk menjaga cachepenurut sementara juga ukuran yang signifikan. Greater permintaan untuk layanan personalisasidan pencari juga akan memberikan tekanan pada sistem. Memperluas cakupan pencarian untukmencakup item seperti multimedia, jasa atau komponen ontologi, juga akan memerlukan mengejarprogram penelitian akademik, interface efektif dan model bisnis yang masuk akal sebelum layanankomersial mulai beroperasi. Yang ada dan mengembangkan pendekatan untuk memanfaatkanWeb harus diperluas ke lingkungan Web yang baru sebagaimana yang diciptakan (seperti P2Pjaringan).

3.3.1 Layanan Web

Layanan area utama di mana kami rekayasa model kebutuhan Web untuk terlibat dan jasaextended.Web didistribusikan potongan kode ditulis untuk memecahkan tugas-tugas tertentu,yang dapat berkomunikasi dengan layanan lain melalui pesan. Tugas yang berskala lebih luasdapat dianalisis dan secara rekursif dipecah menjadi sub-tugas yang dengan peta keberuntunganakan ke spesifik tugas-tugas yang dapat diatasi oleh layanan. Jika itu terjadi, dan jika layananditempatkan dalam konteks Web, yang berarti bahwa pengguna dapat memanggil layanan yangbersama-sama dan kooperatif memenuhi kebutuhan mereka. Software abstrak jauh dari hardwaredan memungkinkan kita untuk menentukan komputasi mesin dalam hal fungsi logis, yangmemfasilitasi spesifikasi masalah dan solusi dengan cara yang relatif intuitif. The evolusi dari Webuntuk memasukkan penyediaan dan difusi layanan membuka prospek abstraksi baru: pertanyaansekarang adalah bagaimana kita bisa melakukan abstraksi yang sama jauh dari perangkat lunak.Apa metode menggambarkan layanan akan memungkinkan kita untuk berhenti khawatir tentangbagaimana mereka akan dilakukan?

Sejumlah metode proses menentukan telah berkembang selama beberapa tahun terakhirdan diterapkan pada domain layanan Web. Misalnya, WS-Net adalah bahasa deskripsiarsitektural berdasarkan teori Petri jaring berwarna (yaitu perluasan dari teori Petri sederhanabersih dengan terhormat, token diidentifikasi), yang menggambarkan komponen layanan Webdalam hal jasa yang memberikan untuk komponen lain, layanan yang diperlukan untuk fungsi, danoperasi internal. Hasil akhirnya adalah model yang mencakup baik global dan aspek-aspek lokaldari sistem pelayanan, memfasilitasi integrasi layanan Web untuk mencapai tujuan-tujuan baru,sementara juga menyediakan sebuah formalisme untuk evaluasi integrasi. Proses aljabar (lihatBagian 4.2.5) juga telah diterapkan untuk layanan. Sekali lagi, seperti dengan pendekatan Petrinet, penggunaan formal aljabar memungkinkan baik desain dan evaluasi untuk mengambil tempat(atau memang salah satu atau yang lain, tergantung pada apa metode alternatif yang tersedia untukmenghasilkan atau survei kode). Sebagai contoh, [98] menggambarkan pemetaan antara aljabarproses ekspresif dan BPEL4WS (yang distandarisasi Berbasis XML notasi untukmenggambarkan proses bisnis executable), yang memungkinkan baik pembentukan jasa diBPEL4WS diikuti oleh mereka evaluasi dan verifikasi menggunakan aljabar proses, atau generasikode BPEL4WS otomatis dari penggunaan aljabar untuk menentukan layanan yang diinginkan.Secara umum, spesifikasi aljabar pelayanan pada tingkat abstrak dan penalaran tentang merekatelah menjadi utama bidang penelitian pada layanan.

BPEL4WS adalah versi panjang dari Eksekusi Proses Bisnis Bahasa BPEL, yang menjadi cara yang semakin penting untuk Sun Web layanan dengan proses bisnis. BPEL ada batasnya, tapi memungkinkan penciptaan layanan komposit dari layanan yang telah ada. The Tahap selanjutnya adalah menyesuaikan pendekatan ini untuk lingkungan P2P, dan kendaraan saat ini dalam pengembangan untuk itu adalah CDL, alias WS-CDL, alias

Koreografi (Web Services Choreography Description Language), sebuah bahasa berbasis XML untuk mendefinisikan umum dan saling melengkapi diamati perilaku dalam kolaborasi P2P. Tujuannya adalah agar interoperable P2P kolaborasi dapat disusun dengan menggunakan Koreografi tanpa memperhatikan spesifik seperti platform dasar yang digunakan; bukan fokus pada tujuan umum dari kolaborator. Sedangkan BPEL memungkinkan ada pelayanan yang akan digabungkan bersama-sama, Koreografi pergeseran fokus ke deskripsi global kolaborasi, informasi pertukaran, pemesanan tindakan dan sebagainya, untuk mencapai tujuan yang disepakati.

3.3.2 Didistribusikan pendekatan: merasuk komputasi, P2P dan grid

Ada banyak lingkungan hardware yang akan Web diharapkan untuk menembus, namun di mana teknik asumsi yang berlaku untuk skala besar, lebih-atau-kurang tetap mesin komputasikhusus tidak harus berlaku. Contoh nyata termasuk komputasi mobile, di mana-mana (ataumeresap) komputasi mana interoperabilitas menjadi masalah, P2P sistem dan komputasi grid.Komputasi Mobile membuat segala macam tuntutan rekayasa, daya komputasi yang tersediatidak luas dan pengguna harus diasumsikan terus-menerus bergerak dengan variabel bandwidthdan akses. Selain itu, menyajikan informasi kepada pengguna

memerlukan paradigma yang berbeda dari PC, misalnya untuk memungkinkan pengguna untuk menerima informasi yang cukup pada layar kecil untuk membuat browsing menarik. Akses mobile ke Web dapat menjadi mode dominan di banyak negara, terutama yang berkembang, terima kasih untuk harga yang relatif rendah dan keandalan koneksi nirkabel dan baterai kekuasaan.Penelitian di bidang ini penting untuk adil distribusi sumber daya web.

Mana-mana komputasi, P2P dan berbagi banyak komputasi grid serius penelitian masalah, terutama koordinasi perilaku dalam jumlah besar terdistribusi skala sistem. Mana-mana komputasimembayangkan kecil, relatif perangkat komputasi bertenaga rendah tertanam di lingkunganpervasively berinteraksi dengan orang. Ada berbagai kemungkinan imajinatif, seperti benangcerdas yang dapat ditenun menjadi pakaian. Tapi tanpa menebak-nebak kecenderungan jelaslahbahwa perangkat yang lebih kecil akan perlu koneksi nirkabel ke jaringan arsitektur yang memungkinkan otomatis ad hoc konfigurasi, dan ada sejumlah kesulitan rekayasa yang terkaitdengan masalah. Sebagai contoh, penemuan layanan dalam paradigma meresap harus mengambiltempat tanpa manusia dalam loop. Layanan harus mampu mengiklankan diri untuk memfasilitasipenemuan. Standar layanan penerbitan akan diperlukan untuk menjamin keamanan dan privasi, kepercayaan dari layanan keandalan,kompensasi untuk penyedia layanan, dan tepat bagaimana layanan akan terdiri dengan layanan dipanggil lain untuk mencapai beberapa tujuan atau memecahkan masalah yang dihadapi.

3.3.3 Personalisasi

Personalisasi penting untuk meningkatkan nilai jaringan , dan peningkatan konsumen kunci . Recommender sistem yang jelas penerapan teknologi untuk mendapatkan eﬀective personalisasi, harus ada terpadu penggunaan informasi dari berbagai sumber, termasuk data tentang pengguna (klik streaming, men-download data pola, online proﬁles), sumber daya yang disampaikan (konten situs, struktur situs) dan domain pengetahuan, bersama dengan data pertambangan teknik suﬃcient untuk menciptakan pandangan menyeluruh sumber daya yang mencakup banyak informasi yang dibutuhkan para pengguna. Mengingat bahwa, di Web, informasi yang relevan cenderung sangat didistribusikan dan dinamis, personalisasi diharapkan menjadi salah satu keuntungan besar dari Web semantik, yang adalah pre-nyata struktur yang memungkinkan penalaran melalui beberapa dan didistribusikan sumber data, Lain penting untai teknik personalisasi adalah pengembangan alat untuk mengaktifkan relatif neophytes untuk menciptakan atau meningkatkan artefak kompleks pengetahuan teknik, seperti ontologi atau pembungkus.

3.3.4 Multimedia

Web adalah lingkungan multimedia, yang membuat untuk kompleks semantik – ini tentu saja tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam bentuk analog. Misalnya ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka. Ada memiliki upaya telah menghasilkan taksonomi generatif ‘bahasa-seperti’ representasi visual, tetapi ini tidak tampaknya telah menarik aplikasi. Beberapa peneliti telah mencoba untuk menemukan prinsip-prinsip yang mungkin mendasari penalaran diagramatik. Adajuga telah aplikasi penting untuk decoding representasi visual untuk gangguan penglihatan dan koleksi gambar visualisasi terhadap ontologi domain. Pada akhirnya, integrasi multimodalrepresentasi adegan yang sama atau badan adalah masalah yang sangat keras. Secara umum, tidak diketahui bagaimana mengambil semantik dari representasi non-tekstual andal; fenomena ini dikenal sebagai semantik kesenjangan. Namun demikian, generasi Web berikutnya tidak harusdidasarkan pada palsu asumsi bahwa teks adalah pencarian dominan dan kata kunci berbasisakan mencukupi untuk semua tujuan yang wajar. Memang, isu-isu berkaitan dengan navigasimelalui repositori multimedia seperti video

arsip dan melalui theWeb tidak berhubungan: keduanya kebutuhan informasi link untukmendukung browsing, dan keduanya perlu untuk mendukung mesin manual link traversal. Namun,pendekatan kata kunci mungkin goyah dalam multimedia konteks karena kekayaan yang lebih besar dari banyak non-tekstual Media.

3.3.5 Pemrosesan Bahasa Alami

NLP berkaitan dengan Web dalam beberapa cara. Di tempat pertama, bahasa alami adalah sangat jarang domain, yang kebanyakan kalimat yang diucapkan atau ditulis terjadi sekali saja atau sangat jarang, dan skala raksasa Web menyediakan korpus menarik untuk NLP penalaran.

Kedua, mengingat masalah skala Web, teknik NLP akan penting dalam tugas-tugas seperti summarisation (Lihat, misalnya, dokumen pemahaman konferensi tahunan dan [69]), yang dapat memberikan dukungan berguna untuk bagian manusia dari tugas Cari.

Ketiga, NLP memiliki potensi besar untuk pembangunan macam antarmuka intuitif yang heterogen dan tidak selalu melek komputer komunitas pengguna Web memerlukan. Memang itu mungkin membantu menjembatani kesenjangan antara visi SW Web terdiri dari data yang dimanipulasi secara logis, dan visi yang lebih tradisional dari Web sebagai tempat mana berguna dokumen yang diperoleh.

Dengan demikian kita memiliki disanalogy langsung antara NLP dan SW, yang adalah bahwa URI, seperti kata-kata, pemilik, dan sehingga dapat diatur. Itu adalah bukan untuk mengatakan bahwa peraturan tersebut akan memastikan kekebalan dari drift makna bahwa ahli bahasa mendeteksi, tetapi mungkin menyediakan stabilitas suﬃcient atas pendek jangka menengah.