Apa itu Cyc System?
Cyc (/ saɪk /) adalah proyek kecerdasan buatan terpanjang di dunia, mencoba untuk mengumpulkan ontologi dan basis pengetahuan yang komprehensif yang mencakup konsep dasar dan "aturan praktis" tentang bagaimana dunia bekerja (pikirkan pengetahuan akal sehat namun lebih berfokus pada hal-hal yang jarang ditulis atau dikatakan, berbeda dengan fakta yang mungkin ditemukan di internet atau diambil melalui Google atau Wikipedia), dengan tujuan mengaktifkan aplikasi AI untuk melakukan penalaran seperti manusia dan kurang "rapuh" saat berhadapan dengan situasi baru yang tidak terbentuk sebelumnya. Douglas Lenat memulai proyek ini pada bulan Juli 1984 di MCC, di mana dia menjadi Principal Scientist1984-1994, dan kemudian, sejak Januari 1995, telah berada dalam pengembangan aktif oleh perusahaan Cycorp, di mana dia menjadi CEO sampai awal 2017. Bagian dari proyek tersebut dirilis sebagai OpenCyc, yang menyediakan titik akhir API, RDF, dan data dump di bawah lisensi open source.
Kebutuhan akan proyek kecerdasan buatan simbolis yang besar dari jenis ini lahir pada awal tahun 1980an dari sejumlah besar pengalaman yang peneliti AI sebelumnya telah, dalam 25 tahun sebelumnya, dimana program AI mereka akan menghasilkan hasil awal yang menggembirakan namun kemudian gagal " meningkatkan "kegagalan untuk mengatasi situasi dan masalah baru di luar daerah sempit yang mereka maksud dan rancang untuk diatasi.
Douglas Lenat dan Alan Kay mempublikasikan kebutuhan ini, dan mengadakan sebuah pertemuan di Stanford pada tahun 1983 untuk mempertimbangkan masalahnya; perhitungan back-of-the-amplop oleh mereka dan rekan-rekannya termasuk Marvin Minsky, Allen Newell, Edward Feigenbaum, dan John McCarthy mengindikasikan bahwa usaha tersebut memerlukan waktu antara 1000 dan 3000 orang-tahun, sehingga tidak sesuai dengan proyek akademik standar. model. Secara kebetulan, peristiwa dalam waktu satu tahun dalam pertemuan tersebut memungkinkan usaha Manhattan-Project seukuran sedang berlangsung. Proyek ini dimulai pada bulan Juli 1984 sebagai proyek unggulan Microelectronics dan Computer Technology Corporation 400 orang, sebuah konsorsium penelitian yang dimulai oleh dua lusin perusahaan besar di Amerika Serikat "untuk melawan usaha Jepang yang tidak menyenangkan di AI, yang disebut proyek "generasi kelima".
Pemerintah AS bereaksi terhadap ancaman Generasi ke-5 dengan mengesahkan National Cooperative Research Act tahun 1984, yang untuk pertama kalinya memungkinkan perusahaan AS untuk "berkolusi" pada risiko tinggi jangka panjang Penelitian banding, dan MCC dan Sematech muncul untuk memanfaatkan kesempatan sepuluh tahun itu. Presiden dan CEO MCC yang pertama adalah Bobby Ray Inman, mantan direktur NSA dan deputi direktur Central Intelligence Agency.
Tujuan dari proyek Cyc adalah untuk mengkodifikasi, dalam bentuk yang dapat digunakan dengan mesin, jutaan pengetahuan yang membentuk akal sehat manusia. Ini melibatkan, sepanjang jalan,
- mengembangkan bahasa representasi ekspresif yang memadai, CycL,
- mengembangkan ontologi yang mencakup semua konsep manusia sampai pada tingkat yang sesuai,
- mengembangkan basis pengetahuan pada kerangka ontologis, terdiri dari semua pengetahuan manusia tentang konsepkonsep tersebut sampai pada tingkat yang sesuai, dan
- mengembangkan mesin inferensi secara eksponensial lebih cepat daripada yang digunakan pada sistem pakar konvensional, ke dapat menyimpulkan jenis dan kedalaman kesimpulan yang sama yang dapat dimiliki manusia, mengingat pengetahuan mereka tentang dunia.
- Bahasa representasi CycL dimulai sebagai perpanjangan dari RLL (yang disebut Representasi Language Language, yang dikembangkan pada tahun 1979-1980 oleh Profesor Douglas Lenat di Universitas Stanford dan mahasiswa pascasarjana Russell Greiner), namun dalam beberapa tahun peluncuran proyek Cyc menjadi jelas bahwa bahkan mewakili sebuah berita atau iklan baru atau iklan akan memerlukan lebih dari sekedar kekuatan ekspresif dari logika orde penuh, yaitu kalkulus predikat urutan kedua ("Apa hubungan antara hujan dan air? ") dan bahkan urutan logika tingkat yang lebih tinggi termasuk logika modal, refleksi (memungkinkan sistem untuk memikirkan kemajuannya sejauh ini, pada masalah di mana ia bekerja), dan logika konteks (memungkinkan sistem untuk menjelaskan secara eksplisit tentang konteks di mana berbagai premis dan kesimpulannya mungkin ada), logika nonmonotonik, dan keteraturan. Jadi, pada tahun 1989, CycL telah berkembang dalam kekuatan ekspresif ke Higher Order Logic (HOL).
- Representasi triplestore (yang mirip dengan bahasa representasi Frame-and-slot pada tahun 1970an dari mana RLL melompat) tersebar luas hari ini di AI. Mungkin berguna untuk mengutip beberapa contoh yang menekankan atau menghancurkan jenis representasi tersebut, tipikal contoh-contoh yang memaksa proyek Cyc berpindah dari representasi triplestore ke yang jauh lebih ekspresif selama periode 1984-1989: bahasa Inggris kalimat termasuk negasi ("Fred tidak memiliki anjing"), nested quantifiers ("Setiap orang Amerika memiliki seorang ibu" berarti untuk - semua x ada - ada y ... tapi "Setiap orang Amerika memiliki seorang Presiden" berarti di sana ada bahwa untuk semua x ...), bersarang modals seperti "Amerika Serikat percaya bahwa Jerman ingin NATO untuk menghindari mengejar ..." dan bahkan canggung untuk mewakili, dalam hubungan Triplestore, arity lebih tinggi dari 2, seperti "Los Angeles adalah antara San Diego dan San Francisco sepanjang US101."
- Ontologi istilah Cyc tumbuh menjadi sekitar 100.000 selama dekade pertama proyek ini, sampai tahun 1994, dan pada tahun 2017 berisi sekitar 1.500.000 istilah. Ontologi meliputi: 416.000 koleksi (jenis, jenis, jenis alami, yang mencakup kedua jenis hal seperti Ikan dan jenis tindakan seperti Memancing) sedikit lebih dari satu juta individu yang mewakili 42.500 predikat (hubungan, atribut, bidang, sifat, fungsi), sekitar satu juta entitas yang terkenal secara umum seperti TheUnitedStatesOfAmerica, BarackObama, TheSigningOfTheUSDeclarationOfIndependence, dll.
- Sejumlah besar istilah tambahan yang sewenang-wenang juga secara implisit hadir dalam ontologi Cyc, dalam artian ada istilah yang menunjukkan fungsi seperti CalendarYearFn (bila diberi argumen 2016, ini menandakan tahun kalender 2016), GovernmentFn (ketika diberi argumen Prancis itu menunjukkan pemerintah Prancis), Meter (ketika diberi argumen 2016, ini menunjukkan jarak 2.016 kilometer), dan nestings dan komposisi dari fungsi tersebut - yang menunjukkan istilah.
- Dasar pengetahuan Cyc dari peraturan umum umum dan asersi yang melibatkan istilah ontologis sebagian besar diciptakan dengan tulisan tangan aksioma; tumbuh menjadi sekitar 1 juta pada tahun 1994, dan pada tahun 2017 sekitar 24,5 juta dan telah menghasilkan lebih dari 1.000 orang-tahun usaha untuk dibangun.
- Penting untuk dipahami bahwa insinyur ontologi Cyc berusaha keras agar jumlah tersebut sekecil mungkin, tidak mengembangnya, asalkan deduktifnya. Penutupan basis pengetahuan tidak berkurang. Misalkan Cyc diberitahu tentang satu miliar individu manusia, hewan, dll. Maka bisa dikatakan 1018 fakta bentuk "Mickey Mouse bukan individu yang sama dengan Bullwinkle the Moose". Tapi alih-alih itu, orang bisa memberi tahu Cyc 10,000 Linnaean Taxonomy rules diikuti hanya dengan 108 aturan bentuk "No mouse is a moose". Dan bahkan lebih ringkas lagi, Cyc hanya bisa diberi 10.000 peraturan Linnaean Taxonomy yang diikuti hanya dengan satu aturan dalam bentuk "Untuk dua nampan Linnaean, jika keduanya tidak diketahui secara eksplisit sebagai supertaxon yang lain, maka mereka akan menguraikannya". 10.001 assertions tersebut memiliki penutupan deduktif yang sama dengan 1018 fakta yang disebutkan sebelumnya.
- Desain mesin inferensi Cyc memisahkan masalah epistemologis (konten apa yang harus ada di Cyc KB) dari masalah heuristik (bagaimana Cyc dapat secara efisien menyimpulkan argumen ratusan langkah dalam, di lautan puluhan juta aksioma). Untuk melakukan yang pertama, bahasa CycL dan kesimpulan logis yang dipahami dengan baik mungkin cukup, tapi untuk Cyc yang terakhir menggunakan arsitektur community-of-agents, di mana modul penalaran khusus, masing-masing memiliki struktur data dan algoritma sendiri, "angkat tangan mereka" jika mereka dapat secara efisien membuat kemajuan pada salah satu masalah sub saat ini terbuka. Pada akhir dekade pertama, 1994, ada 20 modul tingkat heuristik (HL); pada tahun 2017 terdapat lebih dari 1.050 modul HL.
- Beberapa modul HL ini sangat umum, seperti modul yang menyimpan Kleene Star (penutupan transitif) dari semua hubungan transitif yang biasa digunakan dalam ontologi Cyc.
- Beberapa bersifat spesifik domain, seperti penyeimbang persamaan kimia. Ini dapat dan sering merupakan "pelarian" ke (pointer ke) beberapa program atau basis data online atau database online yang tersedia secara eksternal, seperti modul untuk cepat "menghitung" populasi kota saat ini dengan mengetahui di mana / bagaimana melihat ke atas.
CycL memiliki spesifikasi yang dirilis secara publik dan lusinan modul HL digambarkan, namun kode inferensi mesin Cyc yang sebenarnya, dan daftar lengkap modul 1000+ HL, adalah proprietary Cycorp.
Nama "Cyc" (dari "ensiklopedia", diucapkan [saɪk] seperti syke) adalah merek dagang terdaftar milik Cycorp. Akses ke Cyc adalah melalui lisensi berbayar, namun kelompok penelitian AI yang bonafid diberikan hanya lisensi tanpa biaya penelitian (bandingkan ResearchCyc); Saat ini ada lebih dari 600 kelompok di seluruh dunia dengan lisensi semacam itu.
Potongan khas pengetahuan yang terwakili dalam basis pengetahuan Cyc adalah "Setiap pohon adalah tanaman" dan "Tanaman akhirnya mati". Saat ditanya apakah pohon mati, mesin inferensi bisa menarik kesimpulan yang jelas dan menjawab pertanyaan dengan benar. Sebagian besar pengetahuan Cyc, di luar matematika dan permainan, hanya berlaku secara default. Sebagai contoh, Cyc tahu bahwa sebagai orang tua standar mencintai anak-anak mereka, saat Anda bahagia, Anda akan tersenyum, mengambil langkah pertama adalah pencapaian besar, ketika seseorang yang Anda cintai memiliki prestasi besar yang membuat Anda bahagia, dan hanya orang dewasa yang memiliki anak.
Ketika ditanya apakah sebuah gambar bertuliskan "Seseorang yang melihat putrinya mengambil langkah pertamanya" berisi orang dewasa yang tersenyum, Cyc secara logis dapat menyimpulkan bahwa jawabannya adalah Ya, dan "tunjukkan pekerjaannya" dengan menyajikan argumen logis selangkah demi selangkah dengan menggunakan kelima potongan tersebut. pengetahuan dari KB nya. Ini dirumuskan dalam bahasa CycL, yang didasarkan pada kalkulus predikat dan memiliki sintaks yang mirip dengan bahasa pemrograman Lisp.
Pada tahun 2008, sumber daya Cyc dipetakan ke banyak artikel Wikipedia, berpotensi mengurangi keterkaitan dengan kumpulan data terbuka lainnya seperti DBpedia dan Freebase. Sebagian besar pekerjaan saat ini Cyc terus menjadi teknik pengetahuan, yang mewakili fakta tentang dunia dengan tangan, dan menerapkan mekanisme inferensi yang efisien terhadap pengetahuan itu.
Semakin lama, bagaimanapun, bekerja di Cycorp melibatkan sistem Cyc yang memiliki kemampuan untuk berkomunikasi dengan pengguna akhir dalam bahasa alami, dan untuk membantu proses pengetahuan formasi yang sedang berlangsung melalui pembelajaran mesin dan pemahaman bahasa alami. Upaya besar lainnya di Cycorp adalah membangun seperangkat alat teknik ontologis bertenaga Cyc untuk menurunkan hambatan masuk bagi individu untuk berkontribusi, mengedit, menjelajah, dan mengisyaratkan Cyc.
Seperti banyak perusahaan, Cycorp memiliki ambisi untuk menggunakan pemrosesan bahasa alami Cycuntuk mengurai seluruh internet untuk mengambil data terstruktur; tidak seperti semua lainnya, ia dapat memanggil sistem Cyc sendiri untuk bertindak sebagai bias induktif dan sebagai adjudikator ambiguitas, metafora, dan elipsis.
Dasar pengetahuan Cyc System
Nama konsep di Cyc adalah konstanta CycL. Konstanta dimulai dengan opsional "# $" dan sensitifhuruf. Ada konstanta untuk:- Item individual dikenal sebagai individu, seperti # $ BillClinton atau # $ France.
- Koleksi, seperti # $ Tree-ThePlant (berisi semua pohon) atau # $ EquivalenceRelation (berisi semua hubungan kesetaraan). Anggota koleksi disebut contoh koleksi itu.
- Fungsi, yang menghasilkan istilah baru dari yang diberikan. Misalnya, # $ FruitFn, bila diberi argumen yang menjelaskan jenis (atau koleksi) tanaman, akan mengembalikan koleksi buahnya. Dengan konvensi, konstanta fungsi dimulai dengan huruf besar dan diakhiri dengan string "Fn".
- Fungsi kebenaran, yang dapat diterapkan pada satu atau lebih konsep lain dan mengembalikan yang benar atau yang salah. Misalnya, # $ saudara kandung adalah hubungan saudara kandung, benarkah kedua argumen tersebut bersaudara. Dengan konvensi, konstanta fungsi kebenaran dimulai dengan huruf kecil. Fungsi kebenaran dapat dipecah menjadi koneksi logis (seperti # $ dan, # $ atau, # $ not, # $ menyiratkan), quantifier (# $ forAll, # $ thereExists, etc.) dan predicates.
Dua prediktor biner penting adalah # $ isa dan # $ genls. Yang pertama menjelaskan bahwa satu item adalah contoh dari beberapa koleksi, koleksi kedua yang satu koleksi adalah subcollection yang lain.
Fakta tentang konsep ditegaskan dengan menggunakan kalimat CycL tertentu. Predikat ditulis sebelum argumen mereka, dalam tanda kurung:
(# $ isa # $ BillClinton # $ UnitedStatesPresiden)
"Bill Clinton termasuk dalam koleksi presiden A.S." dan (# $ genls # $ Tree-ThePlant # $ Plant) "Semua pohon adalah tanaman".
(# $ capitalCity # $ Prancis # $ Paris)
"Paris adalah ibu kota Prancis."
Kalimat juga bisa berisi variabel, string dimulai dengan "?". Kalimat ini disebut "aturan". Satu aturan
penting menegaskan tentang predikat # $ isa
(# $ menyiratkan
(# $ dan
(# $ isa? OBJ? SUBSET)
(# $ genls? SUBSET? SUPERSET))
(# $ isa? OBJ? SUPERSET))
dengan interpretasi "jika OBJ adalah turunan dari koleksi SUBSET dan SUBSET adalah subcollection dari SUPERSET, maka OBJ adalah instance dari koleksi SUPERSET". Contoh khas lainnya adalah (# $ relationAllExists # $ biologicalMother # $ ChordataPhylum # $ FemaleAnimal)
yang berarti bahwa untuk setiap contoh koleksi # $ ChordataPhylum (yaitu untuk setiap chordate), ada, hewan betina (contoh # $ FemaleAnimal), yang merupakan ibunya (dijelaskan oleh predikat # $
biologicalMother).
Basis pengetahuan dibagi menjadi beberapa microtheories (Mt), kumpulan konsep dan fakta yang biasanya berkaitan dengan satu bidang pengetahuan tertentu. Berbeda dengan basis pengetahuan secara keseluruhan, masing-masing microtheory harus terbebas dari kontradiksi monotonik. Setiap microtheory adalah objek kelas satu dalam ontologi Cyc; itu memiliki nama yang merupakan konstanta biasa; Konstanta microtheory mengandung string "Mt" dengan konvensi. Contohnya adalah # $ MathMt, microtheory yang berisi pengetahuan matematika. The microtheories dapat mewarisi satu sama lain dan diatur dalam hirarki: satu spesialisasi # $ MathMt adalah # $ GeometryGMt, microtheory tentang geometri.
Mesin inferensi Cyc System
Mesin inferensi adalah program komputer yang mencoba memperoleh jawaban dari basis pengetahuan. Mesin inferensi Cyc melakukan deduksi logis umum (termasuk modus ponens, modus tolens, kuantifikasi universal dan kuantifikasi eksistensial). Ini juga melakukan penalaran induktif, pembelajaran mesin statistik dan pembelajaran mesin simbolis, dan penalaran abduktif (tapi tentu saja hemat dan menggunakan KB yang ada sebagai filter dan panduan). Rilis - OpenCycVersi pertama OpenCyc dirilis pada musim semi 2002 dan hanya berisi 6.000 konsep dan 60.000 fakta. Basis pengetahuan dirilis di bawah Lisensi Apache. Cycorp menyatakan niatnya untuk merilis OpenCyc dibawah lisensi paralel tanpa batas untuk memenuhi kebutuhan penggunanya. Penerjemah CycL dan SubL (program yang memungkinkan pengguna untuk melihat dan mengedit database dan juga untuk menarik kesimpulan) dibebaskan secara gratis, namun hanya sebagai biner, tanpa kode sumber.
Ini tersedia untuk Linux dan Microsoft Windows. Proyek open source Texai merilis konten yang kompatibel dengan RDF yang diambil dari OpenCyc. Versi OpenCyc, 4.0, dirilis pada bulan Juni 2012. OpenCyc 4.0 menyertakan sebagian besar ontologi Cyc pada waktu itu, yang berisi ratusan ribu istilah, bersama dengan jutaan pernyataan yang berkaitan dengan persyaratan satu sama lain; Namun, ini terutama adalah pernyataan taksonomi, bukan peraturan kompleks yang ada di Cyc. Basis pengetahuan OpenCyc 4.0 berisi 229.000 konsep dan 2.093.000 fakta.
Poin utama untuk merilis OpenCyc adalah membantu peneliti AI memahami apa yang hilang dari apa yang sekarang mereka sebut ontologi dan grafik pengetahuan. Ini berguna dan penting untuk memiliki konsep taksonomi yang benar seperti orang, malam, tidur, berbaring, bangun, bahagia, dll., Tapi apa yang hilang dari konten OpenCyc tentang persyaratan tersebut, namun hadir dalam konten Cyc KB, adalah berbagai aturan ibu jari yang sebagian besar dari kita berbagi tentang istilah-istilah itu: bahwa (sebagai default, di ModernWesternHumanCultureMt) setiap orang tidur semalaman, tidur terbaring, bisa terbangun, tidak senang terbangun, dan seterusnya. Poin tersebut tidak memerlukan rilis OpenCyc yang terus diperbarui, jadi, pada tahun 2017, OpenCyc tidak lagi tersedia.
Penelitian Tentang Cyc System
Pada bulan Juli 2006, Cycorp merilis executable ResearchCyc 1.0, sebuah versi Cyc yang ditujukan untuk komunitas riset, tanpa biaya. (ResearchCyc dalam tahap beta pembangunan sepanjang tahun 2004; versi beta dirilis pada bulan Februari 2005.) Selain informasi taksonomi yang terdapat dalam OpenCyc, ResearchCyc mencakup pengetahuan semantik yang lebih signifikan (yaitu, fakta tambahan dan aturan praktis) yang melibatkan konsep dalam basis pengetahuannya; Ini juga mencakup leksikon besar, alat pengurai dan pengurai bahasa Inggris, dan antarmuka berbasis Java untuk pengeditan dan pengenal pengetahuan. Selain itu berisi sistem untuk integrasi data berbasis Ontologi. Pada tahun 2017, rilis reguler ResearchCyc terus muncul, dan dilisensikan kepada lebih dari 600 kelompok penelitian di seluruh dunia tanpa biaya untuk tujuan penelitian nonkomersial.
Aplikasi Cyc System
Telah ada lebih dari 100 aplikasi Cyc yang berhasil; yang tercantum di sini adalah beberapa contoh yang sama sekali berbeda:Termohon Termohon Manager Thesaurus / Integrator Selama lebih dari satu dekade, Glaxo telah menggunakan Cyc untuk secara semi-otomatis mengintegrasikan semua istilah (ratusan ribu istilah) thesauri dari istilah industri farmasi yang mencerminkan penggunaan yang berbeda antara perusahaan, negara, tahun, dan sub-industri. Tugas integrasi ontologi ini membutuhkan pengetahuan domain, pengetahuan semantik yang dangkal, namun juga pengetahuan dan penalaran akal sehat yang sewenang-wenang. Kosa kata pharma bervariasi antar negara, industri (sub-), perusahaan, departemen, dan dekade. Misalnya, apa itu pak gel?
Apa itu "nama jalan" untuk hidroklorida ranitidin? Masing-masing n dikontrol kosakata adalah ontologi dengan sekitar 300k istilah. Periset Glaxo perlu mengeluarkan kueri dalam kosa kata mereka saat ini, memilikinya diterjemahkan ke dalam "makna sebenarnya" yang netral, dan kemudian mengubahnya menjadi berlawanan untuk menemukan kecocokan potensial terhadap dokumen yang masing-masing ditulis untuk mematuhi kosa kata tertentu. . Mereka telah menggunakan staf besar untuk melakukannya secara manual. Cyc digunakan sebagai interlingua universal yang mampu merepresentasikan penyatuan semua istilah "makna sebenarnya", dan mampu mewakili transformasi 300k antara masing-masing kosakata terkontrol dan Cyc, sehingga mengubah masalah n2 menjadi yang linier tanpa memperkenalkan semacam biasa "telepon game" redaman makna. Selanjutnya, membuat masingmasing pemetaan 300k untuk setiap tesaurus dilakukan secara otomatis, oleh Cyc.
Basis Pengetahuan Terorisme dengan Cyc System
Basis Pengetahuan Terorisme yang komprehensif adalah aplikasi Cyc dalam pengembangan yang pada akhirnya akan memuat semua pengetahuan yang relevan tentang kelompok "teroris", anggota, pemimpin, ideologi, pendiri, sponsor, afiliasi, fasilitas, lokasi, keuangan, kemampuan, niat, perilaku, taktik, dan deskripsi lengkap tentang kejadian teroris tertentu. Pengetahuan disimpan sebagai pernyataan dalam logika matematika, cocok untuk pemahaman dan penalaran komputer.
Ensiklopedi Cyc System
Cyclopedia sedang dikembangkan; itu superimposes kata kunci Cyc pada halaman yang diambil dari halaman Wikipedia.
Yayasan Klinik yang Menggunakan Cyc System
Klinik Cleveland telah menggunakan Cyc untuk mengembangkan antarmuka query bahasa alami dari informasi biomedis, yang mencakup beberapa dekade informasi tentang operasi kardiotoraks. Sebuah kueri diurai menjadi serangkaian fragmen CycL (logika tingkat tinggi) dengan variabel terbuka (misalnya, "pertanyaan ini adalah berbicara tentang seseorang yang mengembangkan infeksi endokarditis", "pertanyaan ini membahas tentang subset dari pasien Cleveland Clinic yang menjalani operasi di sana pada tahun 2009 ", dll.); Kemudian berbagai kendala diterapkan (pengetahuan domain medis, akal sehat, wacana pragmatik, sintaksis) untuk melihat bagaimana fragmen-fragmen tersebut bisa cocok menjadi satu permintaan formal semantik; Secara signifikan, dalam banyak kasus, hanya ada satu dan hanya satu cara untuk menggabungkan dan mengintegrasikan fragmen-fragmen tersebut.Mengintegrasikan fragmen melibatkan (i) menentukan variabel terbuka mana fragmen sebenarnya mewakili variabel yang sama, dan (ii) untuk semua variabel akhir, tentukan urutan dan cakupan kuantifikasi yang harus dimiliki variabel, dan tipe apa (universal atau eksistensial) . Query logical (CycL) tersebut kemudian diubah menjadi query SPARQL yang dilewatkan ke SemanticDB CCF yaitu danau datanya.
MathCraft (Aplikasi Cyc System)
Satu aplikasi Cyc bertujuan untuk membantu siswa mengerjakan matematika pada tingkat kelas 6, membantu mereka lebih dalam memahami materi pelajaran tersebut. Hal ini didasarkan pada pengalaman bahwa kita sering mengira kita mengerti sesuatu, tapi hanya benar-benar memahaminya setelah kita harus menjelaskan atau mengajarkannya kepada orang lain. Tidak seperti hampir semua perangkat lunak pendidikan lainnya, di mana komputer memainkan Peran guru, aplikasi Cyc ini, yang disebut MathCraft, memiliki Cyc berperan sebagai sesama siswa yang selalu sedikit lebih bingung dari Anda, pengguna, tentang subjek ini. Peran pengguna adalah mengamati avatar Cyc dan memberikannya saran, memperbaiki kesalahannya, mentor, membuatnya mengerti apa yang salah, dan lain-lain. Sebagai pengguna memberi saran yang baik, Cyc memungkinkan avatar untukmembuat lebih sedikit kesalahan pada tipe itu. , oleh karena itu, dari sudut pandang pengguna, sepertinya pengguna baru saja berhasil mengajarkannya sesuatu. Ini adalah variasi dari Learning by Teaching.
Kritik Masalah Cyc System
Proyek Cyc telah digambarkan sebagai "salah satu upaya paling kontroversial dari sejarah kecerdasan buatan". Catherine Havasi, CEO Luminoso, mengatakan bahwa Cyc adalah proyek pendahulu untuk IBM's Watson. Ilmuwan mesin belajar Pedro Domingos menyebut proyek ini sebagai "kegagalan bencana" karena beberapa alasan, termasuk jumlah data tak berujung yang dibutuhkan untuk menghasilkan hasil yang layak dan ketidakmampuan Cyc untuk berevolusi dengan sendirinya. Robin Hanson, seorang profesor ekonomi di George Mason University, memberikan analisis yang lebih adil dan seimbang: "Tentu saja proyek CYC terbuka terhadap kritik terhadap banyak pilihannya.Orang-orang mengeluh tentang representasi seperti logika dan bahasa, tentang pemilihan kasus prototipikal untuk dibangun dari (misalnya artikel ensiklopedia), tentang fokusnya pada menjawab alih-alih berakting, tentang seberapa sering ia membangun kembali vs mempertahankan sistem warisan, dan tentang menjadi pribadi vs. menerbitkan semuanya. Tetapi, setiap proyek besar seperti ini akan menghasilkan perselisihan semacam itu, dan tidak jelas salah satu pilihannya salah besar. Mereka harus memulai dari suatu tempat, dan menurut pendapat saya sekarang mereka telah mengumpulkan basis pengetahuan dengan ukuran, ruang lingkup, dan integrasi yang benar-benar spektakuler. bekerja dengan lebih baik, tapi jika mengetahui banyak hal sama sekuat yang dipikirkan Lenat, saya akan mengharapkan usaha AI yang serius untuk mengimpor pengetahuan CYC, menerjemahkannya ke dalam representasi baru. sumber ada di dekat ukuran, ruang lingkup, dan integrasi CYC. "
Sentimen serupa diungkapkan oleh Marvin Minsky: "Sayangnya, strategi yang paling populer di kalangan peneliti AI di tahun 1980an telah menemui jalan buntu," kata Minsky. Apa yang disebut "sistem pakar", yang meniru keahlian manusia dalam bidang subjek yang ketat seperti hukum dan kedokteran, dapat mencocokkan permintaan pengguna dengan diagnosis, makalah dan abstrak yang relevan, namun mereka tidak dapat mempelajari konsep yang kebanyakan anak tahu pada saat mereka 3 tahun. "Untuk setiap jenis masalah yang berbeda," kata Minsky, "pembangunan sistem pakar harus dimulai lagi, karena mereka tidak mengumpulkan pengetahuan akal sehat." Hanya satu peneliti yang telah berkomitmen pada tugas kolosal untuk membangun sebuah Sistem penalaran akal sehat yang komprehensif, menurut Minsky. Douglas Lenat, melalui proyek Cyc-nya, telah mengarahkan entri line-by-line lebih dari 1 juta peraturan ke dalam basis pengetahuan yang masuk akal. "
Gary Marcus, seorang profesor psikologi dan ilmu saraf di New York University dan salah satu pendiri perusahaan AI bernama Geometric Intelligence, mengatakan "ini merupakan pendekatan yang sangat berbeda dari semua hal dalam pembelajaran yang telah ada dalam berita." Hal ini sesuai dengan posisi Doug Lenat bahwa "Terkadang veneer of intelligence tidak cukup". Stephen Wolfram menulis "Pada masa-masa awal bidang kecerdasan buatan, ada banyak diskusi tentang" representasi pengetahuan ", dengan pendekatan yang didasarkan pada tata Bahasa bahasa alami, struktur logika predikat atau formalisme database. Sangat sedikit proyek berskala besar yang diupayakan (Doug Lenat's Cyc menjadi contoh yang sangat penting).
Setiap beberapa tahun sejak mulai menerbitkan, ada artikel Majalah Wired baru tentang Cyc, beberapa positif dan beberapa negatif (termasuk satu isu yang berisi satu dari masing-masing).
Baca Juga :
Apa Itu Arificial Cornea?
Apa itu teknologi Blockchain?
0 komentar:
Posting Komentar
Silahkan beri komentar dengan bijak dan sesuai dengan topik artikel.
Gunakan tombol balas dibawah komentar terkait jika ingin membalas komentar agar komunikasi lebih terstruktur.
Klik untuk melihat kode :) :( :s :D :-D ^:D ^o^ 7:( :Q :p T_T @-@ :-a :W *fck* :ngakak |o| :goodluck :smile