Apa Itu Model Dunia Ai Dan Kenapa Ia Penting
Model dunia, atau dikenali sebagai simulator dunia, kini dipandang sebagai langkah besar seterusnya dalam dunia AI.
Salah seorang pelopor AI, Fei-Fei Li, melalui World Labs, baru-baru ini mengumpul $230 juta untuk membina “model dunia besar,” manakala DeepMind pula telah mengambil salah seorang pencipta generator video OpenAI, Sora, untuk bekerja pada “simulator dunia.” (Sora baru saja dilancarkan pada hari Isnin; ada yang menyatakan pandangan awal mengenainya.)
Tapi, apa sebenarnya model dunia ini?
Model dunia diilhamkan oleh cara kita manusia memahami dan mengetepikan dunia secara mental. Otak kita mengumpulkan data dari deria kita dan mengubahnya menjadi kefahaman yang lebih konkret tentang persekitaran sekeliling. Kita sudah menggelarkannya sebagai “model” jauh sebelum istilah ini digunakan dalam AI. Jangkaan yang kita buat berdasarkan model ini membentuk cara kita melihat dunia.
Dalam satu kertas kerja oleh penyelidik AI, David Ha dan Jürgen Schmidhuber, mereka memberi contoh tentang seorang pemukul baseball. Pemukul hanya mempunyai beberapa milisaat untuk memutuskan bagaimana untuk mengayunkan kayu pemukul mereka — lebih singkat daripada masa yang diperlukan untuk isyarat visual sampai ke otak. Menurut mereka, kehebatan pemukul profesional terletak pada kebolehan mereka untuk meramalkan dengan cepat ke mana bola akan pergi.
“Bagi pemain profesional, semua ini berlaku secara tidak sedar,” kata mereka. “Otot mereka secara refleks mengayunkan kayu pemukul pada masa dan tempat yang tepat berdasarkan ramalan model dalam fikiran mereka. Mereka mampu bertindak cepat berdasarkan jangkaan masa depan tanpa perlu memikirkan skenario-skenario yang mungkin.”
Sebab itu, aspek-aspek pemikiran tidak sedar dalam model dunia dianggap sebagai kriteria penting untuk mencapai kecerdasan setara manusia.
Memodelkan Dunia
Konsep ini bukanlah perkara baharu, tetapi popularitinya melonjak sejak kebelakangan ini, terutamanya dalam generasi video.
Hampir semua video yang dihasilkan oleh AI mencipta suasana yang aneh. Jika anda menontonnya cukup lama, anda pasti akan menyaksikan momen yang bizarre, seperti anggota badan yang keluar daripada bentuk!
Walaupun model generatif terlatih dengan bertahun-tahun video mungkin boleh meramalkan bahawa bola basket akan melantun, ia tidak benar-benar memahami sebab yang ada di sebalik itu — sama seperti model bahasa yang tidak benar-benar memahami konsep di balik kata dan frasa. Tetapi model dunia, yang sekurang-kurangnya memahami sebab di sebalik bola basket melantun, akan dapat menggambarkan lonjakan tersebut dengan lebih realistik.
Untuk mendapatkan pandangan ini, model dunia dilatih menggunakan pelbagai data seperti foto, audio, video, dan teks, dengan harapan dapat mengembangkan representasi dalam tentang bagaimana dunia berfungsi serta kemampuan untuk meramalkan akibat daripada tindakan yang dilakukan.
Contoh dari model generasi video Gen-3 milik syarikat AI, Runway.Gambar Kredit:Runway
“Penonton mengharapkan dunia yang mereka tonton bertindak dengan cara yang serupa dengan realiti mereka,” kata Alex Mashrabov, bekas ketua AI Snap dan kini CEO Higgsfield, syarikat yang sedang membina model generatif untuk video. “Jika bulu jatuh seberat besi atau bola bowling melambung tinggi ke udara, itu mengganggu dan menjejaskan penonton dari pengalaman itu. Dengan model dunia yang kukuh, bukannya pencipta yang mentakrifkan bagaimana setiap objek seharusnya bergerak — yang mengambil banyak masa — model itu akan memahami semua ini.”
Tetapi, penghasilan video yang lebih baik itu hanyalah permulaan untuk model dunia. Penyelidik seperti Yann LeCun dari Meta berpendapat bahawa model ini suatu hari nanti dapat digunakan untuk ramalan dan perancangan yang lebih canggih, sama ada di dunia digital mahupun fizikal.
Dalam satu ceramah awal tahun ini, LeCun menerangkan bagaimana model dunia dapat membantu mencapai matlamat tertentu melalui proses pemikiran. Sebagai contoh, jika kita mempunyai video sebuah bilik kotor (dunia) dan tujuan kita adalah untuk menjadikannya bersih, model dapat merancang langkah-langkah yang perlu diambil (gunakan penyedut hampagas, cuci pinggan, buang sampah) bukan kerana ia telah mengamati pola tersebut tetapi kerana ia memahami secara mendalam proses dari kotor ke bersih.
“Kita memerlukan mesin yang memahami dunia; [mesin] yang boleh mengingat perkara, memiliki intuisi, dan akal yang sehat — yang boleh berfikir dan merancang seperti manusia,” katanya. “Walaupun apa yang mungkin anda dengar dari beberapa orang yang amat bersemangat, sistem AI yang ada sekarang tidak mampu melakukan semua ini.”
Kompleksiti model dunia yang diimpikan oleh LeCun mungkin mengambil masa sekurang-kurangnya satu dekad untuk dicapai, tetapi model-model dunia yang ada kini menunjukkan kemajuan dalam simulasi fizik asas.
Sora memandu pemain dalam Minecraft — dan merender dunia. Gambar Kredit:OpenAI
OpenAI mencatat dalam satu blog bahawa Sora, yang dianggap sebagai model dunia, dapat mensimulasikan tindakan seperti seorang pelukis yang meninggalkan kesan kuas pada kanvas. Model-model seperti Sora juga dapat mensimulasikan permainan video dengan baik. Contohnya, Sora mampu merender antaramuka dan dunia permainan yang menyerupai Minecraft.
Di masa hadapan, model dunia mungkin boleh menghasilkan dunia 3D atas permintaan untuk permainan, fotografi maya, dan banyak lagi, kata co-founder World Labs, Justin Johnson dalam episod podcast a16z.
“Kita sudah mempunyai keupayaan untuk mencipta dunia interaktif maya, tetapi ia memerlukan belanja yang sangat besar dan banyak masa pembangunan,” kata Johnson. “[Model dunia] bukan sahaja akan memberikan gambar atau klip, tetapi satu dunia 3D yang sepenuhnya disimulasikan, berwarna, dan interaktif.”
Cabaran Tinggi
Walaupun konsep ini menarik, terdapat pelbagai cabaran teknikal yang perlu diatasi.
Latihan dan penggunaan model dunia memerlukan kuasa pengiraan yang besar, lebih daripada yang dibutuhkan oleh model generatif terkini. Walaupun beberapa model bahasa terbaru boleh dijalankan di telefon pintar, Sora (yang dianggap sebagai model dunia awal) memerlukan ribuan GPU untuk latihan dan penggunaan, terutamanya jika penggunaannya menjadi perkara biasa.
Model dunia, seperti semua model AI, juga berpotensi mengalami halusinasi — dan menyerap bias dari data latihan mereka. Sebuah model dunia yang dilatih berdasarkan video cuaca cerah di bandar-bandar Eropah mungkin sukar memahami atau menggambarkan bandar-bandar Korea dalam keadaan bersalji, misalnya, atau melakukannya dengan tidak betul.
Kekurangan data latihan yang mencukupi mengancam untuk memburukkan lagi masalah ini, kata Mashrabov.
“Kita telah melihat model terhad menghasilkan generasi orang dari jenis atau bangsa tertentu,” ujarnya. “Data latihan untuk model dunia mesti cukup luas untuk meliputi pelbagai senario tetapi juga sangat spesifik agar AI dapat memahami nuansa-nuansa senario tersebut dengan mendalam.”
Dalam satu pos terbaru, CE0 syarikat AI Runway, Cristóbal Valenzuela, menyatakan bahawa isu data dan kejuruteraan menghalang model-model hari ini daripada menangkap tingkah laku penduduk dunia (contohnya manusia dan haiwan) dengan tepat. “Model mesti dapat menghasilkan peta konsisten tentang persekitaran,” katanya. “Dan kemampuan untuk menavigasi serta berinteraksi dalam persekitaran tersebut.”
Sebuah video yang dihasilkan oleh Sora. Gambar Kredit:OpenAI
Sekiranya semua cabaran utama dapat diatasi, Mashrabov percaya bahawa model dunia boleh “naik taraf” penghubung antara AI dan dunia nyata — membuka jalan bukan hanya untuk penghasilan dunia maya tetapi juga untuk robotik dan pengambilan keputusan AI.
Model dunia juga mungkin menghasilkan robot yang lebih canggih.
Robot hari ini terhad dalam tindakan mereka kerana mereka tidak memiliki kesedaran tentang dunia di sekitar mereka (atau badan mereka sendiri). Model dunia boleh memberikan kesedaran itu kepada mereka, kata Mashrabov — sekurang-kurangnya sehingga tahap tertentu.
“Dengan model dunia yang canggih, AI boleh membangunkan pemahaman sendiri tentang apa juga situasi yang ia berada,” ujarnya, “dan mula memikirkan penyelesaian yang mungkin.”
TechCrunch mempunyai newsletter yang fokus pada AI! Daftar di sini untuk dapatkannya di kotak masuk anda setiap Rabu.
Source link
The post Apa itu ‘model dunia’ AI dan kenapa ia penting? appeared first on Edisi Viral Plus.
Artikel ini hanyalah simpanan cache dari url asal penulis yang berkebarangkalian sudah terlalu lama atau sudah dibuang :
https://plus.edisiviral.com/apa-itu-model-dunia-ai-dan-kenapa-ia-penting/