Apple Luncurkan Depth Pro Model Ai Yang Ubah Peraturan Visi 3d
Jangan ketinggalan! Sertai surat berita harian dan mingguan kami untuk kemas kini terkini dan kandungan eksklusif tentang AI terkemuka dalam industri. Ketahui lebih lanjut.
Pasukan penyelidik AI Apple telah mencipta model baru yang berpotensi untuk mengubah cara mesin memahami kedalaman, yang mungkin memberi impak besar kepada pelbagai industri seperti realiti terimbuh dan kenderaan autonomi.
Model ini, yang dikenali sebagai Depth Pro, mampu menghasilkan peta kedalaman 3D yang terperinci dari gambar 2D dalam sekelip mata—tanpa memerlukan data kamera yang biasanya diperlukan untuk ramalan tersebut.
Dalam kertas penyelidikan berjudul “Depth Pro: Kedalaman Metik Monokular dalam Masa Kurang dari Sehari,” teknologi ini menunjukkan kemajuan besar dalam penilaian kedalaman monokular, yang menggunakan satu gambar sahaja untuk mengira kedalaman.
Aplikasi ini sangat berguna di sektor di mana kesedaran spatial masa nyata sangat penting. Pencipta model ini, yang diketuai oleh Aleksei Bochkovskii dan Vladlen Koltun, menganggap Depth Pro sebagai satu sistem yang paling pantas dan tepat dalam kategorinya.
Perbandingan peta kedalaman daripada Depth Pro, Marigold, Depth Anything v2, dan Metric3D v2. Depth Pro menunjukkan kemampuan luar biasa dalam menangkap butiran halus seperti bulu dan wayar sangkar burung, menghasilkan peta kedalaman berkualiti tinggi dalam hanya 0.3 saat, mengatasi model lain dari segi ketepatan dan butiran. (kredit: arxiv.org)
Menilai kedalaman monokular adalah satu cabaran yang sukar, biasanya memerlukan beberapa gambar atau metadata seperti panjang fokus untuk mengukur kedalaman dengan betul.
Namun, Depth Pro mengatasi semua itu, menghasilkan peta kedalaman resolusi tinggi dalam masa hanya 0.3 saat menggunakan GPU standard. Model ini menghasilkan peta 2.25 megapiksel dengan ketajaman yang luar biasa, menangkap bahkan butiran kecil seperti rambut dan tumbuh-tumbuhan yang sering terlepas oleh kaedah lain.
“Ciri-ciri ini dicapai melalui beberapa sumbangan teknikal, termasuk transformer penglihatan pelbagai skala yang efisien untuk ramalan padat,” jelas para penyelidik dalam kertas mereka. Dengan senibina ini, model dapat memproses konteks keseluruhan gambar serta butiran halus pada masa yang sama—satu langkah besar daripada model yang lebih lambat dan kurang tepat sebelum ini.
Perbandingan peta kedalaman antara Depth Pro, Depth Anything v2, Marigold, dan Metric3D v2. Depth Pro unggul dalam menangkap butiran halus seperti bulu rusa, bilah kincir angin, dan jalur zebra, menghasilkan peta kedalaman berkualiti tinggi dalam 0.3 saat. (kredit: arxiv.org)
Kedalaman metrik, pembelajaran zero-shot
Apa yang menjadikan Depth Pro istimewa adalah keupayaannya untuk menganggarkan kedalaman relatif dan mutlak, yang dikenali sebagai “kedalaman metrik.”
Ini membolehkan model memberikan ukuran dunia sebenar, yang penting untuk aplikasi seperti realiti terimbuh (AR), di mana objek maya perlu diletakkan di lokasi yang tepat dalam ruang fizikal.
Lagipula, Depth Pro tidak memerlukan latihan yang meluas pada dataset khusus domain untuk membuat ramalan yang tepat — satu ciri dikenali sebagai “pembelajaran zero-shot.” Ini menjadikan model ini sangat serba boleh dan dapat digunakan pada pelbagai jenis gambar, tanpa memerlukan data khusus kamera yang biasanya diperlukan dalam model penilaian kedalaman.
“Depth Pro menghasilkan peta kedalaman metrik dengan skala mutlak pada gambar acak ‘di dunia nyata’ tanpa memerlukan metadata seperti intrisik kamera,” jelas penulis. Keanjalan ini membuka pelbagai kemungkinan, dari meningkatkan pengalaman AR hingga meningkatkan kemampuan kenderaan autonomi untuk mengesan dan mengemudi menghindari halangan.
Bagi mereka yang ingin mencuba Depth Pro, demo langsung tersedia di platform Hugging Face.
Perbandingan model penilaian kedalaman merentasi pelbagai dataset. Depth Pro dari Apple menduduki tempat teratas dengan purata rangking 2.5, mengatasi model seperti Depth Anything v2 dan Metric3D dalam ketepatan di pelbagai senario. (kredit: arxiv.org)
Aplikasi dunia nyata: Dari e-dagang hingga kenderaan autonomi
Keanjalan ini mempunyai implikasi besar untuk pelbagai industri. Dalam e-dagang, misalnya, Depth Pro membolehkan pengguna melihat bagaimana perabot sesuai di rumah mereka hanya dengan menghalakan kamera telefon ke bilik. Dalam industri automobil, kemampuan untuk menghasilkan peta kedalaman berkualiti tinggi dalam masa nyata dari satu kamera boleh meningkatkan bagaimana kereta sendiri memahami persekitaran mereka, meningkatkan navigasi dan keselamatan.
“Kaedah ini seharusnya menghasilkan peta kedalaman metrik dalam rejim zero-shot ini untuk secara akurat memperbaharui bentuk objek, susun atur adegan, dan skala mutlak,” tulis para penyelidik, menekankan potensi model ini untuk mengurangkan masa dan kos yang berkaitan dengan latihan model AI yang lebih konvensional.
Mengatasi cabaran penilaian kedalaman
Salah satu cabaran terbesar dalam penilaian kedalaman adalah menguruskan apa yang dikenali sebagai “piksel melayang”—piksel yang muncul seolah-olah terapung di udara kerana kesalahan dalam pemetaan kedalaman. Depth Pro menangani isu ini dengan serius, menjadikannya khususnya berkesan untuk aplikasi seperti penggambaran 3D dan persekitaran maya, di mana ketepatan adalah sangat penting.
Selain itu, Depth Pro cemerlang dalam menelusuri sempadan, mengatasi model sebelumnya dalam dengan ketara membezakan objek dan tepi mereka. Para penyelidik mendakwa ia mengatasi sistem lain “dengan faktor multiplikatif dalam ketepatan sempadan,” yang penting bagi aplikasi yang memerlukan segmentasi objek yang tepat, seperti pemadatan imej dan pengimejan perubatan.
Sumber terbuka dan bersedia untuk skala
Dalam langkah yang boleh mempercepatkan penggunaan, Apple telah menjadikan Depth Pro sebagai sumber terbuka. Kod, bersama dengan berat model pra-latih, kini boleh didapati di GitHub, membolehkan pemaju dan penyelidik untuk bereksperimen dan memperhalusi teknologi ini. Repositori tersebut merangkumi segala-galanya dari senibina model hingga titik pemeriksaan pralatih, menjadikannya mudah bagi orang lain untuk membina di atas kerja Apple.
Pasukan penyelidik juga menggalakkan penyelidikan lanjut tentang potensi Depth Pro dalam bidang seperti robotik, pembuatan, dan penjagaan kesihatan. “Kami melepaskan kod dan berat ini,” tulis penulis, menandakan ini sebagai permulaan bagi model ini.
Apa seterusnya untuk persepsi kedalaman AI
Ketika kecerdasan buatan terus memecahkan batasan kemungkinan, Depth Pro menciptakan piawaian baru dalam kelajuan dan ketepatan untuk penilaian kedalaman monokular. Kemampuannya untuk menghasilkan peta kedalaman berkualiti tinggi dalam masa nyata dari satu gambar mempunyai potensi untuk memberi kesan besar terhadap pelbagai industri yang bergantung pada kesedaran spatial.
Dalam dunia di mana AI semakin penting dalam pengambilan keputusan dan pengembangan produk, Depth Pro menunjukkan bagaimana penyelidikan canggih boleh diterjemahkan kepada penyelesaian praktikal di dunia nyata. Sama ada meningkatkan cara mesin memahami persekitaran mereka atau meningkatkan pengalaman pengguna, potensi penggunaan Depth Pro amat luas.
Seperti yang dinyatakan oleh para penyelidik, “Depth Pro secara dramatik mengatasi semua karya sebelumnya dalam ketajaman pemisahan batas objek, termasuk struktur halus seperti rambut, bulu, dan tumbuh-tumbuhan.” Dengan pelancaran sumber terbuka ini, Depth Pro mungkin tidak lama lagi menjadi elemen penting dalam pelbagai industri dari pemanduan autonomi hingga realiti terimbuh—mengubah cara mesin dan manusia berinteraksi dengan persekitaran 3D.
Source link
The post Apple Luncurkan Depth Pro, Model AI yang Ubah Peraturan Visi 3D! appeared first on Edisi Viral Plus.
Artikel ini hanyalah simpanan cache dari url asal penulis yang berkebarangkalian sudah terlalu lama atau sudah dibuang :
https://plus.edisiviral.com/apple-luncurkan-depth-pro-model-ai-yang-ubah-peraturan-visi-3d/