Deep Cogito Lancar Penyelesaian Ai Pemikiran Hibrid Dari Senyap
Syarikat baru, Deep Cogito, telah muncul dari bayangan dengan keluarga model AI yang boleh diakses secara terbuka dan boleh beralih antara mod “penalaran” dan bukan penalaran.
Model penalaran seperti o1 dari OpenAI sudah menunjukkan potensi besar dalam bidang matematik dan fizik. Mereka mampu mengesahkan fakta dengan menyelesaikan masalah secara langkah demi langkah. Namun, penalaran ini memerlukan lebih banyak pengiraan dan masa. Itu sebabnya, makmal seperti Anthropic sedang mengusahakan seni bina model “hibrid” yang menggabungkan komponen penalaran dengan elemen standard yang lebih pantas. Model-model hibrid ini boleh menjawab soalan mudah dengan cepat sambil meluangkan masa tambahan untuk soalan yang lebih mencabar.
Semua model Deep Cogito, yang dipanggil Cogito 1, adalah model hibrid. Mereka mendakwa bahawa model mereka mengatasi semua model terbuka lain yang seukuran, termasuk dari Meta dan DeepSeek, sebuah syarikat AI dari China.
“Setiap model boleh menjawab terus […] atau melakukan refleksi sendiri sebelum memberi jawapan (seperti model penalaran),” jelas syarikat itu di dalam satu pos blog. “[Semua] dibangunkan oleh sebuah pasukan kecil dalam kira-kira 75 hari.”
Model Cogito 1 berkisar antara 3 bilion hingga 70 bilion parameter. Mereka juga menyebutkan bahawa model-model sehingga 671 bilion parameter akan dilancarkan dalam beberapa minggu dan bulan akan datang. Lebih banyak parameter bermakna model tersebut lebih baik dalam menyelesaikan masalah.
Perlu diingat, Cogito 1 tidak dibangunkan dari awal. Deep Cogito membina model mereka berdasarkan model terbuka Llama dari Meta dan Qwen dari Alibaba. Mereka mengatakan telah menerapkan pendekatan latihan baru untuk meningkatkan prestasi model asas dan membolehkan penalaran yang boleh dihidupkan dan dimatikan.
Menurut penilaian dalaman mereka, model terbesar Cogito 1, Cogito 70B, dengan penalaran, mengatasi model penalaran R1 dari DeepSeek dalam beberapa ujian matematik dan bahasa. Bahkan, Cogito 70B tanpa penalaran juga lebih baik daripada model Llama 4 Scout yang baru dikeluarkan oleh Meta dalam ujian umum, LiveBench.
Setiap model Cogito 1 boleh dimuat turun atau digunakan melalui API di penyedia awan Fireworks AI dan Together AI.
Prestasi Cogito 1 berbanding model AI terbuka lain yang popularGambar Kredit:Deep Cogito
“Sekarang, kami masih dalam peringkat awal dari kurva skala kami, hanya menggunakan sebahagian kecil pengiraan yang biasanya digunakan untuk latihan lanjutan model bahasa besar,” tulis Cogito dalam pos blog mereka. “Ke depan, kami sedang mencari pendekatan lanjutan untuk meningkatkan diri.”
Berdasarkan dokumen yang difailkan di California, Deep Cogito ditubuhkan pada Jun 2024 di San Francisco. Halaman LinkedIn syarikat menyenaraikan dua pengasas, Drishan Arora dan Dhruv Malhotra. Malhotra pernah menjadi pengurus produk di laboratorium AI Google, DeepMind, di mana dia bekerja pada teknologi carian generatif. Arora pula adalah jurutera perisian kanan di Google.
Dengan sokongan daripada South Park Commons, menurut PitchBook, Deep Cogito berhasrat membina “superintelligent umum.” Pengasas syarikat ini memahami frasa tersebut sebagai AI yang dapat melaksanakan tugas lebih baik daripada kebanyakan manusia dan “menggali keupayaan baharu yang belum kita bayangkan.”
Source link
The post Deep Cogito lancar penyelesaian AI ‘pemikiran’ hibrid dari senyap. appeared first on Edisi Viral Plus.
Artikel ini hanyalah simpanan cache dari url asal penulis yang berkebarangkalian sudah terlalu lama atau sudah dibuang :
https://plus.edisiviral.com/deep-cogito-lancar-penyelesaian-ai-pemikiran-hibrid-dari-senyap/