Alibaba Luncurkan Thinksound Model Ai Cipta Audio Realistik Untuk Video

<div class="entry-meta__details"> | <time class="entry-date published" datetime="2025-07-16T09:48:33+08:00" itemprop="datePublished">Diterbitkan pada 16 Julai 2025</time> </div> Mencipta audio berkualiti tinggi untuk kandungan video menjadi satu cabaran teknikal dan kreatif yang besar, mempengaruhi bukan sahaja pemula tetapi juga profesional audio yang berpengalaman. Pengeluar sering berhadapan dengan isu pengurusan kebisingan, keseimbangan antara dialog dan kesan bunyi, memenuhi had bajet dan masa, serta mengekalkan konsistensi kreatif. Menterjemah visi artistik ke dalam produk akhir yang padu dan mencerminkan dinamik visual, persekitaran akustik, dan timing juga merupakan satu cabaran. Untuk mengatasi cabaran ini, Alibaba’s Tongyi Speech Lab telah memperkenalkan <a href="https://thinksound-project.github.io/">ThinkSound</a>, satu LLM multimodal sumber terbuka yang menggunakan pemikiran berantai (CoT) untuk penghasilan dan pengeditan audio yang lebih maju. ThinkSound menawarkan pendekatan interaktif dan berstruktur dalam pengeluaran audio, khusus untuk kandungan video. Model ini tersedia dalam tiga saiz kecil – 1.3B, 724M, dan 533M parameter – menyokong penghasilan audio dari video, pengeditan audio berasaskan teks, dan penciptaan audio interaktif, walaupun pada peranti tepi. <figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"> <div class="wp-block-embed__wrapper"> <iframe src="https://www.youtube.com/watch?v=2Kr4z9o6sRk"></iframe> </div> </figure> ThinkSound meniru aliran kerja bertahap manusia penggubah bunyi, memastikan audio yang dihasilkan tetap tepat dari segi konteks, padu, dan berkualiti tinggi sepanjang pengeluaran. Model ini mula menganalisis dinamik visual sesuatu video, secara logik mentafsir atribut akustik yang sepadan, dan kemudian mensintesis audio yang tepat pada konteksnya. Dengan pendekatan inovatif ini, ThinkSound membolehkan pengguna mencipta landskap bunyi yang terperinci dan koheren, memperhalusi audio yang dihasilkan melalui interaksi pengguna yang intuitif, dan mengedit segmen audio tertentu menggunakan arahan dalam bahasa semula jadi, secara berkesan menjembatani jurang antara niat kreatif dan pengeluaran audio terautomasi. Selain itu, pasukan penyelidikan Alibaba memperkenalkan AudioCoT, satu dataset multimodal berskala besar dengan anotasi CoT khusus audio, yang meningkatkan keselarasan antara kandungan visual, deskripsi teks, dan sintesis bunyi. Penilaian yang meluas telah menunjukkan bahawa ThinkSound mencapai <a href="https://arxiv.org/pdf/2506.21448">prestasi terbaik dalam penghasilan audio dari video</a>, dengan menghasilkan landskap bunyi yang tepat dan bermasa tepat. Model ini cemerlang dalam metrik kualiti audio tradisional dan penilaian berasaskan CoT. Di samping itu, pada MovieGen Audio Bench – satu penanda aras yang menilai keupayaan penghasilan audio dari video – ThinkSound jelas mengatasi model-model terkemuka yang lain. <figure class="wp-block-image size-full"> <img fetchpriority="high" decoding="async" width="1200" height="620" alt="Thinksound 1" class="wp-image-65389" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_1.jpg"/> <img fetchpriority="high" decoding="async" width="1200" height="620" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_1.jpg" alt="Thinksound 1" class="wp-image-65389"/> <figcaption class="wp-element-caption">Perbandingan model asas ThinkSound kami dengan penanda aras penghasilan audio dari video yang sedia ada pada set ujian VGGSound. ↓ menunjukkan lebih rendah adalah lebih baik, ↑ menunjukkan lebih tinggi adalah lebih baik.</figcaption> </figure> ThinkSound dapat diintegrasikan secara lancar dengan pelbagai model penghasilan video untuk menyediakan suara latar dan soundtrack yang realistik bagi video yang disintesis. Keupayaan penghasilan audio yang canggih ini menawarkan potensi aplikasi yang signifikan dalam reka bentuk bunyi filem dan televisyen, pasca penghasilan audio, serta pengalaman bunyi imersif bagi permainan video dan realiti maya. ThinkSound kini tersedia sebagai sumber terbuka di <a href="https://huggingface.co/spaces/FunAudioLLM/ThinkSound" target="_blank" rel="noreferrer noopener">Hugging Face</a>, <a href="https://github.com/FunAudioLLM/ThinkSound" target="_blank" rel="noreferrer noopener">GitHub</a> dan <a href="https://www.modelscope.cn/studios/iic/ThinkSound" target="_blank" rel="noreferrer noopener">Model Studio Alibaba</a>. <figure class="wp-block-image size-full"> <img decoding="async" width="1200" height="319" alt="Thinksound 2" class="wp-image-65390" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_2.jpg"/> <img decoding="async" width="1200" height="319" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_2.jpg" alt="Thinksound 2" class="wp-image-65390"/> <figcaption class="wp-element-caption">Penilaian di luar pengedaran pada MovieGen Audio Bench.</figcaption> </figure> Ringkasan Artikel Artikel ini memperkenalkan ThinkSound, sebuah model audio yang inovatif daripada Alibaba yang membolehkan generasi dan pengeditan audio untuk kandungan video. ThinkSound memanfaatkan pemikiran berantai (CoT) untuk menciptakan audio yang berkualiti tinggi dan relevan dengan dinamik visual video. Dengan keupayaan untuk berfungsi pada perangkat kecil, model ini menawarkan pelbagai aplikasi dalam reka bentuk bunyi, termasuk dalam filem, televisyen, permainan, dan realiti maya. Model ini kini tersedia sebagai sumber terbuka bagi pengguna yang berminat.

Source link

Artikel ini hanyalah simpanan cache dari url asal penulis yang berkebarangkalian sudah terlalu lama atau sudah dibuang :

https://edisiviral.com/2025/07/16/alibaba-luncurkan-thinksound-model-ai-cipta-audio-realistik-untuk-video/

Kempen Promosi dan Iklan
Kami memerlukan jasa baik anda untuk menyokong kempen pengiklanan dalam website kami. Serba sedikit anda telah membantu kami untuk mengekalkan servis percuma aggregating ini kepada semua.

Anda juga boleh memberikan sumbangan anda kepada kami dengan menghubungi kami di sini

Bukan Sebab Saya Biasa Amp Bangga Nauzubillah Syasya Rizal Kongsi Video Termakan Daging B Bi Sebagai Pengajaran

papar berkaitan - pada 11/7/2025 - jumlah : 380 hits
Bekas ahli kumpulan Dolla iaitu Syasya Rizal menegaskan tujuan dia berkongsi termakan daging khinzir ketika bercuti di China baru baru ini adalah bertujuan sebagai peringatan untuk diri sendiri Kongsi video termakan daging khinzir sebagai p...

Dame Un Grr Versi Fattah Amin Irfan Haris Buatkan Ramai Cair Melihatnya Video

papar berkaitan - pada 11/7/2025 - jumlah : 319 hits
Dame Un Grr Versi Fattah Amin Irfan Haris Buatkan Ramai Cair Melihatnya VIDEO Abdul Fattah Mohd Amin atau lebih dikenali sebagai Fattah Amin merupakan seorang pelakon penyanyi dan model Malaysia Beliau mula meraih kemasyhuran sebagai juara ...

Ramai Puji Kritikan Pedas Aina Abdul Video

papar berkaitan - pada 11/7/2025 - jumlah : 425 hits
Ramai Puji Kritikan Pedas Aina Abdul VIDEO Penyanyi yang dikenali ramai iaitu Aina Abdul merupakan nama yang tidak perlu diperkenalkan lagi kerana pasti satu Malaysia sudah mengenali beliau Kini namanya melonjak naik ke tahap yang lebih tin...

Firdaus Wong S Secret Child Conversion Video Unconstitutional Court Rules

papar berkaitan - pada 10/7/2025 - jumlah : 364 hits
The High Court orders the preacher to permanently remove the video and prohibits him from publishing similar videos or statements Lawyer M Visvanathan explaining the outcome of the proceedings to three of the eight parents outside the High ...

Badannya Begitu Sebab Minum Susu Bapa Abang Aji Jelas Isu Video Makan Hanya Konten

papar berkaitan - pada 10/7/2025 - jumlah : 460 hits
Di media sosial siapa yang tak kenal dengan si comel Abang Aji pempengaruh cilik yang sering menghiburkan warganet dengan telatahnya yang bersahaja Namun baru baru ini timbul pula isu yang membuatkan ramai tertanya tanya Adakah si kecil ini...

Aina Abdul Teruja Dapat Hadir Ke Konsert Siti Nurhaliza Video

papar berkaitan - pada 9/7/2025 - jumlah : 504 hits
Aina Abdul Teruja Dapat Hadir Ke Konsert Siti Nurhaliza VIDEO Dengar Lagu Siti Sejak Kecil Aina Abdul menerusi hantaran di Instagram mengimbas kembali bahawa dia telah mendengar lagu lagu nyanyian Siti Nurhaliza sejak dia masih di sekolah r...

Jebat Jayden Bongkar Rahsia Noor Nabila Dating Dengan Sharnaaz Ahmad Video

papar berkaitan - pada 9/7/2025 - jumlah : 186 hits
Jebat Jayden Bongkar Rahsia Noor Nabila Dating Dengan Sharnaaz Ahmad VIDEO Siapa yang tidak kenal kakak kepada selebriti Malaysia Neelofa iaitu Noor Nabila Dia merupakan seorang usahawan dan ibu kepada seorang anak Noor Nabila bersama rakan...

Tuesday Lite Video Lakonan Ai Saja Kategori Hari Ini Saya Menang Esok Harga Taik Kucing Turun

papar berkaitan - pada 9/7/2025 - jumlah : 257 hits
The views expressed are those of the writer and do not necessarily reflect those of MMKtT By Syed Akbar Ali

Kini Anda Boleh Tukar Gambar Kepada Video Dengan Gemini

papar berkaitan - pada 12/7/2025 - jumlah : 1071 hits
Google telah mengumumkan peluasan akses kepada model penjanaan video termaju mereka Veo 3 kepada pengguna Google AI Pro di lebih 150 negara Sebagai tambahan satu ciri baharu kini diperkenalkan dalam Gemini iaitu Photo to Video yang memboleh...