Alibaba Luncurkan Thinksound Model Ai Cipta Audio Realistik Untuk Video





<div class="entry-meta__details"> <span class="pipe">|</span> <p> <time class="entry-date published" datetime="2025-07-16T09:48:33+08:00" itemprop="datePublished">Diterbitkan pada 16 Julai 2025</time> </p> </div> <p class="first-drop-cap">Mencipta audio berkualiti tinggi untuk kandungan video menjadi satu cabaran teknikal dan kreatif yang besar, mempengaruhi bukan sahaja pemula tetapi juga profesional audio yang berpengalaman. Pengeluar sering berhadapan dengan isu pengurusan kebisingan, keseimbangan antara dialog dan kesan bunyi, memenuhi had bajet dan masa, serta mengekalkan konsistensi kreatif. Menterjemah visi artistik ke dalam produk akhir yang padu dan mencerminkan dinamik visual, persekitaran akustik, dan timing juga merupakan satu cabaran.</p> <p>Untuk mengatasi cabaran ini, <strong>Alibaba’s Tongyi Speech Lab telah memperkenalkan</strong> <a href="https://thinksound-project.github.io/">ThinkSound</a>, satu LLM multimodal sumber terbuka yang menggunakan pemikiran berantai (CoT) untuk penghasilan dan pengeditan audio yang lebih maju. ThinkSound menawarkan pendekatan interaktif dan berstruktur dalam pengeluaran audio, khusus untuk kandungan video. <strong>Model ini tersedia dalam tiga saiz kecil</strong> – 1.3B, 724M, dan 533M parameter – menyokong penghasilan audio dari video, pengeditan audio berasaskan teks, dan penciptaan audio interaktif, walaupun pada peranti tepi.</p> <figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"> <div class="wp-block-embed__wrapper"> <p><iframe src="https://www.youtube.com/watch?v=2Kr4z9o6sRk"></iframe></p> </div> </figure> <p>ThinkSound meniru aliran kerja bertahap manusia penggubah bunyi, memastikan audio yang dihasilkan tetap tepat dari segi konteks, padu, dan berkualiti tinggi sepanjang pengeluaran. Model ini mula menganalisis dinamik visual sesuatu video, secara logik mentafsir atribut akustik yang sepadan, dan kemudian mensintesis audio yang tepat pada konteksnya.</p> <p>Dengan pendekatan inovatif ini, ThinkSound membolehkan pengguna mencipta landskap bunyi yang terperinci dan koheren, memperhalusi audio yang dihasilkan melalui interaksi pengguna yang intuitif, dan mengedit segmen audio tertentu menggunakan arahan dalam bahasa semula jadi, secara berkesan menjembatani jurang antara niat kreatif dan pengeluaran audio terautomasi.</p> <p>Selain itu, pasukan penyelidikan Alibaba memperkenalkan <strong>AudioCoT</strong>, satu dataset multimodal berskala besar dengan anotasi CoT khusus audio, yang meningkatkan keselarasan antara kandungan visual, deskripsi teks, dan sintesis bunyi.</p> <p>Penilaian yang meluas telah menunjukkan bahawa ThinkSound mencapai <a href="https://arxiv.org/pdf/2506.21448">prestasi terbaik dalam penghasilan audio dari video</a>, dengan menghasilkan landskap bunyi yang tepat dan bermasa tepat. Model ini cemerlang dalam metrik kualiti audio tradisional dan penilaian berasaskan CoT. Di samping itu, pada MovieGen Audio Bench – satu penanda aras yang menilai keupayaan penghasilan audio dari video – ThinkSound jelas mengatasi model-model terkemuka yang lain.</p> <figure class="wp-block-image size-full"> <img fetchpriority="high" decoding="async" width="1200" height="620" alt="Thinksound 1" class="wp-image-65389" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_1.jpg"/> <img fetchpriority="high" decoding="async" width="1200" height="620" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_1.jpg" alt="Thinksound 1" class="wp-image-65389"/> <figcaption class="wp-element-caption"><em>Perbandingan model asas ThinkSound kami dengan penanda aras penghasilan audio dari video yang sedia ada pada set ujian VGGSound. ↓ menunjukkan lebih rendah adalah lebih baik, ↑ menunjukkan lebih tinggi adalah lebih baik.</em></figcaption> </figure> <p>ThinkSound dapat diintegrasikan secara lancar dengan pelbagai model penghasilan video untuk menyediakan suara latar dan soundtrack yang realistik bagi video yang disintesis. Keupayaan penghasilan audio yang canggih ini menawarkan potensi aplikasi yang signifikan dalam reka bentuk bunyi filem dan televisyen, pasca penghasilan audio, serta pengalaman bunyi imersif bagi permainan video dan realiti maya.</p> <p>ThinkSound kini tersedia sebagai sumber terbuka di <a href="https://huggingface.co/spaces/FunAudioLLM/ThinkSound" target="_blank" rel="noreferrer noopener">Hugging Face</a>, <a href="https://github.com/FunAudioLLM/ThinkSound" target="_blank" rel="noreferrer noopener">GitHub</a> dan <a href="https://www.modelscope.cn/studios/iic/ThinkSound" target="_blank" rel="noreferrer noopener">Model Studio Alibaba</a>.</p> <figure class="wp-block-image size-full"> <img decoding="async" width="1200" height="319" alt="Thinksound 2" class="wp-image-65390" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_2.jpg"/> <img decoding="async" width="1200" height="319" src="https://alizila.oss-us-west-1.aliyuncs.com/uploads/2025/07/ThinkSound_2.jpg" alt="Thinksound 2" class="wp-image-65390"/> <figcaption class="wp-element-caption"><em>Penilaian di luar pengedaran pada MovieGen Audio Bench.</em></figcaption> </figure> Ringkasan Artikel Artikel ini memperkenalkan ThinkSound, sebuah model audio yang inovatif daripada Alibaba yang membolehkan generasi dan pengeditan audio untuk kandungan video. ThinkSound memanfaatkan pemikiran berantai (CoT) untuk menciptakan audio yang berkualiti tinggi dan relevan dengan dinamik visual video. Dengan keupayaan untuk berfungsi pada perangkat kecil, model ini menawarkan pelbagai aplikasi dalam reka bentuk bunyi, termasuk dalam filem, televisyen, permainan, dan realiti maya. Model ini kini tersedia sebagai sumber terbuka bagi pengguna yang berminat.


Source link


Artikel ini hanyalah simpanan cache dari url asal penulis yang berkebarangkalian sudah terlalu lama atau sudah dibuang :

https://edisiviral.com/2025/07/16/alibaba-luncurkan-thinksound-model-ai-cipta-audio-realistik-untuk-video/

Kempen Promosi dan Iklan
Kami memerlukan jasa baik anda untuk menyokong kempen pengiklanan dalam website kami. Serba sedikit anda telah membantu kami untuk mengekalkan servis percuma aggregating ini kepada semua.

Anda juga boleh memberikan sumbangan anda kepada kami dengan menghubungi kami di sini
Video Of Exchange At Zebra Crossing Sparks Debate On Road Manners

Video Of Exchange At Zebra Crossing Sparks Debate On Road Manners

papar berkaitan - pada 9/7/2025 - jumlah : 177 hits
A video of a motorcyclist stopping at a zebra crossing in the city only to be honked at by another driver has drawn attention to road manners and the importance of respecting pedestrian crossings in the city NSTP file picKUALA LUMPUR A vide...
Aina Abdul Teruja Dapat Hadir Ke Konsert Siti Nurhaliza Video

Aina Abdul Teruja Dapat Hadir Ke Konsert Siti Nurhaliza Video

papar berkaitan - pada 9/7/2025 - jumlah : 135 hits
Aina Abdul Teruja Dapat Hadir Ke Konsert Siti Nurhaliza VIDEO Dengar Lagu Siti Sejak Kecil Aina Abdul menerusi hantaran di Instagram mengimbas kembali bahawa dia telah mendengar lagu lagu nyanyian Siti Nurhaliza sejak dia masih di sekolah r...
Disturbing Fake Ai Video Of Pahang Sultan Raises Concern On Identity Theft

Disturbing Fake Ai Video Of Pahang Sultan Raises Concern On Identity Theft

papar berkaitan - pada 9/7/2025 - jumlah : 139 hits
LOOKING at the way things are going artificial intelligence will do more than displaced humans and take their jobs AI has already demonstrated its ability to steal our identities This is best demonstrated by a recent video where AI generate...
Tebar Roti Canai Demi Anak Anak Tular Video Pasangan Mangsa Tragedi Sungai Korok

Tebar Roti Canai Demi Anak Anak Tular Video Pasangan Mangsa Tragedi Sungai Korok

papar berkaitan - pada 8/7/2025 - jumlah : 238 hits
Tular sejak semalam video pasangan suami isteri mempromosikan gerai roti canai mereka di TikTok kini bertukar menjadi berita duka Pasangan itu bukan sahaja mencuri perhatian rakyat Malaysia kerana keikhlasan berniaga tetapi juga kerana mere...
Cara Block Video Youtube Yang Mengarut Merosakkan Anak

Cara Block Video Youtube Yang Mengarut Merosakkan Anak

papar berkaitan - pada 7/7/2025 - jumlah : 133 hits
Block video YouTube yang tidak sesuai adalah langkah penting untuk melindungi anak anak daripada kandungan negatif dan tidak bermoral Walaupun YouTube menawarkan pelbagai video pembelajaran dan hiburan ia juga mengandungi kandungan yang tid...
Jebat Jayden Bongkar Rahsia Noor Nabila Dating Dengan Sharnaaz Ahmad Video

Jebat Jayden Bongkar Rahsia Noor Nabila Dating Dengan Sharnaaz Ahmad Video

papar berkaitan - pada 9/7/2025 - jumlah : 114 hits
Jebat Jayden Bongkar Rahsia Noor Nabila Dating Dengan Sharnaaz Ahmad VIDEO Siapa yang tidak kenal kakak kepada selebriti Malaysia Neelofa iaitu Noor Nabila Dia merupakan seorang usahawan dan ibu kepada seorang anak Noor Nabila bersama rakan...
Tuesday Lite Video Lakonan Ai Saja Kategori Hari Ini Saya Menang Esok Harga Taik Kucing Turun

Tuesday Lite Video Lakonan Ai Saja Kategori Hari Ini Saya Menang Esok Harga Taik Kucing Turun

papar berkaitan - pada 9/7/2025 - jumlah : 125 hits
The views expressed are those of the writer and do not necessarily reflect those of MMKtT By Syed Akbar Ali
Dame Un Grr Versi Fattah Amin Irfan Haris Buatkan Ramai Cair Melihatnya Video

Dame Un Grr Versi Fattah Amin Irfan Haris Buatkan Ramai Cair Melihatnya Video

papar berkaitan - pada 11/7/2025 - jumlah : 161 hits
Dame Un Grr Versi Fattah Amin Irfan Haris Buatkan Ramai Cair Melihatnya VIDEO Abdul Fattah Mohd Amin atau lebih dikenali sebagai Fattah Amin merupakan seorang pelakon penyanyi dan model Malaysia Beliau mula meraih kemasyhuran sebagai juara ...
Ramai Puji Kritikan Pedas Aina Abdul Video

Ramai Puji Kritikan Pedas Aina Abdul Video

papar berkaitan - pada 11/7/2025 - jumlah : 133 hits
Ramai Puji Kritikan Pedas Aina Abdul VIDEO Penyanyi yang dikenali ramai iaitu Aina Abdul merupakan nama yang tidak perlu diperkenalkan lagi kerana pasti satu Malaysia sudah mengenali beliau Kini namanya melonjak naik ke tahap yang lebih tin...
Ultimate Port Dickson Travel Guide 2025 Beaches Culture Hidden Gems In Negeri Sembilan

Azam Baki Should Identify Culprits In Beng Hock S Death Not Doling Out Funds For His Kid

Terbang Ke Perth Australia Dengan Air Asia Sempena Wedding Anniversary

Isu Blog Pening Dengan Masalah Failed To Follow Boleh Cuba Cara Ini

Hotel Comfort Inn Suite Goodearth Perth Australia

Sasar Sejuta Peserta Harian Metro 17 07 2025

Netizen Teruja Syed Saddiq Tempah Songkok Video

Netizen Terhibur Lihat Siti Nurhaliza Melatah Video


echo '';
Info Dan Sinopsis Drama Berepisod Dendam Seorang Madu Slot Tiara Astro Prima

10 Fakta Biodata Amira Othman Yang Digosip Dengan Fattah Amin Penyanyi Lagu Bila Nak Kahwin

5 Tips Macam Mana Nak Ajak Orang Kita Suka Dating Dengan Kita

Info Dan Sinopsis Drama Berepisod Keluarga Itu Slot Lestary TV3

Bolehkah Manusia Transgender Mencapai Klimaks Selepas Bertukar


Akhir Sebuah Penipuan Cinta Kisah Benar Seorang Love Scammer Yang Terbongkar

Keputusan Spm 2024 Depan Kaabah

Nasihat Imam Syafie

Kakitangan Kerajaan Dapat Cuti Kahwin 10 Hari Gaji Penuh

Sarapan Mi Sedaap Goreng Mudah Dan Cepat Siap

Bosswan Biarkan Aku Chord