Prosa ai hadirkan inovasi pada text to speech
JAKARTA – Prosa.ai menghadirkan inovasi text to speech bahasa Indonesia dan Inggris. Content creator bisa memanfaatkan hal ini lantaran text to speech Prosa.ai hadir dengan 40 suara beragam.
Prosa.ai adalah perusahaan yang berfokus dalam pengembangan produk berbasis Artificial Intelligence (AI) dan Natural Language Processing (NLP) seperti speech-to-text, transkripsi rapat, biometrik suara, anti-hoaks, dan regulatory technology. Text to speech (TTS) berbasis cloud ini dapat memenuhi kebutuhan dalam mengubah teks menjadi suara.
TTS Prosa.ai saat ini menawarkan peningkatan signifikan dibandingkan versi tahun 2021 yang hanya terdapat tiga suara, yaitu satu laki-laki dan dua perempuan. Pada versi lawas itu juga hanya mendukung TTS Bahasa Indonesia.
Pada tahun 2024, Prosa.ai menyediakan 10 suara baru, termasuk suara Bahasa Inggris, serta fitur “jeda” dan “custom voice”. Fitur ini memungkinkan pengguna menciptakan hingga 40 variasi suara yang berbeda dalam waktu yang singkat dan hasilnya dapat diunduh dalam berbagai format audio yang mendukung berbagai platform, seperti video YouTube, TikTok, dan media sosial lainnya.
Co-Founder & CEO Prosa.ai, Teguh Eko Budiarto mengungkapkan, hal yang menjadi pembeda dibandingkan produk sebelumnya.
“Prosa.ai juga meningkatkan inovasinya dengan menghadirkan karakter suara-suara lainnya seperti, suara Dimas (laki-laki) dengan gaya bicara formal, Dimas dengan gaya bicara ekspresif, dan Ocha (perempuan) dengan gaya bicara ramah. Penggunaan model suara Dimas & Ocha ini lebih cocok pada pembacaan berita (news narrator) dan voice-over. Teknologi Text-to-Speech memang bukanlah hal yang baru,” katanya dalam keterangannya, Jumat (5/4/2024).
Ia melanjutkan, meskipun begitu, Prosa TTS memiliki keunggulan lainnya dibanding produk Text to Speech lainnya, seperti model-model suara yang dihasilkan oleh Prosa TTS itu unik, tidak bisa ditemukan di produk Text to Speech lainnya. Selain itu, kamus tata bahasa Prosa TTS juga selalu diperbarui sehingga dapat meminimalkan kesalahan pengucapan.
Prosa Text to Speech (TTS) dilengkapi berbagai macam fitur yang memudahkan pengguna, yaitu Speech Synthesizer (penyintesis ucapan) yang membantu memudahkan pengubahan teks tertulis menjadi sebuah ucapan. Human-sounding Voices merupakan teknologi yang memungkinkan pengguna dapat memilih karakter suara dan gaya bicara manusia yang natural.
Voice tuning adalah fitur yang dapat menyesuaikan tinggi rendahnya nada serta mengatur kecepatan berbicara. Terakhir, Flexible Audio File yaitu fitur yang dapat menghasilkan audio dalam berbagai format (WAV, MP3 dan OPUS) sehingga pengguna dapat memutar, menyimpan atau mengunding audio tersebut.
“Kami yakin ruang untuk perkembangan teknologi TTS ini masih sangat besar terutama untuk peningkatan kualitas suara yang semakin natural dan kebutuhannya pun terus meningkat ditandai dengan jumlah volume pencarian teknologi TTS di hasil pencarian google (SERP) yang kami amati melalui tools web traffic analysis,” kata Teguh.
“Fitur lain yang ingin dikembangkan yaitu fitur emosi dalam suara (sedih, marah, takut dll) serta kami ingin mengembangkan marketplace bagi Voice Talent yang ingin menjadi bagian dari suara Prosa TTS dan mendapatkan hasil keuntungan dari marketplace ini. Sehingga dapat meningkatkan jumlah pengguna baru sebesar 2x lipat (YoY) dan jumlah transaksi sebesar 1,5x lipat (YoY) dari tahun sebelumnya,” tuturnya.
(erh)