Kamis, 02 Mei 2013

Tugas Bahasa Indonesia 2 (1) Edisi


Prosody Model Analysis of Bahasa Indonesia Speech Synthesizer
Using Speech Filing System





      1 Pendahuluan


  Aplikasi speech synthesis, dan speech recognition merupakan aplikasi yang digunakan untuk membentuk teks menjadi suara atau sebaliknya. Aplikasi  ini sekarang sedang berkembang karena dapat membantu mempermudah berkomunikasi, khususnya untuk kalangan tunanetra. Speech synthesis atau lebih di kenal dengan text to speech sudah tersedia dalam berbagai bahasa. Aplikasi pesintesa suara dalam Bahasa Indonesia telah tersedia, dimana aplikasi ini sering dikenal dengan nama TTS Indo yang dikembangkan oleh Arry Akhmad Arman [2]. TTS Indo menggunakan teknik diphone concatenative yaitu suatu teknik dimana segmen-segmen suara dalam bentuk diphone sudah direkam sebelumnya berdasarkan pada kaidah-kaidah yang berlaku dalam suatu bahasa [3]. Suatu teks akan disintesa menjadi suara berdasarkan pada gabungan dari diphone-diphone penyusun pada teks tersebut. Untuk memperoleh hasil suara yang alami, maka perlu diseleksi (dipilih) diphone mana yang tepat untuk digabungkan. Keluaran suara TTS Indo yang ada saat ini sudah cukup baik, namun untuk kalimat-kalimat tertentu seperti dalam bentuk kalimat pertanyaan atau kalimat perintah keluaran suaranya masih belum menunjukkan intonasi dari kalimat tersebut. Dalam linguistik, prosodi (dari bahasa Yunani, prosoida) adalah ritme, tekanan, dan intonasi yang terhubung (lebih kecil dibandingkan dengan elemen seperti syllables atau kata) ketika bicara [11]. Prosodi mungkin mencerminkan berbagai jenis pembicara atau ucapan atau emosional, dimana ucapan adalah pernyataan, atau perintah yang menunjukkan penekanan, kontras, dan fokus apakah pembicara sedang sedih atau marah; atau unsur-unsur
bahasa lain yang mungkin tidak dapat diartikan oleh tata bahasa atau kosa kata pilihan. Prosodi dalam bahasa indonesia sering dikenal dengan intonasi. Intonasi adalah alunan nada dalam melafazkan kata-kata atau kalimat. Intonasi dapat berupa lagu kalimat atau ketepatan penyajian tinggi rendahnya nada kalimat [7]. Rumusan masalah yang diangkat dari penelitian ini adalah bagaimana cara menganalisis intonasi kalimat
kalimat tersebut. Batasan masalah dalam analisis ini adalah menganalisa jenis kalimat bahasa indonesia
berdasarkan intonasi, untuk kalimat tanya yang menggunakan kata tanya (Siapa, Dimana, Kapan, Kenapa, Apa, Bagaimana), dan untuk setiap kalimat dibatasi 6 suku kata.Dan perangkat lunak yang digunakan untuk
penelian ini adalah Speech Filing System (SFS)[10].

   2 Metode Penelitian

   2.1 Perekaman Suara

Perekaman suara dilakukan untuk mendapatkan datavyang akan diperoses untuk dianalisis.
akan dimulai dengan pembuatan kalimat tanya, kemudian mempersiapkan perangkat rekaman untuk
merekam kalimat tersebut. Setelah mendapatan data rekaman, data di edit dan akhirnya data dianalisis.
Sebelum melakukan perekaman penulis harus menyediakan kalimat yang akan direkam. Kalimat yang akan
direkam merupakan kalimat tanya dengan menggunakan kata tanya yaitu Siapa, Dimana, Kapan, Mengapa,
Apa, Bagaimana. Dimana setiap kalimat terdiri dari 6 kata. Kalimat yang disediakan berjumlah
6 kata tanya yang terdiri dari 10 kalimat untuk setiap kata tanya. Dalam proses perekaman setiap kalimat
akan diulang sebanyak 20 kali, sehingga jumlah semua data rekaman adalah 1200 rekaman. Dan perekaman
ini dilakukan oleh seorang wanita yang berusia 26 tahun.Dan hasil perekaman terlihat pada gambar
2, yang menunjukkan bentuk pitch dengan durasi 2,4 detik.


   2.2 Analisis Data
Proses analisis data terdiri atas Analisis data berdasarkan waktu dan frekuensi, Perhitungan Delta,
Analisis delta, dan menghasilkan bentuk prosodi yang diinginkan. Proses tersebut dapat dilihat pada gambar
3 berikut ini. Untuk mendapatkan bentuk prosodi berdasarkan kata tanya , tahap analisis data dibagi
menjadi 2 tahap yaitu pertama berdasarkan kalimat dan selanjutnya berdasarkan kata.



  • Analisis data berdasarkan jarak dan waktu.
  • Perhitungan delta
  • Analisis delta
  • Bentuk Prosodi
Di atas merupakan peroses data.

    2.3 Menentukan titik sampel berdasarkan frekuensi(f)
Dalam proses penentuan titik sampel berdasarkan frekuensi, pertama akan dilakaukan analisisis untuk
setiap kata tanya dimana untuk setiap kata tanya berjumlah 200 data. Dari 200 data tersebut nilai
frekuensi yang paling sering muncul akan diambil sebagai sampel frekuensi untuk kata tanya tersebut.

  2.4 Menentukan titik sampel berdasarkan waktu (t)
Setelah mendapatkan nilai-nilai frekuensi yang mewakili kata tanya tersebut, maka selanjutnya
menentukan titik sampel berdasarkan waktu (t). Untuk menghasilkan nilai t maka jarak antar frekuensi
(d) akan dibagi dengan jumlah titik sample (n). Setelah nilai t dan d didapat maka selanjutnya akan diperoleh
nilai frekuensi berdasarkan waktu (t). Untuk mendapatkan nilai frekuensi terhadap t, perhatikan
nilai frekuensi pada gambar 4 di bawah. Gambar di bawah menujukan pola prosodi dari kalimat kapan
anda akan berangkat ke bali .Pada saat waktu menunjukkan nulai 0.05 diperoleh nilai frekuensi 241.

    2.5 Perhitungan Delta
Setelah selesai mendapatkan nilai frekuensi maka hal berikutnya adalah mencari nilai delta. Delta adalah
nilai mutlak selisih dari nilai frekuensi rata-rata dari data yang didapat dengan data yang terpilih. Dari
data-data yang telah didapat terdapat data-data yang tidak dapat diproses lebih lanjut dikarena terlalu jauh
nilainya dari nilai rata-rata. Untuk itu, maka terdapat data yang terpilih.

  3 Hasil Penelitian dan Pembahasan
Proses analisis data terdiri atas Analisis data berdasarkan waktu dan frekuensi, perhitungan Delta,
Analisis delta, sehingga menghasilkan bentuk prosodi yang diinginkan. untuk menentukan bentuk prosodi
dari sebuah kalimat adalah dengan menghitung banyaknya delta minimal yang dimiliki pada titik-titik
sampel berdasarkan waktu.

  4 Kesimpulan dan Saran
  4.1 Kesimpulan
Dari hasil yang diperoleh setelah dilakukan analisis prosodi kalimat tanya pada Bahasa Indonesia, dapat
disimpulkan bahwa untuk setiap kalimat yang menggunakan kata tanya dalam Bahasa Indonesia, memiliki
bentuk prosodi yang sama yaitu pada durasi 64ms (0.064 s) frekuensi awal tinggi dan semakin menurun
pada akhir durasi 3200 ms(3.2s).

4.2 Saran
Model prosodi yang dihasilkan dapat dimanfaatkan sebagai database untuk membangkitkan aplikasi suara
speech syntesis, dimana dapat membangkitkan suara untuk kalimat tanya pada Bahasa Indonesia