BROWSING AUDIO DATA

Table of Contents

BROWSING AUDIO DATA

 

BROWSING AUDIO DATA

Browsing Audio Data merupakan metode browsing jaringan yang digunakan untuk browsing video / audio data yang ditangkap oleh sebuah IP kamera. Metode browsing video / audio mencakupi langkah-langkah sebagai berikut :

  •  Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP
  •  Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi
  •    Mendapatkan alamat kamera IP pribadi dan alamat server pribadi
  •   Compile ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditangkap oleh kamera IP, dimana server layanan menangkap video / audio data melalui Internet.

1.2.5 SPEECH RECOGNATION

Speech Recognation merupakan sebuah system pusat panggilan yang dirancang untuk mengenali banyak suara dengan pelatihan atau khusus dirancang untuk pengguna tertentu, dimana system tersebut mengakui ucapan pengguna berdasarkan suara vocal pengguna yang unik.

Secara umum, Speech Recognation merupakan suatu system pengenal suara otomatis (automatic speech recognition) atau pengenal suara komputer (computer speech recognition), yang dapat mengidentifikasi seseorang dari suaranya, dimana suara yang diterima dirubah menjadi tulisan. Istilah ‘voice recognition’ digunakan untuk mengenali atau mengidentifikasi siapa yang berbicara, sedangkan istilah ‘Speech Recognition’ digunakan untuk mengidentifikasi apa yang diucapkannya.

Contoh Aplikasi dari Speech Recognation :

  1. Aplikasi pengenalan suara termasuk panggilan suara ( mis : Call Home ),
  2. Call Routing ( mis : Ingin membuat Collect Call ),
  3. Pada alat rumah tangga domestic DNS ( mis : Lampu, pintu, mobil, dll ),
  4. Konten Pencarian Audio ( mis : menemukan podcast tempat tertentu dari kata yang terucap),
  5. Entri data sederhana (mis : memasukan nomor kartu kredit )
  6. Penyusunan dokumen terstruktur (mis : sebuah Laporan Radiologi ),
  7. Pengolahan Teks ( mis: pengolahan kata atau email ),
  8. Di dlam pesawat terbang cookpits (biasanya disebut suara langsung Input ).

1.2.6 SPEECH SYNTESIS

Speech synthesis merupakan hasil kecerdasan buatan dari pembicaraan manusia. Sedangkan Speech synthesizer merupakan sebuah system komputer text to speech ( TTS ) yang digunakan untuk merubah sebuah teks menjadi pembicaraan.

Speech Synthesizer khusus diciptakan untuk orang-orang yang memiliki gangguan visual atau membaca, sehingga pengguna dapat mendengarkan informasi atau data yang terdapat di dalam komputer, karena data yang ada sudah di rubah kedalam suara dengan menyesuaikan suara dan pemahaman manusia.

 

System Text to Speech yang terdapat pada Speech Synthesizer terdiri dari dua bagian yang sangat penting, yaitu Front-end dan Back-end :

  1. Front-end

Bagian Front-end memiliki 2 tugas utama:

  • Proses Normalisasi Teks / Pra Pengolahan / Tokenization

Mengubah teks mentah berisi symbol (mis : angka & singkatan ) menjadi setara dengan kata-kata

  • Menetapkan Transkripsi fonetik untuk setiap kata, membagi, dan menandai teks ke prosodic unit seperti frase dan kalimat.
  •  Hasil transkripsi direpresentasikan berupa simbolik yang linguistik
  1. Back-end

Bagian Back-end sering disebut sebagai synthesizer, maka pada bagian ini bertugas mengubah representasi linguistik simbolik menjadi suara.

Setelah semua proses telah selesai dilakukan, maka kualitas dari informasi berupa suara yang diperdengarkan, merupakan bagian yang paling penting dari sebuah system, dimana suara yang diperdengarkan dapat dengan mudah didengar, dimengerti, dan dipahami oleh pengguna secara alami.