Vous êtes sur la page 1sur 19

ANN - BASED SIGNAL

PROCESSING
ENDANG WAHYUNI

ARTIFICIAL NEURAL NETWORK


(JARINGAN SARAF TIRUAN)
ANN merupakan sistem komputasi dimana arsitektur
dan operasi diilhami dari pengetahuan tentang sel syaraf
biologi di dalam otak. Artificial Neural Network(Jaringan
Syaraf Tiruan) merupakan model yang meniru cara kerja
jaringan neural biologis. Jaringan saraf tiruan dapat
menyelesaikan yang rumit atau yang tidak mungkin jika
diselesaikan dengan menggunakan komputasi secara
konvensional.
Dengan melakukan proses belajar jaringan saraf dapat
memodifikasi tingkah laku sesuai dengan keadaan
lingkungannya. Jaringan saraf dapat mengatur dirinya
untuk menghasilkan suatu respon yang konsisten terhadap
rangkaian masukan/input. Jaringan syaraf tiruan dirancang
dan dilatih untuk memiliki kemampuan seperti yang
dimiliki manusia. Otak sebagai pengolah sistem informasi.

ARSITEKTUR ANN
Lapisan 1 : Lapisan Input
lapisan input berfungsi sebagai penghubung
jaringan ke dunia luar/ sumber data.
Lapisan 2 : Lapisan Tersembunyi
bisa memiliki lebih dari satu bisa juga tidak
memiliki sama sekali.
Lapisan 3 : Lapisan Output

STRUKTUR ANN

Proses ANN dimulai dari input yang diterima oleh neuron


beserta dengan nilai bobot dari tiap2 input yang ada. Nilai
input akan dijumlahkan. Kemudian hasil penjumlahan akan
diproses oleh fungsi aktivasi. Setelah aktif neuron akan
mengirimkan nilai output.

IDENTIFIKASI PEMBICARA DENGAN JARINGAN


SYARAF TIRUAN DAN TRANSFORMASI WAVELET
DISKRET SEBAGAI PRAPROSES

Analisis suara sangat penting dalam pengenalan


ucapan (speech recognition) atau pemahaman
ucapan dan identifikasi pembicara atau speaker
verification.
Speaker
identification : menekankan pada
analisis suara yang diucapkan oleh tiap
pembicara
sehingga
dapat
dibedakan
karakteristik unik suara dari tiap pembicara
tersebut.

Proses identifikasi dengan suara yang merupakan


bagian dari sistem pengenalan pembicara
memiliki
keuntungan
secara
ekonomis
dibandingkan dengan identifikasi secara biometrik
lainnya seperti identifikasi pada wajah, sidik jari,
tanda tangan, retina dan lainnya. Identifikasi
dengan suara hanya memerlukan alat tambahan
berupa mikrofon dan kartu suara.
Sinyal suara manusia mempunyai variabilitas
yang sangat tinggi. Suatu sinyal suara yang
dikeluarkan oleh pembicara yang berbeda akan
menghasilkan pola yang berbeda pula. Salah satu
cara yang paling andal dalam pengenalan pola
adalah ANN/JST.

FAKTOR YANG MEMPENGARUHI KESALAHAN


APLIKASI IDENTIFIKASI PEMBICARA
Kesalahan membaca atau pengucapan frase yang
telah ditetapkan
Tekanan emosional (stress) pengucapan
Inkonsistensi ruang akustik adanya noise
Kesalahan channel transmisi
Kondisi pembicara
Usia pembicara
Mimicry (peniruan suara)

PRINSIP DASAR IDENTIFIKASI


PEMBICARA

1.
2.
3.

Pengenalan pembicara dapat diklasifikasikan ke


dalam tiga tahap :
Identifikasi
Deteksi
Verifikasi

TAHAPAN SISTEM IDENTIFIKASI


PEMBICARA
1.

2.

3.

4.
5.
6.

Akuisisi data suara digital : yaitu proses untuk


mengakuisisi ucapan pembicara (dalam sinyal
analog) dan mengubahnya menjadi sinyal digital.
Frame blocking dan windowing : yaitu proses
segmentasi sinyal suara digital yang telah
diakuisisi ke dalam durasi tertentu.
Ekstraksi ciri : Mengekstrak data hasil akuisisi
sehingga dihasilkan data yang berdimensi lebih
kecil tanpa merubah karakteristik suara.
Pembentukan model referensi pembicara
Pencocokan pola
Pembuat keputusan

TAHAPAN IDENTIFIKASI
PEMBICARA

Akuisisi data
suara digital

Frame
blocking &
Windowing

Pattern
Matching

Feature
extraction

Pembentu
kan
model

Pembuatan
Keputusan

AKUISISI DATA SUARA DIGITAL

FRAME BLOCKING & WINDOWING

EKSTRAKSI CIRI
Tujuan utamanya adalah untuk mereduksi ukuran
data tanpa merubah karakteristik dari sinyal
suara dalam setiap framenya.
Transformasi Wavelet Diskret memberikan
informasi mengenai sinyal secara bersamaan
dalam domain waktu dan frekuensi.

TRANSFORMASI WAVELET DISKRET

Transformasi adalah proses merepresentasikan


suatu sinyal ke dalam domain. Tujuan dari
transformasi adalah untuk lebih menonjolkan sifat
atau karakteristik sinyal tersebut. Definisi wavelet
(secara harfiah berarti gelombang kecil) adalah
himpunan fungsi dalam ruang vektor L2I, yang
mempunyai sifat-sifat sebagai berikut[1]:
berenergi terbatas
merupakan fungsi band-pass pada domain
frekuensi
merupakan hasil penggeseran (translasi) dan
penskala (dilatasi) dari sebuah fungsi tunggal
(induk), yaitu

ANN (JARINGAN SYARAF TIRUAN )


Pada speaker identifikasi, pembentukan model
referensi pembicara dan pencocokan pola adalah
dua tahap yang saling berkaitan.
ANN adalah teknik yang digunakan untuk
pencocokan pola.
ANN akan melakukan pembelajaran untuk
membentuk suatu model referensi kemudian
ANN yang telah melakukan pembelajaran
tersebut dapat digunakan untuk pencocokan
pola.

PEMBUATAN KEPUTUSAN
Pembuatan keputusan di dalam sistem speaker
recognition mencakup sistem identifikasi yang
terkait erat dengan teknik pencocokan pola yang
digunakan. Pembuatan keputusan dengan sistem
identifikasi dapat dianalogikan dengan klasifikasi
pola, dengan tiap kelas merepresentasikan tiap
pembicara. Pembuatan keputusan dapat dilakukan
dengan metode nilai maksimum. Jika neuron
output ke-n merupakan neuron dengan nilai
maksimum maka data yang masuk dikenali
sebagai pembicara ke-n.

REFERENSI

Vous aimerez peut-être aussi