10 Haziran 2010 Perşembe

Araç Ses Sistemleri

SES KOMUT TANIMA İLE GEZGİN ARAÇ KONTROLÜ

ÖZET

Bu projede, ses komut tanıma sistemi ile gezgin araç kontrolü meydana getirilmiştir. Projede ses komut tanıma ortak vektör yaklaşımı (OVY) ile yapılmaktadır. OVY bir altuzay sınıflama yöntemidir. Bu yöntem ile her sınıfa ait değişmez özellikleri taşıyan ortak vektör elde edilir. OVY, yalıtık ses tanıma uygulamasında saklı Markov model (HMM) yöntemi ile karşılaştırılabilir sonuçlar vermektedir. Gezgin araç beş ses komutu ile kontrol edilmektedir: “ileri”, “geri”, “sağa dön”, “sola dön” ve “dur”. Deneysel çalışmada, OVY ile kişiye bağımlı ses komut tanımada yüksek başarımlar elde edilmiştir.


Anahtar Kelimeler: Ses Komut Tanıma, Ortak Vektör Yaklaşımı, Gezgin Araç Kontrolü.

MOBIL VEHICLE CONTROL WITH VOICE COMMAND RECOGNITION

ABSTRACT

In this study, mobile vehicle control is implemented with voice command recognition system. In this system, common vector approach (CVA) is used to recognize voice commands. The CVA is a subspace classifier, and in the CVA method, a common vector that represents invariant features of class is obtained. CVA in isolated speech recognition gives comparative results with hidden Markov Models (HMM). The mobile vehicle is controlled with five voice commands: “forward”, “backward”, “turn right”, “turn left” and “stop”. In the experimental study, we obtained high success rates with CVA for speaker-dependent voice command recognition.

Keywords: Voice Command Recognition, Common Vector Approach, Mobil Vehicle Control.



1. GİRİŞ
Ses tanıma sistemleri günlük hayatımızda birçok alanda kullanılmaya başlanmıştır. Ev, otomobil, ofis, hastane ve fabrika gibi çalışma ortamlarında ses tanıma ve sesle kontrol uygulamaları görmekteyiz[1,8,15,16]. Ses komut sistemleri kullanıcıların insanlarla etkileşiminde, araç kontrolünde ve kişisel ve kamuya açık veri erişiminde kullanılmaktadır[16].

Ses tanıma; yalıtık, birleşik ve sürekli olmak üzere üç şekilde yapılmaktadır. Ses tanıma sistemleri, kişiye bağımlı veya kişiye bağımsız ses tanıma yapacak şekilde tasarlanabilir[4].

Ses komut tanıma sistemlerinde sesin bütünü için bir model oluşturulabilir. Bu modelleme şekli özellikle sınırlı sayıda ses tanıma sistemleri için uygundur. Tanınacak ses sayısı fazla olduğu durumlar için ses modellemesi için ses birimlerinden yararlanılır. Ses birimleri ile ses/komut tanımada sürekli ses tanıma yöntemi uygulanır.

Ses komut tanıma sistemlerinde yalıtık veya sürekli konuşma tanıma yapılabilir [2,5,6,13,14]. Bu sistemlerde komutların değişken olması ve bu komutların sisteme kolay bütünleşmesi isteniyorsa sürekli konuşma tanıma yöntemleri tercih edilmelidir.

Günümüzde ses tanıma sistemlerinde “state-of-art” yöntemi olan saklı Markov modeller (HMM) kullanılmaktadır[4-6,14]. HMM yanında değişik ses tanıma yöntemleri de kullanılabilir. Bu çalışmada ses komut tanıma için bir altuzay sınıflama yöntemi olan OVY yöntemi kullanılmıştır[2,5,13]. OVY, başarım olarak HMM’e yakın sonuçlar vermektedir. Ayrıca OVY’nin HMM’e göre eğitim ve tanımada işlem açısından üstünlükleri vardır[7].

Bu çalışmada, OVY kullanılarak ses komut tanıma sistemi ile gezgin araç kontrolü yapılmıştır. Gezgin araç kontrolü için “ileri”, “geri”, “sağa dön”, “sola dön” ve “dur” komutları kullanılmaktadır.

2. ORTAK VEKTÖR YAKLAŞIMI
OVY, ses ve görüntü tanıma uygulamalarında kullanılan bir altuzay sınıflama yöntemidir[3,9,11,12]. Bu yöntem ile her sınıfa ait değişmez özellikleri taşıyan ortak vektör elde edilir. OVY hem yeterli veri durumu (m>=n), hem de yetersiz veri durumları (m
OVY’ de eğitim ile bir sınıfına ait ortak vektör ve o sınıfın farksızlık altuzayını geren özvektörler elde edilir. Yetersiz veri durumunda (m
Eğitim setinde bir sınıfına ait öznitelik vektörleri ile gösterilsin Bu sınıfa ait ortak değişinti matrisi Eşitlik (1)’den elde edilir.

(1)

Eşitlik (1)’de , sınıf ortalama vektörünü göstermektedir. OVY’ de öznitelik uzayı, farklılık altuzayı B ve farksızlık altuzayı B┴ olmak üzere birbirine dik iki altuzaya ayrılır. Farksızlık altuzayı B┴, ortak değişinti matrisinin sıfır özdeğerlerine karşılık gelen özvektörler tarafından gerilir. Yetersiz veri durumu (m


m-1 n-m+1

Fark Altuzayı Farksızlık Altuzayı

özdeğerine karşılık gelen özvektör ile gösterilsin. Bu durumda farksızlık altuzay izdüşüm matrisi aşağıdaki şekilde bulunur.

(2)
Bir sınıfa ait ortak vektör , o sınıfa ait her hangi bir öznitelik vektörünün farksızlık altuzayına izdüşümünden elde edilir:

(3) .

OVY’de tanıma yapılırken en küçük öklid uzaklık ölçütü kullanılır. Bu ölçüte göre, bilinmeyen sese ait öznitelik vektörü ’in her sınıfın farksızlık altuzayındaki izdüşümünün, o sınıfın ortak vektörüne olan uzaklığı bulunur. Bilinmeyen ses, en küçük uzaklığı veren sınıfa atanır.

(4)

Eşitlik (4)’de K, sınıf sayısını göstermektedir.

3. SES KOMUT TANIMA SİSTEMİ
Genel bir ses komut tanıma sisteminin blok şeması Şekil 1’de verilmektedir. Bu sistemde, bilinmeyen komuta ait sesin uç noktaları belirlendikten sonra öznitelik vektörü elde edilir. OVY ile öznitelik vektörünün hangi komuta ait olduğu belirlenir. Daha sonra bu komut sayısal I/O kartı ve RF verici üzerinden gezgin araca gönderilir.

Ses komut sisteminde tanıma yapılmadan önce ses komutlarının uç noktalarının belirlenmesi gerekir. Bu çalışmada uç nokta belirme için enerji ve sıfır geçiş ölçüleri kullanılmıştır [17] . Enerji ve sıfır geçiş sayısı için elde edilen eşik değerleri kullanılarak sesin uç noktaları belirlenmektedir.

Şekil 1. Ses komut tanıma sistemi

Öznitelik çıkartma yapılırken önce ses örneklerine önvurgulama yapılmaktadır. Daha sonra ses örnekleri 32 ms’lik (256 örnek) çerçevelere ayrılarak çerçeveler üzerine Hamming pencereleme uygulanır. Çerçeveler arasındaki örtüşme 8 milisaniyedir (64 örnek). Her çerçeve icin 12 MFCC (Mel Frequency Cepstral Coeeficients) hesaplanmaktadır. Bu katsayıların ilk değeri logaritmik çerçeve enerjisini (LogE) vermektedir. Her çerçeve için elde edilen MFCC katsayıları arka arkaya eklenerek ses komutu için öznitelik vektörü elde edilmektedir.

4. GEZGİN ARAÇ KONTROLÜ
Ses komut tanıma ile gezgin araç kontrolünde kişisel bilgisayar, I/O kartı, RF alıcı ve verici ve gezgin araç kullanılmaktadır (Şekil 2).


Şekil 2. Ses komut tanıma ile gezgin araç kontrol sistemi

Kişisel bilgisayar üzerinde MATLAB ortamında koşturulan yazılım ile ses komutları tanınmaktadır. Komut tanıma ile ilgili hareket bilgileri önce I/O kartına, oradan da RF verici ile gezgin araca iletilmektedir. Gezgin araç üzerindeki RF alıcı ile hareket bilgisi çözümlenmekte ve araç üzerindeki motora gerekli uyartım sinyalleri uygulanmaktadır.

Sesli komut tanıma ve gezgin araç kontrolü için MATLAB ortamında GUI hazırlanmıştır (Şekil 3). Bu GUI kullanılarak ses komutlarının kişiye bağımlı eğitimi yapılabilmektedir. GUI’de ses komutlarının modellenmesi için her komut için 10 kayıt yapılması istenmektedir. GUI ile her kayıt grafiksel olarak çizilmekte ve bu kayıt sonra geri çalınmaktadır. Kullanılıcı bu kaydı kabul etmekte veya reddederek tekrar yeni bir ses kaydedebilmektedir.



Şekil 3. Sesli komut tanıma ve gezgin araç kontrolü için MATLAB- GUI.

Sistemdeki RF alıcı/vericinin ve gezgin aracın doğru çalıştığından emin olmak için GUI’ye elle kumanda seçeneği eklenmiştir. Bu seçenek ile GUI üzerinde komutlara karşılık gelen düğmeler üzerinden istenilen komut gezgin araca gönderilebilmektedir.

Bilgisayardan RF vericiye komutlar sayısal I/O kartı üzerinden gönderilmektedir. Bu çalışmada Advantech PCL818 veri toplama kartı kullanılmıştır.

GUI üzerinde ses kontrol seçeneği seçilerek gezgin aracın sesle kontrolü yapılmaktadır.


5. SONUÇ
Bu çalışmada ses komut tanıma sistemi OVY ile gerçeklenmiş ve gezgin araç kontrolü yapılmıştır. Sistemin başarımı kişiye bağımlı tanıma için beklenildiği gibi %100 olarak elde edilmiştir.

MATLAB ortamında hazırlanan GUI, ses komut tanıma sisteminin geliştirilmesi için uygun bir ortam sağlamaktadır. Bu GUI ile farklı ses tanıma yöntemlerinin seçilmesi sağlanabilir. Bu şekilde farklı yöntemlerin ses komut tanıma uygulamasındaki başarımları karşılaştırılabilir.

Bu sistem, daha küçük ölçekli ve Digital Signal Processor (DSP) tabanlı ses komut tanıma sistemlerinin geliştirilmesinde kullanılabilir.

6. KAYNAKLAR
[1].Abordo A., Liao J., “Voice Command Recognition: Robocard”, Senior Project, University of California, Riverside Department of Electrical Engineering, June 2003.
[2].CMU Sphinix Speech Recognizer, sourceforge.net/projects/cmusphinx.
[3].Çevikalp,H., Neamatu, M., Wilkes, M., and Barkana, A.,“Discriminative Common Vectors for Face Recognition”, IEEE Transaction on Pattern Analysis and Machine Intelligence, 27: 4-13, 2005.
[4].Deler J.R., Proakis J.G. and Hansen J.H., Discrete-Time Processing of Speech Signals, Macmillian, 1993.
[5].Dikte Konuşma Tanıma, www.dikte.com.tr/
[6].Dragon Naturally Speaking Software, www.nuance.com/naturallyspeaking/
[7].Edizkan R., “Gizli Markov Model ile Bilgisayarda Konuşma Tanıma: Özellik Uzayında ve Altuzayda Sınıflandırıcı Tasarımı”, Doktora Tezi, Eskişehir Osmangazi Üniversitesi Elektrik-Elektronik Mühendisliği Bölümü, 1999.
[8].Gellatly A.W, The Use Of Speech Recognition Technology In Automotive Appliations, Doktora Tezi, Virginia Polytechnic Institute and State University 1997.
[9].Gülmezoğlu, M.B., Dzhafarov, V., Keskin, M. and Barkana, A., “A Novel Approach to Isolated Word Recognition”, IEEE Trans. Speech and Audio Proc., 7(6):620-628, 1999.
[10].Gülmezoğlu, M.B., Dzhafarov, V., and Barkana, A.,”The Common Vector Approach and its Relation to Principle Component Analysis”, IEEE Trans. Speech and Audio Proc., 9(6):655-662, 2001.
[11].Gülmezoğlu, M.B., Dzhafarov, V., and Barkana A., “Örüntü Sınıflandırıcılar İçin Ortak Vektör Yaklaşımı”, 7. Sinyal İşleme ve Uygulamaları Kurultayı, Haziran 1999.
[12].Gülmezoğlu, M.B., Dzhafarov, V., Edizkan R. and Barkana A., “The common vector approach and its comprasion with other subspace methods in the case of sufficient data”, Elsevier Computer and Speech Language dergisinde Nisan 2007 basılacak.
[13].Günal, S., Edizkan, R., Barkana, A., “The design of real-time digit recognizer using the common vector approach”. In: Proc. Eleventh National Conf. Signal Processing and Applications. İstanbul, 2003, 308-311.

garage music
Araç Ses Sistemleri
videolar
müzik sistemleri
otomobil
daha fazlası
forumları
teknoloji