Thuật toán MLFNN cho phân loại tiếng nói sử dụng trích đặc trưng MMFC trong xe lăn thông minh
Email tác giả liên hệ:
haint@hcmute.edu.vnTừ khóa:
MMFC feature extraction, Speech classification, Hamming low-pass filter and Multiplayer Neural NetworksTóm tắt
Bài báo kiến nghị thuật toán mạng nơron truyền thẳng nhiều lớp (MLFNN) cho phân loại tiếng nói trong xe lăn thông minh, trong đó trích đặc trưng của những lệnh tiếng nói được thực hiện sử dụng những hệ số dựa vào tần số Mel (MMFC). Những lệnh được nhận biết cho điều khiển xe lăn là “Trái”, “Phải”, “Tới”, “Lui” và “Dừng”. Hơn nữa, một bộ lọc thông thấp Hamming được áp dụng để giảm nhiễu trước khi trích đặc trưng. Vậy thì những tín hiệu lệnh sau khi được nhận biết sẽ được đưa vào điều khiển xe lăn điện di chuyển. Những kết quả trong nghiên cứu này có thể hỗ trợ những người khuyết tật sử dụng xe lăn một cách dễ dàng và tiện lợi hơn trong cuộc sống và còn minh chứng sự hiệu quả của phương pháp kiến nghị.
Tải xuống: 0
Tài liệu tham khảo
Bhupinder Singh, Neha Kapur, Puneet Kaur, “Speech Recognition with Hidden Markov Model: A Review”, International Journal of Advanced in Computer Science and Soft Engineering, Vol. 2, pp. 400-403, 2012.
Dipmoy Gupta, Radha Mounima C. Navya Manjunath, Manoj PB, “Isolated Word Speech Recognition Using Vector Quantization”,International Journal of Advanced in Computer Science and Soft Engineering, Vol. 2, pp. 164-168, 2012.
Talal Bin Amin, Iftekhar Mahmood, “Speech Recognition Using Dynamic Time Warping”,ICAST, 2008.
A.Revathi, R.Ganapathy and Y.Venkataramani, “Text Independent Speaker Recognition and Speaker Independent Speech Recognition UsingIterative Clustering Approach”, International Journal of Computer science & Information Technology, Vol. 1, No 2, pp. 30-42, 2009.
Lindasalwa Muda, Mumtaj Begam and I. Elamvazuthi, “Voice Recognition Algorithms using Mel Frequency Cepstral Coefficient (MFCC) and Dynamic Time Warping (DTW) Techniques”, Journal Of Computing, Vol. 2, Issue 3, pp. 138 143, 2010.
Kohei Arai, Ronny Mardiyanto, Eyes Based Eletric Wheel Chair Control System, International Journal of Advanced Computer Science and Applications, 2011.
S. M. Azam, Z.A. Mansoor, M. Shahzad Mughal, S. Mohsin, “Urdu Spoken Digits Recognition Using Classified MFCC and Backpropgation Neural Network”, Computer Graphics, Imaging and Visualisation IEEE, Vol.1, pp. 7695-2928, 2007.
Chin Luh Tan and Adznan Jantan, “Digit Recognition Using Neural Networks”, Malaysian Journal of Computer Science, Vol. 17 No. 2,pp. 40-54, 2004.
Chin Luh Tan and Adznan Jantan, “Digit Recognition Using Neural Networks”, Malaysian Journal of Computer Science, Vol. 17 No. 2, pp2012. 40-54, 2004.
S. M. Azam, Z.A. Mansoor, M. Shahzad Mughal, S. Mohsin, “Urdu Spoken Digits Recognition Using Classified MFCC and Backpropgation Neural Network”, Computer Graphics, Imaging and Visualisation IEEE, Vol.1, pp. 0-7695-2928, 2007.
R. Rojas, Neural Networks. Berlin: Springer-Verlag, 1996.
Fu-Hua Liu; Richard M. Stern; Xuedong Huang; Alejandro Acero, “Efficient cepstral normalization for robust speech recognition, human language technology”, Proceedings of a Workshop Held at Plainsboro, New Jersey, pp. 21-24, 1993.
Hachkar et al., “A Comparison of DHMM and DTW for Isolated Digits Recognition System of Arabic Language”, International J.on Computer Science and Enginerring, 2011.
Tải xuống
Đã Xuất bản
Cách trích dẫn
Giấy phép
Tác phẩm này được cấp phép theo Giấy phép quốc tế Creative Commons Attribution-NonCommercial 4.0 .
Bản quyền thuộc về JTE.


