Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/29623
Title: การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล
Other Titles: An implementation of a speech compression algorithm by digital signal processing
Authors: มีลาภ เรืองรัตนวิชา
Advisors: ประภาส จงสถิตย์วัฒนา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Issue Date: 2539
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์หลักในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดซึ่งให้คุณภาพของเสียงพูด ในระดับที่สูงเพียงพอสำหรับการประยุกต์ด้านการสื่อสารหลักการทำงานของโปรแกรมที่พัฒนาขึ้นมีพื้นฐานมาจากวิธีการเข้ารหัสแบบทำนายเชิงเส้น (Linear Predictive Coding - LPC) วิธีการที่ใช้ได้แก่ แอลพีซี10 (LPC10) ซีอีแอลพี (CELP - Code Excited Linear Prediction) และ อาร์พีอี-แอลทีพี (RPE-LTP - Residual Pulse Excitation - Linear Prediction) ในขั้นแรกของการวิจัยได้พัฒนาโปรแกรมให้ทำงานอยู่บนคอมพิวเตอร์พีซีและรับ ข้อมูลเสียงพูดที่อยู่ในแฟ้มข้อมูลเวฟ (wave file) เป็นข้อมูลเข้า สิ่งที่สนใจศึกษาได้แก่อัตราข้อมูลของรหัสที่ได้หลังการบีบข้อมูล ความซับซ้อนของขั้นตอนวิธี และ คุณภาพของสัญญาณเสียงพูดที่ได้ หัวข้อเหล่านี้เป็นหลักเกณฑ์สำคัญในการเลือกวิธีที่เหมาะสมสำหรับการพัฒนาเป็นโปรแกรมบีบข้อมูลเสียงที่ทำงานแบบทันที (real time) ซึ่งจะทำงานบนตัวประมวลผลสัญญาณ ดิจิตอล ADSP2101 อัตราข้อมูลที่ได้สำหรับวิธีแอลพีซี10 คือ 2.4 Kbps สำหรับวิธีซีอีแอลพีคือ 4.8 Kbps และ สำหรับวิธีอาร์พีอี-แอลทีพีคือ 13 Kbps พบว่าวิธีซีอีแอลพีเป็นวิธีที่มีความซับซ้อนในการทำงานมากที่สุด รองลง มาคือวิธีอาร์พีอี-แอลทีพี ส่วนวิธีแอลพีซี10 มีความซับซ้อนน้อยที่สุดการเปรียบเทียบคุณภาพของเสียงพูดที่ได้ ใช้คะแนนความเห็นจากผู้ทดสอบจำนวน 12 ท่าน ตัวอย่างเสียงพูดที่ใช้ในการทดลองเป็นเสียงไทยหนึ่งตัวอย่าง และเสียงหญิงหนึ่งตัวอย่าง วิธีแอลพีซี 10 ได้คะแนนเฉลี่ย 5.3 วิธีซีอีแอลพีได้ 6.7 คะแนน ส่วนวิธีอาร์พีอีแอลทีพี ได้คะแนนสูงสุดคือ 8.1 คะแนน ดังนั้นจึงได้เลือกวิธีอาร์พีอี-แอลทีพีในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูด แบบทันทีเนื่องจากมีเป็นวิธีที่ให้คุณภาพของเสียงพูดจัดว่าดีและการทำงานไม่ซับซ้อนมากนัก โปรแกรมดังกล่าว ใช้เวลาประมาณ 16.3 ms ในการบีบและคลายข้อมูลเสียงต่อหนึ่งเฟรม (frame) ซึ่งมีความยาว 20 ms
Other Abstract: The main objective of this research is to develop speech compression programs of which the speech quality levels are high enough for communication applications. The programs employ methods based on linear predictive coding (LPC) i.e. LPC10, CELP (Code Excited Linear Prediction) and RPE-LTP (Residual Pulse Excitation - Lone Term Prediction). In the first phase, the programs were developed for working on a PC and accepted speech in wave file format (.wav) as the input. The characteristics of each compression method e.g. the compression ratio or data rate after compression, algorithm complexity and the quality of the speech were studied and used as the criteria to choose one of them to implement as the real-time version which intended to run on the digital signal processor ADSP2101. The data rate after compression is 2.4 Kbps for LPC10, 4.8 Kbps for CELP and 13 Kbps for RPE-LTP. CELP is found as the most complicated method, RPE-LTP is the second and LPC10 is the least of the three methods. The quality of the speech of each method was compared by using the opinion score from 12 listeners. The experiment was performed with two sample files of man and woman speech. LPC10 got the average score of 5.3, CELP got 6.7 and RPE-LTP got the highest score of 8.1. RPE-LTP was therefore selected for real-time implementation due to its good quality of speech and moderate complexity. The estimated compression and decompression time of the real-time compression program is 16.3 ms for 20 ms speech frame.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2539
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมคอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/29623
ISBN: 9746359142
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Meelarp_ru_front.pdf4.18 MBAdobe PDFView/Open
Meelarp_ru_ch1.pdf2.77 MBAdobe PDFView/Open
Meelarp_ru_ch2.pdf8.5 MBAdobe PDFView/Open
Meelarp_ru_ch3.pdf8.28 MBAdobe PDFView/Open
Meelarp_ru_ch4.pdf5.54 MBAdobe PDFView/Open
Meelarp_ru_ch5.pdf5.06 MBAdobe PDFView/Open
Meelarp_ru_ch6.pdf5.9 MBAdobe PDFView/Open
Meelarp_ru_ch7.pdf1.07 MBAdobe PDFView/Open
Meelarp_ru_back.pdf3.74 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.