Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/29623
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorประภาส จงสถิตย์วัฒนา
dc.contributor.authorมีลาภ เรืองรัตนวิชา
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
dc.date.accessioned2013-03-11T07:35:17Z
dc.date.available2013-03-11T07:35:17Z
dc.date.issued2539
dc.identifier.isbn9746359142
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/29623
dc.descriptionวิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2539en
dc.description.abstractการวิจัยครั้งนี้มีวัตถุประสงค์หลักในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดซึ่งให้คุณภาพของเสียงพูด ในระดับที่สูงเพียงพอสำหรับการประยุกต์ด้านการสื่อสารหลักการทำงานของโปรแกรมที่พัฒนาขึ้นมีพื้นฐานมาจากวิธีการเข้ารหัสแบบทำนายเชิงเส้น (Linear Predictive Coding - LPC) วิธีการที่ใช้ได้แก่ แอลพีซี10 (LPC10) ซีอีแอลพี (CELP - Code Excited Linear Prediction) และ อาร์พีอี-แอลทีพี (RPE-LTP - Residual Pulse Excitation - Linear Prediction) ในขั้นแรกของการวิจัยได้พัฒนาโปรแกรมให้ทำงานอยู่บนคอมพิวเตอร์พีซีและรับ ข้อมูลเสียงพูดที่อยู่ในแฟ้มข้อมูลเวฟ (wave file) เป็นข้อมูลเข้า สิ่งที่สนใจศึกษาได้แก่อัตราข้อมูลของรหัสที่ได้หลังการบีบข้อมูล ความซับซ้อนของขั้นตอนวิธี และ คุณภาพของสัญญาณเสียงพูดที่ได้ หัวข้อเหล่านี้เป็นหลักเกณฑ์สำคัญในการเลือกวิธีที่เหมาะสมสำหรับการพัฒนาเป็นโปรแกรมบีบข้อมูลเสียงที่ทำงานแบบทันที (real time) ซึ่งจะทำงานบนตัวประมวลผลสัญญาณ ดิจิตอล ADSP2101 อัตราข้อมูลที่ได้สำหรับวิธีแอลพีซี10 คือ 2.4 Kbps สำหรับวิธีซีอีแอลพีคือ 4.8 Kbps และ สำหรับวิธีอาร์พีอี-แอลทีพีคือ 13 Kbps พบว่าวิธีซีอีแอลพีเป็นวิธีที่มีความซับซ้อนในการทำงานมากที่สุด รองลง มาคือวิธีอาร์พีอี-แอลทีพี ส่วนวิธีแอลพีซี10 มีความซับซ้อนน้อยที่สุดการเปรียบเทียบคุณภาพของเสียงพูดที่ได้ ใช้คะแนนความเห็นจากผู้ทดสอบจำนวน 12 ท่าน ตัวอย่างเสียงพูดที่ใช้ในการทดลองเป็นเสียงไทยหนึ่งตัวอย่าง และเสียงหญิงหนึ่งตัวอย่าง วิธีแอลพีซี 10 ได้คะแนนเฉลี่ย 5.3 วิธีซีอีแอลพีได้ 6.7 คะแนน ส่วนวิธีอาร์พีอีแอลทีพี ได้คะแนนสูงสุดคือ 8.1 คะแนน ดังนั้นจึงได้เลือกวิธีอาร์พีอี-แอลทีพีในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูด แบบทันทีเนื่องจากมีเป็นวิธีที่ให้คุณภาพของเสียงพูดจัดว่าดีและการทำงานไม่ซับซ้อนมากนัก โปรแกรมดังกล่าว ใช้เวลาประมาณ 16.3 ms ในการบีบและคลายข้อมูลเสียงต่อหนึ่งเฟรม (frame) ซึ่งมีความยาว 20 ms
dc.description.abstractalternativeThe main objective of this research is to develop speech compression programs of which the speech quality levels are high enough for communication applications. The programs employ methods based on linear predictive coding (LPC) i.e. LPC10, CELP (Code Excited Linear Prediction) and RPE-LTP (Residual Pulse Excitation - Lone Term Prediction). In the first phase, the programs were developed for working on a PC and accepted speech in wave file format (.wav) as the input. The characteristics of each compression method e.g. the compression ratio or data rate after compression, algorithm complexity and the quality of the speech were studied and used as the criteria to choose one of them to implement as the real-time version which intended to run on the digital signal processor ADSP2101. The data rate after compression is 2.4 Kbps for LPC10, 4.8 Kbps for CELP and 13 Kbps for RPE-LTP. CELP is found as the most complicated method, RPE-LTP is the second and LPC10 is the least of the three methods. The quality of the speech of each method was compared by using the opinion score from 12 listeners. The experiment was performed with two sample files of man and woman speech. LPC10 got the average score of 5.3, CELP got 6.7 and RPE-LTP got the highest score of 8.1. RPE-LTP was therefore selected for real-time implementation due to its good quality of speech and moderate complexity. The estimated compression and decompression time of the real-time compression program is 16.3 ms for 20 ms speech frame.
dc.format.extent4283930 bytes
dc.format.extent2837969 bytes
dc.format.extent8700114 bytes
dc.format.extent8480553 bytes
dc.format.extent5674629 bytes
dc.format.extent5182951 bytes
dc.format.extent6046716 bytes
dc.format.extent1100494 bytes
dc.format.extent3833826 bytes
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.language.isothes
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen
dc.titleการทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอลen
dc.title.alternativeAn implementation of a speech compression algorithm by digital signal processingen
dc.typeThesises
dc.degree.nameวิทยาศาสตรมหาบัณฑิตes
dc.degree.levelปริญญาโทes
dc.degree.disciplineวิศวกรรมคอมพิวเตอร์es
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Meelarp_ru_front.pdf4.18 MBAdobe PDFView/Open
Meelarp_ru_ch1.pdf2.77 MBAdobe PDFView/Open
Meelarp_ru_ch2.pdf8.5 MBAdobe PDFView/Open
Meelarp_ru_ch3.pdf8.28 MBAdobe PDFView/Open
Meelarp_ru_ch4.pdf5.54 MBAdobe PDFView/Open
Meelarp_ru_ch5.pdf5.06 MBAdobe PDFView/Open
Meelarp_ru_ch6.pdf5.9 MBAdobe PDFView/Open
Meelarp_ru_ch7.pdf1.07 MBAdobe PDFView/Open
Meelarp_ru_back.pdf3.74 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.