Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/72271
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorสุวิทย์ นาคพีระยุทธ-
dc.contributor.authorสิริ วงศ์วรชาติกาล-
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์-
dc.date.accessioned2021-02-12T07:27:38Z-
dc.date.available2021-02-12T07:27:38Z-
dc.date.issued2543-
dc.identifier.isbn9741301111-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/72271-
dc.descriptionวิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2543en_US
dc.description.abstractมาตรฐาน ITU-T G.729 เป็นมาตรฐานในการบีบอัดเสียงพูดซึ่งสามารถนำใช้งานได้อย่างกว้างขวาง ดังนั้นถ้าเราสามารถดึงจุดเด่นของเสียงที่จำเป็นในการรู้จำออกมาได้โดยตรงจากรหัสเสียงที่ถูกบีบอัดแล้ว จะสามารถสร้างระบบรู้จำเสียงอย่างง่ายจากรหัสเสียง G.729 โดยตรง พลังงานเสียง คาบการสั่นของเสียง และ LSP (Line Spectral Pair) เป็นพารามิเตอร์ที่ส่งมาลับรหัส G.729 และสามารถใช้ในการรู้จำเสียงได้ วิทยานิพนธ์นี้นำวิธีการของแบบจำลองฮิดเดน มาร์คอฟ และการควอนไทซ์แบบเวกเตอร์ มาใช้ในการรู้จำเสียงภาษาไทยแบบไม่ขึ้นกับผู้พูด คำศัพท์ทั้งหมด 30 คำแบ่งเป็น 2 ชุดได้แก่ ชุดคำศัพท์ตัวเลข 0 ถึง 9 และชุดคำศัพท์พยางค์เดียว 20 คำ เสียงพูดที่นำมาเป็นต้นแบบและเป็นเสียงพูดทดสอบประกอบด้วยทั้งเพศชายและหญิงที่มีช่วงอายุ ระหว่าง 18 ปี ถึง 25ปี ผลการทดสอบอัตราการรู้จำแบบไม่ขึ้นลับผู้พูดของชุดเลียงพูดเพื่อทดสอบมีอัตรารู้จำเฉลี่ยร้อยละ 90.75 โดยมีอัตราการรู้จำเฉพาะชุดคำศัพท์พยางค์เดียวร้อยละ 88.50 อัตราการรู้จำเฉพาะชุดตัวเลขร้อยละ 93.00 ตามลำดับen_US
dc.description.abstractalternativeThe ITU-T Recommendation G.729 is a versatile and well accepted speech compression standard. If the speech feature can be extracted directly from the code easily, a simple speech recognition system can work directly on the G.729 codes. Energy, pitch period and LSP are the parameters obtained from G.729 codes which can be used in speech recognition. This thesis uses Hidden Markov Model (HMM) and Vector Quantization to recognize speaker independent Thai speech. The 30-word vocabulary is subdivided into two sets comprising 20 single syllable, and 10 tha. numeric words, zero to nine. The separated speech training set and testing set are composed of both male and female speakers within the range of 18 to 25 years of age. The average recognition rate of this speaker-independent recognition system is 90.75 %. The recognition rate of the single-syllabled words is 88.50 %.The recognition rate of the numeric words is 93.00%.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectการรู้จำเสียงพูดอัตโนมัติen_US
dc.titleการรู้จำเสียงพูดไทยโดยตรงจากการเข้ารหัส G.729en_US
dc.title.alternativeDirect recognition of Thai speech from G.729 codeen_US
dc.typeThesisen_US
dc.degree.nameวิศวกรรมศาสตรมหาบัณฑิตen_US
dc.degree.levelปริญญาโทen_US
dc.degree.disciplineวิศวกรรมไฟฟ้าen_US
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.email.advisorSuvit.N@Chula.ac.th-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Siri_wo_front_p.pdfหน้าปก สารบัญ และบทคัดย่อ779.89 kBAdobe PDFView/Open
Siri_wo_ch1_p.pdfบทที่ 1665.27 kBAdobe PDFView/Open
Siri_wo_ch2_p.pdfบทที่ 21.3 MBAdobe PDFView/Open
Siri_wo_ch3_p.pdfบทที่ 31.38 MBAdobe PDFView/Open
Siri_wo_ch4_p.pdfบทที่ 4760.17 kBAdobe PDFView/Open
Siri_wo_ch5_p.pdfบทที่ 5628.45 kBAdobe PDFView/Open
Siri_wo_back_p.pdfบรรณานุกรมและภาคผนวก1.19 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.