Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/70993
Title: อ่านคำไทยพยางค์เดี่ยวแบบปรับความเร็วได้
Other Titles: Variable speed Thai monosyllabic word text-to-speech reader
Authors: วิเชียร แซ่โล้ว
Advisors: เอกชัย ลีลารัศมี
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: Ekachai.L@Chula.ac.th
Subjects: เครื่องอ่านแบบปรับความเร็วได้
เสียงพูด -- การสังเคราะห์
การบีบอัดข้อมูล
ภาษาไทย -- คำพยางค์เดียว
การบีบอัดสัญญาณเสียง
Issue Date: 2539
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: วิทยานิพนธ์นี้กล่าวถึงการพัฒนาเครื่องอ่านคำไทยที่สามารถอ่านสตริงของพยางค์ไทยคำเดียวที่แยกระหว่างพยางค์ด้วยช่องว่างให้เป็นเสียง ความเร็วในการอ่านสามารถปรับได้ 4 ระดับ โดยไม่ทำให้ความถี่ของพิตซ์และคุณลักษณะทางเสียงเปลี่ยนไป ช่วงเงียบระหว่างพยางค์ที่ต่อเนื่อง สามารถปรับเปลี่ยนได้โดยการแทรกคำสั่งพิเศษลงในสตริง เครื่องอ่านนี้มีทางเข้าออกแบบอนุกรมที่ทำงานแบบโมเดมหลอกสำหรับการรับสตริงข้อมูลจากอุปกรณ์ภายนอกใด ๆ เช่นเครื่องคอมพิวเตอร์ส่วนบุคคล ฮาร์ดแวร์หลักของเครื่องอ่านนี้ประกอบด้วยใมโครคอนโทรลเลอร์ 8 บิตที่มีหน่วยความจำแรมขนาด 32 กิโลไบต์และหน่วยความจำรอมขนาด 64 กิโลไบต์ ส่วนจัดการหน่วยความจำเสียงขนาด 3 เมกะไบต์ ตัวแปลงสัญญาณดิจิตอลเป็นแอนะล็อกขนาด 8 บิต และลำโพง ส่วนจัดการหน่วยความจำเสียงจะเก็บคลื่นเลียงของหน่วยคู่เสียงทั้งหมดที่อัตราการสุ่มข้อมูล 16 กิโลเฮิรตซ์ ขนาดความละเอียดของข้อมูล 8 บิต และการบีบอัดสัญญาณได้ใช้เทคนิคเอดีพีซีเอ็มแบบไม่สูญเสียข้อมูล กลไกการอ่านออกเสียงของแต่ละพยางค์ถูกกระทำโดยไมโครคอนโทรลเลอร์ซึ่งจะอ่านคลื่นเสียงของหน่วยคู่เสียงจากส่วนจัดการหน่วยความจำเสียงมาต่อกัน และส่งคลื่นเสียงที่ต่อกันนี้ไปยังลำโพงผ่านทางตัวแปลงสัญญาณดิจิตอลเป็นแอนะล็อก ซอฟต์แวร์ของไมโครคอนโทรลเลอร์ถูกแบ่งออกเป็นส่วนงานย่อย ๆสำหรับทำงานที่สำคัญดังนี้ คือ 1) วิเคราะห์พยางค์ไทยคำเดียวแต่ละพยางค์ออกเป็น 4 ส่วนคือ พยัญชนะต้น สระ วรรณยุกต์ และตัวสะกด โดยใช้กฎเกณฑ์ที่คิดค้นขึ้น 2) การใช้รูปสัทอักษรสากลแทนเสียงของ พยางค์ที่วิเคราะห์ 3) การพิจารณาหาหน่วยคู่เสียงที่สามารถนำมาต่อกันเป็นเสียงของพยางค์ไทยที่กำหนด ทั้งนี้โดยอิงผลงานวิจัยของหน่วยปฏิบัติการวิจัยทางภาษาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย 4) การคลายสัญญาณเสียงจากส่วนจัดการหน่วยความจำเสียง
Other Abstract: This thesis describes the development of Thai text-to-speech reader capable of voice reading of any string of Thai monosyllabic words separated by blanks. The reading speed can be adjusted in 4 steps without changing the pitch frequency and the voice quality. The silence duration between syllables can also be varied by inserting special command codes in the string. This reader provides a serial port which behaves as a null modem for receiving input strings from any external device such as a personal computer. The hardware of this text-to-speech reader consists mainly of an 8-bit microcontroller with a 32-Kbyte RAM and a 64-Kbyte ROM, a 3 Mbyte sound ROM, an 8-bit digital-to-analog converter (DAC), and a speaker. The sound ROM stores the digitized waveforms of all diphones that were sampled at 16 kHz with 8 bit resolution and compressed using the lossless adaptive differential pulse code modulation (LADPCM) technique. The voice reading mechanism of each syllable is done by the microcontroller, which reads the waveforms of the predetermined diphcnes from the sound ROM, concatenates them and sends the concatenated waveforms to the speaker through the DAC converter. The software of the microcontroller is divided into several modules for performing different tasks. The major tasks are 1) analysis of each Thai monosyllable word into 4 pans, i.e., initial consonant, vowel, tone and final consonant using a novel rule-based technique. 2) formation of international phonetic alphabets representing the voice of the analysis word. 3) determination of the diphones that can be concatenated to produce the voice of a given Thai syllable, based coon the research work of the Linguistics Research Unit, Chulalongkorn University. 4) decompression of voice data from the sound ROM.
Description: วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2539
Degree Name: วิศวกรรมศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมไฟฟ้า
URI: http://cuir.car.chula.ac.th/handle/123456789/70993
ISBN: 9746341189
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Vichean_lo_front_p.pdf1.08 MBAdobe PDFView/Open
Vichean_lo_ch1_p.pdf711.09 kBAdobe PDFView/Open
Vichean_lo_ch2_p.pdf1.45 MBAdobe PDFView/Open
Vichean_lo_ch3_p.pdf1.77 MBAdobe PDFView/Open
Vichean_lo_ch4_p.pdf2.59 MBAdobe PDFView/Open
Vichean_lo_ch5_p.pdf934.67 kBAdobe PDFView/Open
Vichean_lo_back_p.pdf940.83 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.