Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/66824
Title: Statistical feature selection from chaos game representation for promoter recognition
Other Titles: การรู้จำโปรโมเตอร์โดยใช้เทคนิคการเลือกด้วยวิธีทางสถิติจากแทนด้วยเคออสเกมส์
Authors: Orawan Tinnungwattana
Advisors: Chidchanok Lursinsap
Other author: Chulalongkorn University. Faculty of Science
Subjects: โปรโมเตอร์
เคออสเกมส์
Promoter recognition
chaos game representation
Statistical feature selection
Artifical neural network
Issue Date: 2005
Publisher: Chulalongkorn University
Abstract: Recently, the recognition of promoters has attracted many researchers’ attention. Unfortunately, most previous prediction algorithms did not provide high enough sensitivity and specificity. The aim of this dissertation is to provide a distinct classification between Promoter and non-promoter sequences. We do not consider some well-known patterns around TSS, such as TATAAT-box and TTGACA-box, which were previously used by many researchers. The accuracy of promoter prediction is based on two factors, i.e., the representation of the given DNA sequence and the essential features of the sequence. A Chaos Game Representation (CSR) is adopted for transforming a DNA sequence having promoters and non-promoters into an image. The essential features of the CGR are selected by applying the concept of statistical feature selection. It is aimed at finding the Smallest set of features that can distinguish the classes over the full set and reduce the dimension of the classifier. Recognition can then be performed by a supervised neural network. The method in this dissertation can be applied to both prokaryotic and eukaryotic Organisms.
Other Abstract: ปัญหาการรู้จำโปรโมเตอร์เป็นที่สนใจของนักวิจัยในปัจจุบันแต่อัลกอริทึมที่มีอยู่ก็ยังให้ผลการทดลองที่ไม่ดีพอดังนั้นเป้าหมายของวิทยานิพนธ์นี้คือการพัฒนาอัลกอริทึมที่สามารถแยกความแตกต่างระหว่างลำดับดีเอ็นเอที่เป็นโปรโมเตอร์และไม่ใช่โปรโมเตอร์ออกให้ได้โดยไม่ได้เอารูปแบบที่มีอยู่ก่อนหน้าเช่น TATAAT-box และ TIGACA-box มาพิจารณาความถูกต้องของการทำนายโปรโมเตอร์ขึ้นอยู่กับปัจจัย 2 ประการคือการแทนลำดับดีเอ็นเอและการเลือกคุณลักษณะที่สำคัญหลักการคือการใช้เทคนิค Chaos Game Representation มาช่วยในการแปลงสำดับดีเอ็นเอซึ่งประกอบด้วยโปรโมเตอร์และไม่ใช่โปรโมเตอร์ให้เป็นภาพเพื่อที่จะเห็นรูปแบบได้ชัดเจนมากขึ้นจากนั้นจะทำการเลือกคุณสมบัติที่สำคัญที่ทำให้มีความแตกต่างกันมากที่สุดออกมาโดยใช้วิธีการเลือกทางสถิติจุดประสงค์เพื่อลดขนาดของข้อมูลให้เล็กลงเพื่อให้โครงข่ายประสาทเทียมทำการรู้จำวิธีการในงานวิจัยนี้สามารถใช้ได้ทั้งสิ่งมีชีวิตเซลล์เดียวและหลายเซลล์
Description: Thesis (Ph.D.)--Chulalongkorn University, 2005
Degree Name: Doctor of Philosophy
Degree Level: Doctoral Degree
Degree Discipline: Computer Science
URI: http://cuir.car.chula.ac.th/handle/123456789/66824
URI: http://doi.org/10.14457/CU.the.2005.1861
ISBN: 9745327565
metadata.dc.identifier.DOI: 10.14457/CU.the.2005.1861
Type: Thesis
Appears in Collections:Sci - Theses

Files in This Item:
File Description SizeFormat 
Orawan_ti_front_p.pdfหน้าปก บทคัดย่อ และสารบัญ839.89 kBAdobe PDFView/Open
Orawan_ti_ch1_p.pdfบทที่ 1666.15 kBAdobe PDFView/Open
Orawan_ti_ch2_p.pdfบทที่ 21.13 MBAdobe PDFView/Open
Orawan_ti_ch3_p.pdfบทที่ 3692.14 kBAdobe PDFView/Open
Orawan_ti_ch4_p.pdfบทที่ 4917.63 kBAdobe PDFView/Open
Orawan_ti_ch5_p.pdfบทที่ 5800.24 kBAdobe PDFView/Open
Orawan_ti_ch6_p.pdfบทที่ 6620.02 kBAdobe PDFView/Open
Orawan_ti_back_p.pdfบรรณานุกรม และภาคผนวก691.62 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.