Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/84449
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorKrung Sinapiromsaran-
dc.contributor.authorWorawit Jitpakdeebodin-
dc.contributor.otherChulalongkorn University. Faculty of Science-
dc.date.accessioned2024-02-05T10:38:47Z-
dc.date.available2024-02-05T10:38:47Z-
dc.date.issued2022-
dc.identifier.urihttps://cuir.car.chula.ac.th/handle/123456789/84449-
dc.descriptionThesis (M.Sc.)--Chulalongkorn University, 2022-
dc.description.abstractNowadays, classification in machine learning serves as a valuable tool for extracting and analyzing real-world datasets. However, an important issue in classification is the problem of class imbalance, which significantly impacts the performance of classifiers. In 2019, a novel approach for a decision tree induction was introduced to address This problem—the Minority Condensation Entropy (MCE) measure that can effectively handle imbalanced datasets. Subsequently, in 2021, a new outlier factor called the Mass ratio - variance Outlier Factor (MOF) was presented that can rank instances based on the dataset density. This thesis proposes a random forest algorithm using quartile-pattern Bootstrapping that incorporates MOF and MCE building a random forest capable of handling binary Class imbalanced datasets. The experimental results on synthesized datasets and real-world datasets indicated that the proposed algorithm outperforms other existing algorithms in terms of Precision, Recall, F-measure, and geometric mean, showing its effectiveness in handling imbalanced datasets and improving classification accuracy.-
dc.description.abstractalternativeในปัจจุบันการจำแนกประเภทในการเรียนรู้ของเครื่องเป็นเครื่องมือที่สำคัญสำหรับการ ดึงข้อมูลและการวิเคราะห์ข้อมูลโลกจริงอย่างไรก็ตามปัญหาที่สำคัญในการจำแนกประเภท คือปัญหาของความไม่ดุลของคลาสซึ่งมีผลกระทบต่อประสิทธิภาพของตัวจำแนกประเภท อย่างมีนัยสำคัญในปี 2019มีการนำเสนอวิธีการใหม่สำหรับการสร้างต้นไม้ตัดสินใจเพื่อแก้ ปัญหานี้ —ไมนอริตี้คอนเดนเซชันเอ็นโทรปี (MCE) ซึ่งสามารถจัดการกับชุดข้อมูลที่ไม่ ดุลได้อย่างมีประสิทธิภาพต่อมาในปี 2021มีการนำเสนอตัววัดปัจจัยความผิดปกติ เรียกว่า ปัจจัยความผิดปกติแมสเรโชแวเรียนซ์ (MOF)ที่สามารถจัดลำดับตัวอย่างตามความหนาแน่น ของข้อมูลวิทยานิพนธ์นี้นำเสนอขั้นตอนวิธีป่าสุ่มที่ใช้รูปแบบบูตสแทรปที่รวมMOFและ MCE เพื่อสร้างป่าสุ่มที่สามารถจัดการกับชุดข้อมูลสองคลาสที่ไม่ดุลผลการทดลองบนชุด ข้อมูลสังเคราะห์และชุดข้อมูลจริงแสดงให้เห็นว่าขั้นตอนวิธีที่นำเสนอมีประสิทธิภาพมากกว่า ขั้นตอนวิธีที่มีอยู่ในด้านพรีซีชันรีคอลตัววัดเอฟและค่าเฉลี่ยเรขาคณิตแสดงถึงความสามารถ ในการจัดการกับชุดข้อมูลที่ไม่ดุลและประสิทธิภาพที่ดีกว่าในการจำแนกประเภท-
dc.language.isoth-
dc.publisherChulalongkorn University-
dc.rightsChulalongkorn University-
dc.subject.classificationComputer Science-
dc.subject.classificationProfessional, scientific and technical activities-
dc.subject.classificationComputer science-
dc.titleRandom forest algorithm using quartile-patternbootstrapping for class imbalanced problem-
dc.title.alternativeขั้นตอนวิธีป่าสุ่มด้วยบูทสแทรปรูปแบบควอไทล์สําหรับปัญหาคลาสไม่ดุล-
dc.typeThesis-
dc.degree.nameMaster of Science-
dc.degree.levelMaster's Degree-
dc.degree.disciplineApplied Mathematics and Computational Science-
dc.degree.grantorChulalongkorn University-
Appears in Collections:FACULTY OF SCIENCE - THESIS

Files in This Item:
File Description SizeFormat 
6470133423.pdf2.38 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.