Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/16777
Title: การเปรียบเทียบวิธีการประมาณค่าสัมประสิทธิ์การถดถอยในโลจิสติค กรณีข้อมูลผิดปกติ
Other Titles: Comparative methods of estimating parameters in logistic regression model with outliers
Authors: ไพลิน ชิ้นฟัก
Advisors: กัลยา วานิชย์บัญชา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: fcomkvn@acc.chula.ac.th
Subjects: การวิเคราะห์การถดถอยโลจิสติก
Issue Date: 2552
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการประมาณค่าสัมประสิทธิ์การถดถอยในโลจิสติค กรณีที่มีค่าผิดปกติ โดยทำการศึกษาวิธีการประมาณค่า 4 วิธี คือ วิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Croux และ Haesbroeck วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Rousseeuw และ Christmann วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Daniel และวิธีประมาณค่าสัมประสิทธิ์การถดถอยของ Hobza, Pardo และ Vajda โดยกำหนดให้มีตัวแปรอิสระ X1 และ X2 มีการแจกแจงแบบปกติ และแบบชี้กำลังและกำหนดให้ตัวแปรอิสระในแต่ละการแจกแจงมีค่าผิดปกติ เกณฑ์ที่ใช้เปรียบเทียบ คือร้อยละของค่าคลาดเคลื่อนเฉลี่ยสัมบูรณ์ (Mean Absolute Percentage Error : MAPE) ของตัวประมาณค่าในแต่ละสถานการณ์ของการทดลอง กำหนดขนาดตัวอย่าง เท่ากับ 20, 50, 70, 80, 90 และ 100 กำหนดสัดส่วนการปลอมปน เท่ากับ 0.00, 0.05, 0.10 และ 0.15 กำหนดระดับความรุนแรงของการปลอมปน 2 ระดับ คือ ระดับไม่รุนแรง และระดับรุนแรง กำหนดสัมประสิทธิ์การถดถอย เท่ากับ, และ และการวิจัยครั้งนี้ใช้การทดลองแบบมอนติคาร์โล และทำการทดลองซ้ำๆ กัน จนกว่าค่าประมาณสัมประสิทธิ์ การถดถอยในรอบที่ กับรอบที่ มีค่าน้อยกว่า 0.0001 ผลการวิจัยสรุปได้ดังนี้ ผลการวิจัยปรากฏว่าค่าผิดปกติ สัดส่วนการปลอมปน และขนาดตัวอย่าง มีผลต่อค่า MAPE ของวิธีการประมาณค่าสัมประสิทธิ์การถดถอยทั้ง 4 วิธี โดยค่า MAPE ของทุกวิธีมีแนวโน้มลดลง เมื่อขนาดตัวอย่างเพิ่มขึ้น ขณะที่สัดส่วนการปลอมปนคงที่ และมีแนวโน้มเพิ่มขึ้นเมื่อสัดส่วนการปลอมปนเพิ่มขึ้น ขณะที่ขนาดตัวอย่างคงที่ ส่วนการกำหนดค่าสัมประสิทธิ์การถดถอยที่แตกต่างกันนั้นไม่มีผลต่อค่า MAPE ทั้งกรณีที่ตัวแปรอิสระมีการแจงแบบปกติ และชี้กำลัง พบว่า ส่วนใหญ่วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Daniel เป็นวิธีการประมาณที่ให้ค่า MAPE ต่ำที่สุด โดยเฉพาะเมื่อ ขนาดตัวอย่าง เท่ากับ 20 รองลงมาคือ วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Rousseeuw และ Christmann และวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Croux และ Haesbroeck แต่เมื่อทำการทดสอบจากการวิเคราะห์ความแปรปรวนทางเดียว (One-Way ANOVA) พบว่าค่า MAPE เฉลี่ยของแต่ละวิธีไม่แตกต่างกัน
Other Abstract: The objective of this research is to compare the estimation methods of parameters in logistic regression model with outliers . The estimation methods are Weight Maximum Likelihood Method of Croux and Haesbroeck, Weight Maximum Likelihood Method of Rousseeuw and Christmann, Weight Maximum Likelihood Method of Daniel and Maximum Likelihood Method of Hobza, Pardo and Vajda of parameter. There are two level of outliers, mild and extreme, and four proportions of contamination 0.00, 0.05, 0.10 and 0.15. Mean Absolute Percentage Error (MAPE) is the criterion of comparison. The sample sizes are 20, 50,70,80,90 and 100. Coefficient are, and . Distribution of independent variable are normal and exponential. Simulation data and Monte Carlo method are used to compute MAPE. The experiment was repeated until the difference of parameters between of iteration and less than 0.0001 under each situations. Results of the research are as follows: In most case, Weight Maximum Likelihood Method of Daniel have smallest MAPE ,especially when sample sizes is 20 . Next Weight Maximum Likelihood Method of Rousseeuw and Christmann and Maximum Likelihood Method of Hobza, Pardo and Vajda and Weight Maximum Likelihood Method of Croux and Haesbroeck repectively. MAPE of multivariate normal of independent less than exponential. MAPE of parameters increase when level of outliers and proportion of outliers contamination increase but they decrease when sample sizes increase. The level of outliers, proportion of outliers contamination and sample sizes have effected on parameters estimates. But differentness of coefficient have not effected on parameters estimates
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2552
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/16777
URI: http://doi.org/10.14457/CU.the.2009.1392
metadata.dc.identifier.DOI: 10.14457/CU.the.2009.1392
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
Pailin_ch.pdf7.34 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.