Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/47219
Title: การพยากรณ์ด้วยวิธีการถดถอยเชิงเส้นพหุ เมื่อตัวแปรตามมีค่าสูญหาย
Other Titles: Forecasting in multiple linear regression with missing observations in the dependent variable
Authors: วารุณี ตรีบำรุงศักดิ์
Advisors: มานพ วราภักดิ์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: Manop.V@Chula.ac.th
Subjects: การวิเคราะห์การถดถอย
ข้อมูลสูญหาย (สถิติ)
Regression analysis
Missing observations (Statistics)
Issue Date: 2538
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: ในการพยากรณ์ด้วยวิธีการถดถอยเชิงเส้นพหุ วิธีที่นิยมใช้ในการประมาณพารามิเตอร์หรือสัมประสิทธิ์การถดถอยคือวิธีกำลังสองน้อยที่สุด แต่เมื่อมีค่าสังเกตบางค่าสูญหายไปจะไม่สามารถประมาณได้ดีด้วยวิธีดังกล่าว วิธีการแก้ปัญหาทางหนึ่งก็คือตัดค่าสังเกตชุดนั้นทิ้งไป แต่การแก้ปัญหาด้วยวิธีนี้จะมีผลทำให้จำนวนค่าสังเกตน้อยลงและสูญเสียรายละเอียดบางอย่างไป วิธีการแก้ปัญหาอีกทางหนึ่งคือทำการประมาณค่าสังเกตที่สูญหายด้วยวิธีการต่างๆ ก่อนที่จะใช้วีกำลังสองน้อยที่สุด การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการประมาณค่าสูญหายของตัวแปรตามในสมการถดถอยเชิงเส้นพหุเพื่อการพยากรณ์ โดยทำการประมาณค่าสูญหายของตัวแปรตามด้วยวิธีสูญหาย วิธีค่าเฉลี่ย วิธีสมการถดถอย วิธีอีเอ็ม (EM Algorithm) และวิธีการของฮันท์ (Hunt's Method) การเปรียบเทียบกระทำภายใต้สถานการณ์ของขนาดตัวอย่าง 10, 20, 30, 50 และ 70 ค่าเบี่ยงเบนมาตรฐานของความคลาดเคลื่อน 5, 10, 15, 20 และ 25 สัดส่วนการสูญหายของตัวแปรตาม 10%, 20%, 30%, 40%, 50%, และ 70% และลักษณะของตัวแปรอิสระ 3 รูปแบบคือ 1)xlt=t, x2t=t+ut, u~N(0,9), 2)xlt=t, x2t+cos(2¶ t/4), 3)xlt, s2t~ N(20,60) (t=1,2,…,nm+12) ข้อมูลที่ใช้ในการวิจัยได้จากการจำลองด้วยเทคนิคมอนติคาร์โล และทำการทดลอง ซ้ำๆ กัน 200 รอบ สำหรับแต่ละสถานการณ์ที่กำหนดเพื่อประมาณค่าที่สูญหาย และหารากที่สองของค่าเฉลี่ยของความคลาดเคลื่อนกำลังสอง (RMSE) ของค่าพยากรณ์ด้วยวิธีการทั้ง 5 ผลการวิจัยสรุปได้ดังนี้ ในสถานการณ์ที่ขนาดตัวอย่างมีขนาดเล็ก (10-20) เมื่อค่าเบี่ยงเบนมาตรฐานของความคลาดเคลื่อนมีขนาดไม่ใหญ่นัก และสัดส่วนการสูญหายของตัวแปรตามมีจำนวนมาก (60%-70%) วิธีการของฮันท์จะให้ค่าความคลาดเคลื่อน RMSE ของค่าพยากรณ์ต่ำกว่าวิธีการอื่นๆ แต่ตัวค่าเบี่ยงเบนมาตรฐานของความคลาดเคลื่อนมีขนาดเพิ่มขึ้น วิธีค่าเฉลี่ยจะให้ค่าความเคลื่อน RMSE ของค่าพยากรณ์ต่ำกว่าวิธีการอื่นๆ ในทุกสัดส่วนการสูญหายของตัวแปรตาม ส่วนในสถานการณ์ที่ขนาดตัวอย่างมีขนาดปานกลางถึงใหญ่ (30-70) วิธีสูญหายจะเหมาะสมเกือบทุกกรณี นั่นคือถ้าขนาดตัวอย่างใหญ่พอ การตัดชุดข้อมูลสูญหายทิ้งจะมีผลกระทบน้อยมากกับผลการวิเคราะห์การถดถอยเชิงเส้นพหุ โดยใช้วิธีกำลังสองน้อยที่สุด
Other Abstract: In general, the east squares method is used in estimating parameters of linear regression models. The method cannot be accomplished when some of the dependent variable observations are missing. One way to solve this problem is to eliminate the missing observations. But this way will cause a reduction in the number of observations and details of the analysis. Another alternative is to estimate missing data by various methods before using least squares method. The purpose of this research is to compare the estimation of missing observations methods of the dependent variable in multiple linear regression equation of forecasting. The methods estimate missing observations of the dependent variable are the loss method, the mean method, the regression method, EM algorithm, and Hunt's method. The comparisons are done under condition of sample sizes 10, 20, 30, 50, and 70 ; standard deviations of error 5, 10,15, 20, and 25 ; missing proportions 10%, 20%, 30%, 40%, 50%, 60%, and 70%; and 3 models of the independent variables 1)xlt=t, x2t=t+ut, u~N(0,9), 2)xlt=t, x2t+cos(2¶ t/4), 3)xlt, s2t~ N(20,60) (t=1,2,…,nm+12). The experiment is repeated 200 times under each condition in estimating missing observations an evaluating the square root of mean squares error (RMSE) of the 5 methods. Result of the study are as follows:- In case of the small sample size (10-20), not much large standard deviation of error and very arge missing proportions (60%-70%), the RMSE of Hunt's method is lower than the RMSE of other methods, and the RMSE of mean method is lower than the RMSE of other methods in all missing proportion if standard deviation of error increases. When the sample size is medium or large (30-70), the RMSE of loss method is lower than the RMSE of other methods in almost cases, that is, the elimination of missing observations has a small effect on multiple linear regression analysis using the least squares method.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2538
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/47219
ISBN: 9746316028
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Warunee_tr_front.pdf1.72 MBAdobe PDFView/Open
Warunee_tr_ch1.pdf657.56 kBAdobe PDFView/Open
Warunee_tr_ch2.pdf1.1 MBAdobe PDFView/Open
Warunee_tr_ch3.pdf985.56 kBAdobe PDFView/Open
Warunee_tr_ch4.pdf28 MBAdobe PDFView/Open
Warunee_tr_ch5.pdf558.8 kBAdobe PDFView/Open
Warunee_tr_back.pdf3.19 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.