กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้: http://dspace.lib.buu.ac.th/xmlui/handle/1234567890/1409
ชื่อเรื่อง: วิธีการที่เหมาะสมสำหรับการแบ่งกลุ่มข้อมูลที่ไม่สมดุลสูง
ชื่อเรื่องอื่นๆ: Optimal methods for classification of highly imbalanced datasets
ผู้แต่ง/ผู้ร่วมงาน: เบญจภรณ์ จันทรกองกุล
สุวรรณา รัศมีขวัญ
สุนิสา ริมเจริญ
ภูสิต กุลเกษม
กฤษณะ ชินสาร
อัณณ์นุพันธ์ รอดทุกข์
ปิยนุช วรบุตร
จรรยา อ้นปันส์
มหาวิทยาลัยบูรพา. คณะวิทยาการสารสนเทศ
คำสำคัญ: ข้อมูล
สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์
วันที่เผยแพร่: 2557
สำนักพิมพ์: คณะวิทยาการสารสนเทศ มหาวิทยาลัยบูรพา
บทคัดย่อ: วัตถุประสงค์ของขั้นตอนวิธีในการเรียนรู้คือ เพื่อให้เกิดอัตราความผิดพลาดในการเรียนรู้ข้อมูลน้อยที่สุด โดยในงานวิจัยนี้ได้ทำการปรับปรุงฟังก์ชั่นความผิดพลาดที่ใช้วัดอัตราความผิดพลาดสำหรับชุดข้อมูลที่ไม่สมดุลได้อย่างเหมาะสม ซึ่งฟังก์ชันความผิดพลาดส่วนใหญ่จะใช้ค่าน้ำหนักที่เท่ากันทุกคลาส จากที่ทราบกันโดยทั่วไป ข้อมูลที่ไม่สมดุล หมายถึง ชุดข้อมูลที่มีจำนวนสมาชิกของคลาสส่วนมากและคลาสส่วนน้อยจำนวนไม่เท่ากัน ดังนั้นหากใช้ค่าน้ำหนักเท่ากันทุกคลาสจะทำให้การจัดกลุ่มไม่เหมาะสม และปัญหาของการเรียนรู้รูปแบบข้อมูลของชุดข้อมูลไม่สมดุลส่วนใหญ่ พบว่าข้อมูลในคลาสส่วนน้อยถูกครอบงำด้วยข้อมูลของคลาสส่วนมาก จึงเป็นผลให้เกิดความเอนเอียงในการจำแนกข้อมูลทำให้ข้อมูลในคลาสส่วนน้อยเกิดความผิดพลาดในการจำแนกกลุ่มมากกว่าคลาสส่วนมาก จากที่กล่าวมางานวิจัยนี้จึงได้ทำการหาพารามิเตอร์ที่เหมาะสมสำหรับปรับปรุงฟังก์ชั่นความผิดพลาดเฉลี่ยกำลังสอง โดบวิธีการที่นำเสนอได้นำอัตราการซ้อนทับกันของข้อมูลและอัตราความไม่สมดุลของข้อมูลมาใช้ร่วมในการปรับปรุงด้วย สำหรับขั้นตอนวิธีในการเรียนรู้ข้อมูลได้ใช้โครงข่ายประสาทเทียมแบบแพร่ย้อนกลับและฟังก์ชั่นความผิดพลาดที่ทำการปรับปรุง ขอบเขตของชุดข้อมูลที่ใช้ในงานวิจัยนี้เป็นปัญหาการจำแนกชุดข้อมูลที่มี 2 คลาส จาก UCI ผลการทดลองแสดงให้เห็นว่าฟังก์ชันความผิดพลาดที่ทำการปรับปรุงให้ประสิทธิภาพในการจำแนกข้อมูลดีกว่าฟังก์ชั่นความผิดพลาดเฉลี่ยกำลังสองแบบมาตรฐาน เมื่อเปรียบเทียบกับค่า TPR ค่า G-Mean และ F-measurement
URI: http://dspace.lib.buu.ac.th/xmlui/handle/1234567890/1409
ปรากฏในกลุ่มข้อมูล:งานวิจัย

แฟ้มในรายการข้อมูลนี้:
แฟ้ม ขนาดรูปแบบ 
2559_047.pdf21.29 MBAdobe PDFดู/เปิด


รายการทั้งหมดในระบบคิดีได้รับการคุ้มครองลิขสิทธิ์ มีการสงวนสิทธิ์เว้นแต่ที่ระบุไว้เป็นอื่น