การเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่องจากข้อมูลอนุกรมเวลาโดยวิธีการช่วงเวลาที่ช้ากว่ากัน

รายละเอียด

ปัญหาพิเศษนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่อง ในการพยากรณ์ข้อมูลอนุกรมเวลา โดยใช้วิธีช่วงเวลาที่ล่าช้ากว่ากัน แบ่งออกเป็น 3 ช่วงเวลา คือ ช่วงเวลาที่ช้ากว่ากัน 10 หน่วย ช่วงเวลาที่ช้ากว่ากัน 15 หน่วย และช่วงเวลาที่ช้ากว่ากัน 20 หน่วย มาใช้เป็นตัวแปรอิสระ และใช้วิธีการเรียนรู้ด้วยเครื่องมีทั้งหมด 4 วิธี ได้แก่ วิธีต้นไม้ตัดสินใจ วิธีป่าสุ่ม วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ และวิธีซัพพอร์ตเวกเตอร์แมชชีน โดยการจำลองข้อมูลอนุกรมเวลาที่เป็นตัวแปรอิสระที่มีลักษณะหลากหลาย ได้แก่ ข้อมูลที่มีลักษณะการเดินแบบสุ่ม ข้อมูลที่มีลักษณะมีแนวโน้ม และข้อมูลที่มีลักษณะไม่เชิงเส้น ซึ่งมีขนาดตัวอย่าง 100, 300, 500 และ 700 วิธีดำเนินการวิจัยนี้ทำการแบ่งข้อมูลเป็นฝึกฝน 90% และข้อมูลทดสอบ 10% โดยใช้โปรแกรมอาร์ในการจำลองและวิเคราะห์ข้อมูล โดยทำซ้ำเป็นจำนวน 1000 รอบ และทำการหาค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ที่ต่ำที่สุดเพื่อแสดงว่าวิธีใดดีที่สุด ผลการวิจัยพบว่าข้อมูลมีลักษณะการเดินแบบสุ่มวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลมีลักษณะแนวโน้มวิธีที่ดีสุด คือวิธีป่าสุ่มและข้อมูลมีลักษณะไม่เชิงเส้นวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน และเมื่อนำมาทดสอบกับข้อมูลจริง พบว่าข้อมูลค่าเงิน 1 ยูโร ต่อบาทวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลดัชนี S&P 500 ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีป่าสุ่ม และข้อมูลดัชนี Bank of America Corp ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน

วัตถุประสงค์

ปัจจุบันเทคโนโลยีสารสนเทศมีบทบาทสำคัญต่อการดำรงชีวิตของมนุษย์ ทำให้มีการพัฒนาเทคโนโลยีเพื่ออำนวยความสะดวกต่อการดำรงชีวิตของมนุษย์ มีแหล่งข้อมูลข่าวสารที่ทันสมัย รวมถึงแหล่งข้อมูลขนาดใหญ่ที่เรียกกว่าข้อมูลมหัต (Big Data) เป็นข้อมูลที่มีปริมาณมาก (Volume) มีความเปลี่ยนแปลงอย่างรวดเร็วอยู่ตลอดเวลา (Velocity) และมีความหลากหลายสูง (Variety) เนื่องจากคุณสมบัติเหล่านี้จัดเป็นอุปสรรคหรือปัญหาของ ข้อมูลขนาดใหญ่ที่ไม่สามารถนำข้อมูลมาใช้ประโยชน์ได้ทันทีจึงต้องมีกระบวนการจัดการข้อมูล ขนาดใหญ่เสียก่อน โดยใช้วิธีการเรียนรู้ของเครื่อง (Machine Learning) เข้ามาเกี่ยวข้อง การเรียนรู้ด้วยเครื่อง (Machine Learning) คือวิทยาการคอมพิวเตอร์ประเภทหนึ่ง เกี่ยวข้องกับการศึกษาและสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ สามารถแบ่งการเรียนรู้ของเครื่องออกเป็น 2 กลุ่มประกอบด้วย การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning) คือการวิเคราะห์ข้อมูลที่ไม่มีตัวแปรตามหรือคำตอบกำกับไว้ มุ่งเน้นไปที่การหาความสัมพันธ์ระหว่างข้อมูลและการแบ่งกลุ่มเพื่อลดมิติของข้อมูล เช่น การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis) ซึ่งได้รับความนิยมใช้เพื่อลดมิติของข้อมูลและการแบ่งกลุ่มข้อมูลด้วยคุณลักษณะต่าง ๆ และการเรียนรู้แบบมีผู้สอน (Supervised Learning) คือการวิเคราะห์ข้อมูลที่มีตัวแปรตามหรือคำตอบกำกับไว้ ถ้าตัวแปรตามเป็นเชิงปริมาณจะเป็นการพยากรณ์ข้อมูลอนุกรมเวลา (Time series) แต่ถ้าตัวแปรตามเป็นเชิงคุณภาพจะเป็นการวิเคราะห์การจำแนก (Classification) โดยเทคนิคที่นิยมใช้อย่างแพร่หลายได้แก่ การถดถอยโลจิสติกส์ (Logistic Regression) ต้นไม้ตัดสินใจ (Decision Tree) เทคนิคป่าสุ่ม (Random Forest) และโครงข่ายประสาทเทียม (Artificial Neural Network) เป็นต้น การจำแนกถูกนำมาประยุกต์ใช้ในงานวิจัยในหลายด้าน (วริทธิ์พล , 2565) ข้อมูลอนุกรมเวลา (Time Series) คือ ชุดข้อมูลที่รวบรวมและจัดเก็บตามลำดับ ต่อเนื่องกันภายใต้การเพิ่มขึ้นของเวลา โดยข้อมูลดังกล่าวจะถูกเก็บรวบรวมอย่างต่อเนื่องในระยะเวลาติดต่อกัน ตามช่วงเวลาที่ต้องการ เช่น ข้อมูลราคาทองคำ ข้อมูลปริมาณน้ำในเขื่อน ซึ่งจะถูกบันทึกข้อมูลเป็นวัน ในบางกรณี การจัดเก็บข้อมูลอาจมีลักษณะการจัดเก็บแบบเป็นช่วงเวลาต่อเนื่องกัน เพื่อสร้างตัวแบบอนุกรมเวลา (Time Series Model) ในการทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคตโดยการวิเคราะห์อนุกรมเวลา (Time Series Analysis) ในการวิเคราะห์อนุกรมเวลา ส่วนใหญ่ข้อมูลอนุกรมเวลาเป็นข้อมูลที่เยอะ ซับซ้อน และมีการเปลี่ยนแปลงอยู่ตลอดเวลา จึงทำให้ยากต่อการหาวิธีที่ดีที่สุดในการพยากรณ์ จึงได้มีการนำการเรียนรู้ด้วยเครื่องมาใช้ในการวิเคราะห์ข้อมูล เพราะ วิธีการเรียนรู้ด้วยเครื่องมีประสิทธิภาพในการวิเคราะห์ข้อมูลอนุกรมเวลามากกว่า (พรทิวา , 2564) โดยทั่วไปในการวิเคราะห์อนุกรมเวลาจะใช้ตัวแปรเพียงตัวเดียว แต่ในวิธีของการเรียนรู้ด้วยเครื่องจะมีการใช้ตัวแปรอิสระ ( ) มาช่วยในการพยากรณ์ ในการวิจัยครั้งนี้จึงสนใจนำช่วงเวลาที่ช้ากว่ากัน (Lag) ของข้อมูลอนุกรมเวลา เข้ามาเป็นตัวแปรอิสระ โดยตัวแปรตาม ( ) คือ ข้อมูลอนุกรมเวลาชุดเดิม แล้วจึงนำไปวิเคราะห์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบด้วย วิธีต้นไม้ตัดสินใจ (Decision Tree) ป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยแต่ละวิธีจะทำการศึกษาเกี่ยวกับการวัดความถูกต้องและความผิดพลาดในการจำแนกข้อมูล Lai et al. (2023) งานวิจัยนี้เกี่ยวกับการพยากรณ์สถานการณ์ปัจจุบันของโควิด 19 โดยใช้ข้อมูลน้ำเสีย ให้ผู้ป่วยโควิด 19 เป็นตัวแปร และให้ปริมาณไวรัสในตัวอย่างน้ำเสียเป็นตัวแปร ผู้วิจัยไม่ทราบตัวแปร จึงได้ใช้วิธีช่วงเวลาที่ช้ากว่ากัน (Lag) เอามาช่วยในการพยากรณ์ตัวแปร พอทราบค่าได้นำไปพยากรณ์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบไปด้วย แบบจำลองอารีแมกซ์ (Autoregressive Integrated Moving Average with Exogenous Variables : ARIMAX) และการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา (Time Series Machine Learning : TSML) โดยเทคนิคที่ดีที่สุด คือ วิธีการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา พรทิวา (2564) งานวิจัยนี้เกี่ยวกับระบบวิเคราะห์ข้อมูลอนุกรมเวลาด้วยเทคนิคทางการเรียนรู้ของเครื่อง โดยเปรียบเทียบวิธีพยากรณ์ออกเป็น 3 เทคนิคประกอบไปด้วยเทคนิควิเคราะห์การถดถอยพหุคูณ (Multiple Linear Regression) วิธีต้นไม้ตัดสินใจ (Decision Tree) และ วิธีป่าสุ่ม (Random Forest) โดยใช้การคัดเลือกเทคนิคที่เหมาะสมที่สุดสำหรับการพยากรณ์โดยใช้เกณฑ์ค่าเฉลี่ยของค่าสัมบูรณ์เปอร์เซ็นต์ความคลาดเคลื่อน (Mean Absolute Percentage Error, MAPE) ต่ำที่สุดผลวิจัยพบว่าการเปรียบเทียบเทคนิคระหว่างวิธีต้นไม้ตัดสินใจ วิธีป่าไม้สุ่ม และ การถดถอยพหุคูณ สำหรับการพยากรณ์ยอดขายรวมรายวันแยกตามรายสินค้าและจำนวนผู้เสียชีวิตรายใหม่จาก สถานการณ์ COVID-19 ในประเทศไทยพบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ เทคนิคป่าสุ่ม Kayode-Ajala. (2022) งานวิจัยนี้เกี่ยวกับการประยุกต์ใช้อัลกอริทึมการเรียนรู้ของเครื่อง ในการตรวจจับเว็บไซต์ที่เป็นแฟร์ชิ่ง ซึ่งใช้วิธีการเรียนรู้ด้วยเครื่องประกอบด้วย วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) วิธีต้นไม้ตัดสินใจ (Decision Trees) และ วิธีป่าสุ่ม (Random Forest) ซึ่งวิธีที่ดีที่สุดคือ วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ Ballı (2021) งานวิจัยนี้เกี่ยวกับการวิเคราะห์ข้อมูลของการระบาดโควิด-19 และการพยากรณ์จำนวนผู้ติดเชื้อรวมในระยะสั้นๆ โดยใช้เทคนิคการเรียนรู้ด้วยเครื่องประกอบวิธีการถดถอยเชิงเส้น (Linear regression) วิธีโครงข่ายประสาทเทียมแบบเพอร์เซ็ปตรอนหลายชั้น (multi-layer perceptron) วิธีป่าสุ่ม (random forest) วิธีนาอีฟ เบย์ (Naive Bayes) และ วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) พบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ วิธีซัพพอร์ตเวกเตอร์แมชชีน Bemthuis et al. (2023) งานวิจัยนี้เกี่ยวกับระบบสนับสนุนการตัดสินใจ (Decision Support Systems) กำลังพัฒนาไปในทิศทางที่ซับซ้อนมากขึ้น โดยมุ่งหวังที่จะทำให้การตัดสินใจเป็นไปโดยอัตโนมัติมากที่สุด จึงวิธีการที่ใช้เทคนิคการจำแนกประเภทด้วยต้นไม้การตัดสินใจ และเปรียบเทียบประสิทธิภาพกับผลลัพธ์ที่ได้จากการใช้เทคนิคสนับสนุนเวกเตอร์แมชชีน การทดลองของเราพบว่า วิธีการของเรามีความแม่นยำและความยืดหยุ่นในด้านการดึงกฎทางธุรกิจ ต้นไม้การตัดสินใจ จากการศึกษางานวิจัยที่เกี่ยวข้องทางผู้วิจัยจึงสนใจศึกษาการเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่องจากข้อมูลอนุกรมเวลา โดยวิธีการช่วงเวลาที่ช้ากว่ากัน ซึ่งประกอบไปด้วยวิธีต้นไม้ตัดสินใจ (Decision Tree) วิธีป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยพิจารณาค่าเฉลี่ยของค่าคาดเคลื่อนกำลังสองเฉลี่ย (Mean Square Error: AMSE) และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ (Mean Absolute Percentage Error: AMAPE) เป็นเกณฑ์ในการวัดประสิทธิภาพของแบบจำลอง และเป็นแนวทางการในการเปรียบเทียบประสิทธิภาพด้วยวิธีการเรียนรู้ด้วยเครื่อง เพื่อตัดสินใจในการเลือกแบบจำลองที่ดีที่สุด

ให้คะแนนวัตกรรมนี้

หมดเวลาโหวตนวัตกรรมแล้ว

รายละเอียด

ประเภทนวัตกรรม

#Education and Learning Technologies#KMITL Expo 2025

หน่วยงาน

คณะวิทยาศาสตร์

ผู้จัดทำ

ภท

ภราดร ทรัพย์มั่นคงสิน

นักศึกษาผู้ดูแล

กถ

กุลนิตร ถนอมสังข์

นักศึกษาสมาชิก

ลท

ลิศา ทองเย็น

นักศึกษาสมาชิก

ออ

อัชฌา อระวีพร

อาจารย์ที่ปรึกษา

นวัตกรรมอื่น ๆ

คณะวิศวกรรมศาสตร์

แอปพลิเคชันจัดการอาหารสำหรับผู้ป่วยเบาหวาน

แอปพลิเคชันจัดการมื้ออาหารสำหรับผู้ป่วยเบาหวาน เป็นเครื่องมือด้านสุขภาพดิจิทัลที่ออกแบบมาเพื่อเสริมศักยภาพผู้ป่วยเบาหวานชนิดที่ 2 ในการจัดการด้านอาหารและระดับน้ำตาลในเลือดได้อย่างมีประสิทธิภาพมากขึ้น ด้วยฟีเจอร์ต่าง ๆ เช่น คำแนะนำมื้ออาหารที่ปรับให้เหมาะกับแต่ละบุคคล การติดตามสารอาหาร และการเชื่อมต่อแอปพลิเคชันกับอุปกรณ์วัดระดับน้ำตาลในเลือด (CGM) แอปพลิเคชันนี้ช่วยให้ผู้ใช้สามารถติดตามระดับน้ำตาลได้แบบเรียลไทม์ และปรับเปลี่ยนการเลือกรับประทานอาหารได้อย่างเหมาะสม พัฒนาด้วยเฟรมเวิร์ก Flutter และรองรับด้วย Back-end Express.js และ MongoDB แอปพลิเคชันนี้ให้ความสำคัญกับการออกแบบส่วนติดต่อผู้ใช้ที่ใช้งานง่าย เพื่อให้มั่นใจว่าจะสามารถส่งเสริมการวางแผนมื้ออาหารและการติดตามสุขภาพได้อย่างมีประสิทธิภาพ การทดลองใช้งานเบื้องต้นแสดงให้เห็นว่าแอปพลิเคชันนี้มีส่วนช่วยให้ระดับน้ำตาลในเลือดมีความคงที่มากขึ้นและเพิ่มการปฏิบัติตามคำแนะนำด้านอาหารได้ดีขึ้น ช่วยให้ผู้ใช้ลดความเสี่ยงด้านสุขภาพที่เกี่ยวข้องกับภาวะแทรกซ้อนของโรคเบาหวาน ด้วยการนำเสนอแนวทางในการหลักเลี่ยงตัวแปรของการเกิดโรคเบาหวาน แอปพลิเคชันนี้ช่วยลดความจำเป็นในการเข้ารับการรักษาทางคลินิกบ่อยครั้ง จึงมีศักยภาพในการลดค่าใช้จ่ายทางการแพทย์ในระยะยาว โดยแสดงให้เห็นถึงบทบาทที่น่าสนใจของโซลูชันด้านสุขภาพดิจิทัลในการสนับสนุนการดูแลโรคเบาหวานแบบเฉพาะบุคคล และเน้นย้ำถึงศักยภาพของการขยายขนาดและเน้นผู้ใช้เป็นศูนย์กลาง ซึ่งส่งเสริมการพัฒนาสุขภาพในระยะยาวสำหรับผู้ป่วยเบาหวาน

อ่านเพิ่มเติม

คณะสถาปัตยกรรม ศิลปะและการออกแบบ

กระแสแห่งชน

แบบจำลองเชิงแนวคิด (conceptual model) ที่ได้แรงบันดาลใจมาจากแนวคิด Form follows function และความเรียบง่ายของสถาปัตยกรรมสมัยใหม่ (Modern Architecture) โดยออกแบบเป็นผลงานสามมิติที่ลดทอนมาจากรูปทรงของเก้าอี้เพื่อสื่อถึงการใช้งาน เน้นความเรียบง่ายด้วยเส้น ระนาบ และรูปทรงเรขาคณิต แสดงถึงความงามที่เกิดจากการทำงานร่วมกันระหว่างประโยชน์ใช้สอยและรูปทรงที่เรียบง่ายดังเช่นแนวคิดของสถาปัตยกรรมสมัยใหม่

อ่านเพิ่มเติม

คณะวิศวกรรมศาสตร์

ระบบตรวจจับและระบุตำแหน่งผลมะม่วงแบบสามมิติ

การประเมินผลผลิตของผลมะม่วง และพฤติกรรมของผู้บริโภคที่มีความตระหนักถึงที่มาของผลผลิตมากยิ่งขึ้น ต้องการตรวจสอบย้อนกลับถึงที่มาของผลผลิตว่าผลผลิตนั้นๆได้รับการดูแลมาอย่างไรผ่านการระบุตำแหน่งของผลนั้นๆ ความเกี่ยวเนื่องกันถึงลักษะของผลผลิตที่เป็นผลมาจากวิธีการดูแลผลหรือต้นของผลผลิตในขณะที่ยังไม่ถูกเก็บเกี่ยว ดังนั้นเพื่อสร้างแบบจำลองที่สามารถตรวจจับและระบุตำแหน่งของผลมะม่วง โดยใช้ภาพถ่าย 2 มิติ ด้วยวิธีการ Deep Learning Model และเพื่อศึกษาเทคนิคการระบุพิกัดของผลมะม่วงในโลกจริงจากภาพภาพ 2 มิติ มีการใช้โมเดล YOLOv8 เพื่อ Object detection ร่วมกับเทคนิคการสอบเทียบกล้อง (Camera Calibration) และ Triangulation เพื่อหาตำแหน่ง 3 มิติ ของผลมะม่วงในภาพที่ถูกตรวจจับได้ จากการทำการทดลองหาตำแหน่งทั้งหมด 125 ครั้ง ที่มีการสุ่มค่าตำแหน่งของผลมะม่วง และตำแหน่งของกล้องที่มีมุม Yaw และ Pitch ที่แตกต่างกัน โดยการใช้ค่า Parameter จากรูปที่ถ่ายถัดไปมาเปรียบเทียบกันเพื่อหาตำแหน่งจริง 3 มิติ ที่ได้ผลความถูกต้องที่..... จากการใช้โมเดล YOLOv8 ที่มีค่าทำนาย Precision, Recall, mAP50, mAP50-95 และ F1-Score ได้แก่ 0.928, 0.901, 0.965, 0.785 และ 0.914 ตามลำดับ ซึ่งมีความแม่นยำที่มากพอเพื่อทำนายตำแหน่งของผลมะม่วงที่มีความคลาดเคลื่อนประมาณ 38 เซนติเมตร

อ่านเพิ่มเติม