KMITL Innovation Expo 2025 Logo

การเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่องจากข้อมูลอนุกรมเวลาโดยวิธีการช่วงเวลาที่ช้ากว่ากัน

รายละเอียด

ปัญหาพิเศษนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่อง ในการพยากรณ์ข้อมูลอนุกรมเวลา โดยใช้วิธีช่วงเวลาที่ล่าช้ากว่ากัน แบ่งออกเป็น 3 ช่วงเวลา คือ ช่วงเวลาที่ช้ากว่ากัน 10 หน่วย ช่วงเวลาที่ช้ากว่ากัน 15 หน่วย และช่วงเวลาที่ช้ากว่ากัน 20 หน่วย มาใช้เป็นตัวแปรอิสระ และใช้วิธีการเรียนรู้ด้วยเครื่องมีทั้งหมด 4 วิธี ได้แก่ วิธีต้นไม้ตัดสินใจ วิธีป่าสุ่ม วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ และวิธีซัพพอร์ตเวกเตอร์แมชชีน โดยการจำลองข้อมูลอนุกรมเวลาที่เป็นตัวแปรอิสระที่มีลักษณะหลากหลาย ได้แก่ ข้อมูลที่มีลักษณะการเดินแบบสุ่ม ข้อมูลที่มีลักษณะมีแนวโน้ม และข้อมูลที่มีลักษณะไม่เชิงเส้น ซึ่งมีขนาดตัวอย่าง 100, 300, 500 และ 700 วิธีดำเนินการวิจัยนี้ทำการแบ่งข้อมูลเป็นฝึกฝน 90% และข้อมูลทดสอบ 10% โดยใช้โปรแกรมอาร์ในการจำลองและวิเคราะห์ข้อมูล โดยทำซ้ำเป็นจำนวน 1000 รอบ และทำการหาค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ที่ต่ำที่สุดเพื่อแสดงว่าวิธีใดดีที่สุด ผลการวิจัยพบว่าข้อมูลมีลักษณะการเดินแบบสุ่มวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลมีลักษณะแนวโน้มวิธีที่ดีสุด คือวิธีป่าสุ่มและข้อมูลมีลักษณะไม่เชิงเส้นวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน และเมื่อนำมาทดสอบกับข้อมูลจริง พบว่าข้อมูลค่าเงิน 1 ยูโร ต่อบาทวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลดัชนี S&P 500 ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีป่าสุ่ม และข้อมูลดัชนี Bank of America Corp ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน

วัตถุประสงค์

ปัจจุบันเทคโนโลยีสารสนเทศมีบทบาทสำคัญต่อการดำรงชีวิตของมนุษย์ ทำให้มีการพัฒนาเทคโนโลยีเพื่ออำนวยความสะดวกต่อการดำรงชีวิตของมนุษย์ มีแหล่งข้อมูลข่าวสารที่ทันสมัย รวมถึงแหล่งข้อมูลขนาดใหญ่ที่เรียกกว่าข้อมูลมหัต (Big Data) เป็นข้อมูลที่มีปริมาณมาก (Volume) มีความเปลี่ยนแปลงอย่างรวดเร็วอยู่ตลอดเวลา (Velocity) และมีความหลากหลายสูง (Variety) เนื่องจากคุณสมบัติเหล่านี้จัดเป็นอุปสรรคหรือปัญหาของ ข้อมูลขนาดใหญ่ที่ไม่สามารถนำข้อมูลมาใช้ประโยชน์ได้ทันทีจึงต้องมีกระบวนการจัดการข้อมูล ขนาดใหญ่เสียก่อน โดยใช้วิธีการเรียนรู้ของเครื่อง (Machine Learning) เข้ามาเกี่ยวข้อง การเรียนรู้ด้วยเครื่อง (Machine Learning) คือวิทยาการคอมพิวเตอร์ประเภทหนึ่ง เกี่ยวข้องกับการศึกษาและสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ สามารถแบ่งการเรียนรู้ของเครื่องออกเป็น 2 กลุ่มประกอบด้วย การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning) คือการวิเคราะห์ข้อมูลที่ไม่มีตัวแปรตามหรือคำตอบกำกับไว้ มุ่งเน้นไปที่การหาความสัมพันธ์ระหว่างข้อมูลและการแบ่งกลุ่มเพื่อลดมิติของข้อมูล เช่น การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis) ซึ่งได้รับความนิยมใช้เพื่อลดมิติของข้อมูลและการแบ่งกลุ่มข้อมูลด้วยคุณลักษณะต่าง ๆ และการเรียนรู้แบบมีผู้สอน (Supervised Learning) คือการวิเคราะห์ข้อมูลที่มีตัวแปรตามหรือคำตอบกำกับไว้ ถ้าตัวแปรตามเป็นเชิงปริมาณจะเป็นการพยากรณ์ข้อมูลอนุกรมเวลา (Time series) แต่ถ้าตัวแปรตามเป็นเชิงคุณภาพจะเป็นการวิเคราะห์การจำแนก (Classification) โดยเทคนิคที่นิยมใช้อย่างแพร่หลายได้แก่ การถดถอยโลจิสติกส์ (Logistic Regression) ต้นไม้ตัดสินใจ (Decision Tree) เทคนิคป่าสุ่ม (Random Forest) และโครงข่ายประสาทเทียม (Artificial Neural Network) เป็นต้น การจำแนกถูกนำมาประยุกต์ใช้ในงานวิจัยในหลายด้าน (วริทธิ์พล , 2565) ข้อมูลอนุกรมเวลา (Time Series) คือ ชุดข้อมูลที่รวบรวมและจัดเก็บตามลำดับ ต่อเนื่องกันภายใต้การเพิ่มขึ้นของเวลา โดยข้อมูลดังกล่าวจะถูกเก็บรวบรวมอย่างต่อเนื่องในระยะเวลาติดต่อกัน ตามช่วงเวลาที่ต้องการ เช่น ข้อมูลราคาทองคำ ข้อมูลปริมาณน้ำในเขื่อน ซึ่งจะถูกบันทึกข้อมูลเป็นวัน ในบางกรณี การจัดเก็บข้อมูลอาจมีลักษณะการจัดเก็บแบบเป็นช่วงเวลาต่อเนื่องกัน เพื่อสร้างตัวแบบอนุกรมเวลา (Time Series Model) ในการทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคตโดยการวิเคราะห์อนุกรมเวลา (Time Series Analysis) ในการวิเคราะห์อนุกรมเวลา ส่วนใหญ่ข้อมูลอนุกรมเวลาเป็นข้อมูลที่เยอะ ซับซ้อน และมีการเปลี่ยนแปลงอยู่ตลอดเวลา จึงทำให้ยากต่อการหาวิธีที่ดีที่สุดในการพยากรณ์ จึงได้มีการนำการเรียนรู้ด้วยเครื่องมาใช้ในการวิเคราะห์ข้อมูล เพราะ วิธีการเรียนรู้ด้วยเครื่องมีประสิทธิภาพในการวิเคราะห์ข้อมูลอนุกรมเวลามากกว่า (พรทิวา , 2564) โดยทั่วไปในการวิเคราะห์อนุกรมเวลาจะใช้ตัวแปรเพียงตัวเดียว แต่ในวิธีของการเรียนรู้ด้วยเครื่องจะมีการใช้ตัวแปรอิสระ ( ) มาช่วยในการพยากรณ์ ในการวิจัยครั้งนี้จึงสนใจนำช่วงเวลาที่ช้ากว่ากัน (Lag) ของข้อมูลอนุกรมเวลา เข้ามาเป็นตัวแปรอิสระ โดยตัวแปรตาม ( ) คือ ข้อมูลอนุกรมเวลาชุดเดิม แล้วจึงนำไปวิเคราะห์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบด้วย วิธีต้นไม้ตัดสินใจ (Decision Tree) ป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยแต่ละวิธีจะทำการศึกษาเกี่ยวกับการวัดความถูกต้องและความผิดพลาดในการจำแนกข้อมูล Lai et al. (2023) งานวิจัยนี้เกี่ยวกับการพยากรณ์สถานการณ์ปัจจุบันของโควิด 19 โดยใช้ข้อมูลน้ำเสีย ให้ผู้ป่วยโควิด 19 เป็นตัวแปร และให้ปริมาณไวรัสในตัวอย่างน้ำเสียเป็นตัวแปร ผู้วิจัยไม่ทราบตัวแปร จึงได้ใช้วิธีช่วงเวลาที่ช้ากว่ากัน (Lag) เอามาช่วยในการพยากรณ์ตัวแปร พอทราบค่าได้นำไปพยากรณ์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบไปด้วย แบบจำลองอารีแมกซ์ (Autoregressive Integrated Moving Average with Exogenous Variables : ARIMAX) และการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา (Time Series Machine Learning : TSML) โดยเทคนิคที่ดีที่สุด คือ วิธีการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา พรทิวา (2564) งานวิจัยนี้เกี่ยวกับระบบวิเคราะห์ข้อมูลอนุกรมเวลาด้วยเทคนิคทางการเรียนรู้ของเครื่อง โดยเปรียบเทียบวิธีพยากรณ์ออกเป็น 3 เทคนิคประกอบไปด้วยเทคนิควิเคราะห์การถดถอยพหุคูณ (Multiple Linear Regression) วิธีต้นไม้ตัดสินใจ (Decision Tree) และ วิธีป่าสุ่ม (Random Forest) โดยใช้การคัดเลือกเทคนิคที่เหมาะสมที่สุดสำหรับการพยากรณ์โดยใช้เกณฑ์ค่าเฉลี่ยของค่าสัมบูรณ์เปอร์เซ็นต์ความคลาดเคลื่อน (Mean Absolute Percentage Error, MAPE) ต่ำที่สุดผลวิจัยพบว่าการเปรียบเทียบเทคนิคระหว่างวิธีต้นไม้ตัดสินใจ วิธีป่าไม้สุ่ม และ การถดถอยพหุคูณ สำหรับการพยากรณ์ยอดขายรวมรายวันแยกตามรายสินค้าและจำนวนผู้เสียชีวิตรายใหม่จาก สถานการณ์ COVID-19 ในประเทศไทยพบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ เทคนิคป่าสุ่ม Kayode-Ajala. (2022) งานวิจัยนี้เกี่ยวกับการประยุกต์ใช้อัลกอริทึมการเรียนรู้ของเครื่อง ในการตรวจจับเว็บไซต์ที่เป็นแฟร์ชิ่ง ซึ่งใช้วิธีการเรียนรู้ด้วยเครื่องประกอบด้วย วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) วิธีต้นไม้ตัดสินใจ (Decision Trees) และ วิธีป่าสุ่ม (Random Forest) ซึ่งวิธีที่ดีที่สุดคือ วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ Ballı (2021) งานวิจัยนี้เกี่ยวกับการวิเคราะห์ข้อมูลของการระบาดโควิด-19 และการพยากรณ์จำนวนผู้ติดเชื้อรวมในระยะสั้นๆ โดยใช้เทคนิคการเรียนรู้ด้วยเครื่องประกอบวิธีการถดถอยเชิงเส้น (Linear regression) วิธีโครงข่ายประสาทเทียมแบบเพอร์เซ็ปตรอนหลายชั้น (multi-layer perceptron) วิธีป่าสุ่ม (random forest) วิธีนาอีฟ เบย์ (Naive Bayes) และ วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) พบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ วิธีซัพพอร์ตเวกเตอร์แมชชีน Bemthuis et al. (2023) งานวิจัยนี้เกี่ยวกับระบบสนับสนุนการตัดสินใจ (Decision Support Systems) กำลังพัฒนาไปในทิศทางที่ซับซ้อนมากขึ้น โดยมุ่งหวังที่จะทำให้การตัดสินใจเป็นไปโดยอัตโนมัติมากที่สุด จึงวิธีการที่ใช้เทคนิคการจำแนกประเภทด้วยต้นไม้การตัดสินใจ และเปรียบเทียบประสิทธิภาพกับผลลัพธ์ที่ได้จากการใช้เทคนิคสนับสนุนเวกเตอร์แมชชีน การทดลองของเราพบว่า วิธีการของเรามีความแม่นยำและความยืดหยุ่นในด้านการดึงกฎทางธุรกิจ ต้นไม้การตัดสินใจ จากการศึกษางานวิจัยที่เกี่ยวข้องทางผู้วิจัยจึงสนใจศึกษาการเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่องจากข้อมูลอนุกรมเวลา โดยวิธีการช่วงเวลาที่ช้ากว่ากัน ซึ่งประกอบไปด้วยวิธีต้นไม้ตัดสินใจ (Decision Tree) วิธีป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยพิจารณาค่าเฉลี่ยของค่าคาดเคลื่อนกำลังสองเฉลี่ย (Mean Square Error: AMSE) และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ (Mean Absolute Percentage Error: AMAPE) เป็นเกณฑ์ในการวัดประสิทธิภาพของแบบจำลอง และเป็นแนวทางการในการเปรียบเทียบประสิทธิภาพด้วยวิธีการเรียนรู้ด้วยเครื่อง เพื่อตัดสินใจในการเลือกแบบจำลองที่ดีที่สุด

นวัตกรรมอื่น ๆ

ระบบไฮโดรโปนิกส์แบบควบคุมอัตโนมัติสำหรับใช้ในครัวเรือน

คณะวิศวกรรมศาสตร์

ระบบไฮโดรโปนิกส์แบบควบคุมอัตโนมัติสำหรับใช้ในครัวเรือน

ระบบไฮโดรโปนิกส์แบบควบคุมอัตโนมัติสำหรับใช้ในครัวเรือนได้รับการพัฒนาขึ้นเพื่อตอบโจทย์ผู้ที่มีพื้นที่น้อยแต่ต้องการปลูกผักสลัดเองในบ้านอย่างสะดวกและง่ายดาย ระบบนี้ออกแบบมาให้สามารถควบคุมการให้ธาตุอาหารโดยอัตโนมัติผ่านการตั้งค่าสภาพการนำไฟฟ้า (EC) และ pH ที่เหมาะสมสำหรับผักสลัดที่ต้องการปลูก มีแสงประดิษฐ์ร่วมเพื่อให้สามารถปลูกในพื้นที่จำกัดที่อาจมีแสงอาทิตย์ไม่เพียงพอได้ และยังเป็นระบบที่มีต้นทุนต่ำกว่าที่มีจำหน่ายในท้องตลาด จากการตรวจสอบระบบการควบคุมค่า EC และ pH พบว่าระบบปลูกนี้สามารถทำงานได้ดีและควบคุมการให้ธาตุอาหารจนถึงค่า EC และ pH ที่ตั้งไว้ได้ภายในเวลาไม่เกิน 30 นาที และรักษาค่าที่ตั้งไว้ได้ตลอดการเปิดทำงานของระบบ ในการทดลองปลูกผักสลัดกรีนโอ๊คโดยจำลองการตั้งระบบปลูกบริเวณระเบียง พบว่าต้นกรีนโอ๊คมีการเจริญเติบโตด้วยอัตราการเติบโตที่สูงกว่าการปลูกตามปกติ โดยเฉพาะเมื่อใช้แสงประดิษฐ์ร่วม

การเพิ่มความเสถียรของน้ำมันที่ใช้ปรุงอาหารโดยใช้คลื่นอัลตราโซนิคร่วมกับการบ่มสมุนไพรไทย

คณะอุตสาหกรรมอาหาร

การเพิ่มความเสถียรของน้ำมันที่ใช้ปรุงอาหารโดยใช้คลื่นอัลตราโซนิคร่วมกับการบ่มสมุนไพรไทย

การใช้น้ำมันพืชซ้ำในการประกอบอาหารส่งผลให้เกิดการเสื่อมสภาพและก่อให้เกิดสารพิษจากปฏิกิริยาออกซิเดชัน การศึกษานี้มุ่งเน้นการเพิ่มเสถียรภาพของน้ำมันพืชโดยใช้เทคโนโลยีคลื่นอัลตราโซนิคร่วมกับการบ่มปลีกล้วย 3 สายพันธุ์ ได้แก่ กล้วยไข่ กล้วยหอม และกล้วยน้ำว้า ซึ่งมีสารประกอบฟีนอลิกและสารต้านอนุมูลอิสระสูง งานวิจัยนี้ศึกษาการฟื้นฟูน้ำมันปาล์มที่ใช้แล้วโดยการบ่มร่วมกับปลีกล้วยที่ผ่านการอบแห้งและบดละเอียด โดยใช้คลื่นอัลตราโซนิคที่อุณหภูมิและระยะเวลาต่างๆ จากนั้นทำการทดสอบคุณภาพน้ำมันที่ได้รับการบ่มผ่านการวิเคราะห์ค่าทางกายภาพ (ปริมาณน้ำอิสระ ความชื้น และค่าสี) ค่าทางเคมี (ค่าดัชนีเปอร์ออกไซด์ ค่าความเป็นกรด และค่าไทโอบาร์บิทูริกแอซิด) และประสิทธิภาพการต้านอนุมูลอิสระ (DPPH, ABTS และ FRAP)

การศึกษาอัตราส่วนที่เหมาะสมของขิง ปลีกล้วย และกระเจี๊ยบในการห่อหุ้มลิโพโซมเพื่อเพิ่มประสิทธิภาพของคุณสมบัติต้านอนุมูลอิสระและปริมาณสารฟีนอลิก

คณะอุตสาหกรรมอาหาร

การศึกษาอัตราส่วนที่เหมาะสมของขิง ปลีกล้วย และกระเจี๊ยบในการห่อหุ้มลิโพโซมเพื่อเพิ่มประสิทธิภาพของคุณสมบัติต้านอนุมูลอิสระและปริมาณสารฟีนอลิก

ปัจจุบันการบริโภคอาหารที่มีฤทธิ์ต้านอนุมูลอิสระได้รับความสนใจมากขึ้น เนื่องจากสามารถช่วยลดความเสี่ยงในการเกิดโรคเรื้อรัง เช่น โรคมะเร็ง โรคหัวใจ และภาวะเสื่อมของเซลล์ ขิง (Zingiber officinale) ปลีกล้วย (Musa paradisiaca L.) และกระเจี๊ยบ (Hibiscus sabdariffa L.) เป็นพืชสมุนไพรที่มีสารประกอบฟีนอลิกสูง ซึ่งเป็นสารสำคัญที่มีบทบาทในการต้านอนุมูลอิสระ อย่างไรก็ตาม สารสำคัญจากพืชเหล่านี้มักมีข้อจำกัดด้านความคงตัวเมื่อสัมผัสกับแสง อุณหภูมิ และออกซิเจน ส่งผลให้ประสิทธิภาพลดลง งานวิจัยนี้มุ่งเน้นการศึกษาอัตราส่วนที่เหมาะสมของขิง ปลีกล้วย และกระเจี๊ยบ ในการกักเก็บด้วยลิโพโซม ซึ่งเป็นเทคนิคการห่อหุ้มสารสำคัญที่ช่วยเพิ่มความคงตัวของสารออกฤทธิ์และเพิ่มประสิทธิภาพในการนำส่งสารเข้าสู่ร่างกาย การศึกษานี้ดำเนินการโดยวิเคราะห์ฤทธิ์ต้านอนุมูลอิสระของสารสกัดจากขิง ปลีกล้วย และกระเจี๊ยบ ด้วยวิธี DPPH, ABTS และ FRAP รวมถึงการวัดปริมาณสารฟีนอลิกรวม (Total Phenolic Content, TPC) จากนั้นเลือกอัตราส่วนที่มีฤทธิ์ต้านอนุมูลอิสระสูงสุดมาทำการห่อหุ้มด้วยลิโพโซม โดยใช้ฟอสโฟลิปิดเป็นองค์ประกอบหลักของโครงสร้างลิโพโซม จากนั้นวิเคราะห์ประสิทธิภาพของลิโพโซมในการกักเก็บสารสำคัญผ่านการคำนวณค่า Encapsulation Efficiency (EE%) เพื่อตรวจสอบประสิทธิภาพการห่อหุ้ม ผลการวิจัยคาดว่าจะช่วยระบุอัตราส่วนที่เหมาะสมของขิง ปลีกล้วย และกระเจี๊ยบที่สามารถเพิ่มฤทธิ์ต้านอนุมูลอิสระสูงสุด และทำให้สารสำคัญมีความคงตัวมากขึ้นเมื่อผ่านกระบวนการห่อหุ้มด้วยลิโพโซม ซึ่งเป็นแนวทางสำคัญในการพัฒนาผลิตภัณฑ์เสริมสุขภาพจากสมุนไพรที่สามารถรักษาคุณสมบัติทางชีวภาพของสารสำคัญได้ในระยะยาว