KMITL Expo 2026 LogoKMITL 66th Anniversary Logo

การเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่องจากข้อมูลอนุกรมเวลาโดยวิธีการช่วงเวลาที่ช้ากว่ากัน

รายละเอียด

ปัญหาพิเศษนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่อง ในการพยากรณ์ข้อมูลอนุกรมเวลา โดยใช้วิธีช่วงเวลาที่ล่าช้ากว่ากัน แบ่งออกเป็น 3 ช่วงเวลา คือ ช่วงเวลาที่ช้ากว่ากัน 10 หน่วย ช่วงเวลาที่ช้ากว่ากัน 15 หน่วย และช่วงเวลาที่ช้ากว่ากัน 20 หน่วย มาใช้เป็นตัวแปรอิสระ และใช้วิธีการเรียนรู้ด้วยเครื่องมีทั้งหมด 4 วิธี ได้แก่ วิธีต้นไม้ตัดสินใจ วิธีป่าสุ่ม วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ และวิธีซัพพอร์ตเวกเตอร์แมชชีน โดยการจำลองข้อมูลอนุกรมเวลาที่เป็นตัวแปรอิสระที่มีลักษณะหลากหลาย ได้แก่ ข้อมูลที่มีลักษณะการเดินแบบสุ่ม ข้อมูลที่มีลักษณะมีแนวโน้ม และข้อมูลที่มีลักษณะไม่เชิงเส้น ซึ่งมีขนาดตัวอย่าง 100, 300, 500 และ 700 วิธีดำเนินการวิจัยนี้ทำการแบ่งข้อมูลเป็นฝึกฝน 90% และข้อมูลทดสอบ 10% โดยใช้โปรแกรมอาร์ในการจำลองและวิเคราะห์ข้อมูล โดยทำซ้ำเป็นจำนวน 1000 รอบ และทำการหาค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ที่ต่ำที่สุดเพื่อแสดงว่าวิธีใดดีที่สุด ผลการวิจัยพบว่าข้อมูลมีลักษณะการเดินแบบสุ่มวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลมีลักษณะแนวโน้มวิธีที่ดีสุด คือวิธีป่าสุ่มและข้อมูลมีลักษณะไม่เชิงเส้นวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน และเมื่อนำมาทดสอบกับข้อมูลจริง พบว่าข้อมูลค่าเงิน 1 ยูโร ต่อบาทวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลดัชนี S&P 500 ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีป่าสุ่ม และข้อมูลดัชนี Bank of America Corp ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน

วัตถุประสงค์

ปัจจุบันเทคโนโลยีสารสนเทศมีบทบาทสำคัญต่อการดำรงชีวิตของมนุษย์ ทำให้มีการพัฒนาเทคโนโลยีเพื่ออำนวยความสะดวกต่อการดำรงชีวิตของมนุษย์ มีแหล่งข้อมูลข่าวสารที่ทันสมัย รวมถึงแหล่งข้อมูลขนาดใหญ่ที่เรียกกว่าข้อมูลมหัต (Big Data) เป็นข้อมูลที่มีปริมาณมาก (Volume) มีความเปลี่ยนแปลงอย่างรวดเร็วอยู่ตลอดเวลา (Velocity) และมีความหลากหลายสูง (Variety) เนื่องจากคุณสมบัติเหล่านี้จัดเป็นอุปสรรคหรือปัญหาของ ข้อมูลขนาดใหญ่ที่ไม่สามารถนำข้อมูลมาใช้ประโยชน์ได้ทันทีจึงต้องมีกระบวนการจัดการข้อมูล ขนาดใหญ่เสียก่อน โดยใช้วิธีการเรียนรู้ของเครื่อง (Machine Learning) เข้ามาเกี่ยวข้อง การเรียนรู้ด้วยเครื่อง (Machine Learning) คือวิทยาการคอมพิวเตอร์ประเภทหนึ่ง เกี่ยวข้องกับการศึกษาและสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ สามารถแบ่งการเรียนรู้ของเครื่องออกเป็น 2 กลุ่มประกอบด้วย การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning) คือการวิเคราะห์ข้อมูลที่ไม่มีตัวแปรตามหรือคำตอบกำกับไว้ มุ่งเน้นไปที่การหาความสัมพันธ์ระหว่างข้อมูลและการแบ่งกลุ่มเพื่อลดมิติของข้อมูล เช่น การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis) ซึ่งได้รับความนิยมใช้เพื่อลดมิติของข้อมูลและการแบ่งกลุ่มข้อมูลด้วยคุณลักษณะต่าง ๆ และการเรียนรู้แบบมีผู้สอน (Supervised Learning) คือการวิเคราะห์ข้อมูลที่มีตัวแปรตามหรือคำตอบกำกับไว้ ถ้าตัวแปรตามเป็นเชิงปริมาณจะเป็นการพยากรณ์ข้อมูลอนุกรมเวลา (Time series) แต่ถ้าตัวแปรตามเป็นเชิงคุณภาพจะเป็นการวิเคราะห์การจำแนก (Classification) โดยเทคนิคที่นิยมใช้อย่างแพร่หลายได้แก่ การถดถอยโลจิสติกส์ (Logistic Regression) ต้นไม้ตัดสินใจ (Decision Tree) เทคนิคป่าสุ่ม (Random Forest) และโครงข่ายประสาทเทียม (Artificial Neural Network) เป็นต้น การจำแนกถูกนำมาประยุกต์ใช้ในงานวิจัยในหลายด้าน (วริทธิ์พล , 2565) ข้อมูลอนุกรมเวลา (Time Series) คือ ชุดข้อมูลที่รวบรวมและจัดเก็บตามลำดับ ต่อเนื่องกันภายใต้การเพิ่มขึ้นของเวลา โดยข้อมูลดังกล่าวจะถูกเก็บรวบรวมอย่างต่อเนื่องในระยะเวลาติดต่อกัน ตามช่วงเวลาที่ต้องการ เช่น ข้อมูลราคาทองคำ ข้อมูลปริมาณน้ำในเขื่อน ซึ่งจะถูกบันทึกข้อมูลเป็นวัน ในบางกรณี การจัดเก็บข้อมูลอาจมีลักษณะการจัดเก็บแบบเป็นช่วงเวลาต่อเนื่องกัน เพื่อสร้างตัวแบบอนุกรมเวลา (Time Series Model) ในการทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคตโดยการวิเคราะห์อนุกรมเวลา (Time Series Analysis) ในการวิเคราะห์อนุกรมเวลา ส่วนใหญ่ข้อมูลอนุกรมเวลาเป็นข้อมูลที่เยอะ ซับซ้อน และมีการเปลี่ยนแปลงอยู่ตลอดเวลา จึงทำให้ยากต่อการหาวิธีที่ดีที่สุดในการพยากรณ์ จึงได้มีการนำการเรียนรู้ด้วยเครื่องมาใช้ในการวิเคราะห์ข้อมูล เพราะ วิธีการเรียนรู้ด้วยเครื่องมีประสิทธิภาพในการวิเคราะห์ข้อมูลอนุกรมเวลามากกว่า (พรทิวา , 2564) โดยทั่วไปในการวิเคราะห์อนุกรมเวลาจะใช้ตัวแปรเพียงตัวเดียว แต่ในวิธีของการเรียนรู้ด้วยเครื่องจะมีการใช้ตัวแปรอิสระ ( ) มาช่วยในการพยากรณ์ ในการวิจัยครั้งนี้จึงสนใจนำช่วงเวลาที่ช้ากว่ากัน (Lag) ของข้อมูลอนุกรมเวลา เข้ามาเป็นตัวแปรอิสระ โดยตัวแปรตาม ( ) คือ ข้อมูลอนุกรมเวลาชุดเดิม แล้วจึงนำไปวิเคราะห์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบด้วย วิธีต้นไม้ตัดสินใจ (Decision Tree) ป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยแต่ละวิธีจะทำการศึกษาเกี่ยวกับการวัดความถูกต้องและความผิดพลาดในการจำแนกข้อมูล Lai et al. (2023) งานวิจัยนี้เกี่ยวกับการพยากรณ์สถานการณ์ปัจจุบันของโควิด 19 โดยใช้ข้อมูลน้ำเสีย ให้ผู้ป่วยโควิด 19 เป็นตัวแปร และให้ปริมาณไวรัสในตัวอย่างน้ำเสียเป็นตัวแปร ผู้วิจัยไม่ทราบตัวแปร จึงได้ใช้วิธีช่วงเวลาที่ช้ากว่ากัน (Lag) เอามาช่วยในการพยากรณ์ตัวแปร พอทราบค่าได้นำไปพยากรณ์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบไปด้วย แบบจำลองอารีแมกซ์ (Autoregressive Integrated Moving Average with Exogenous Variables : ARIMAX) และการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา (Time Series Machine Learning : TSML) โดยเทคนิคที่ดีที่สุด คือ วิธีการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา พรทิวา (2564) งานวิจัยนี้เกี่ยวกับระบบวิเคราะห์ข้อมูลอนุกรมเวลาด้วยเทคนิคทางการเรียนรู้ของเครื่อง โดยเปรียบเทียบวิธีพยากรณ์ออกเป็น 3 เทคนิคประกอบไปด้วยเทคนิควิเคราะห์การถดถอยพหุคูณ (Multiple Linear Regression) วิธีต้นไม้ตัดสินใจ (Decision Tree) และ วิธีป่าสุ่ม (Random Forest) โดยใช้การคัดเลือกเทคนิคที่เหมาะสมที่สุดสำหรับการพยากรณ์โดยใช้เกณฑ์ค่าเฉลี่ยของค่าสัมบูรณ์เปอร์เซ็นต์ความคลาดเคลื่อน (Mean Absolute Percentage Error, MAPE) ต่ำที่สุดผลวิจัยพบว่าการเปรียบเทียบเทคนิคระหว่างวิธีต้นไม้ตัดสินใจ วิธีป่าไม้สุ่ม และ การถดถอยพหุคูณ สำหรับการพยากรณ์ยอดขายรวมรายวันแยกตามรายสินค้าและจำนวนผู้เสียชีวิตรายใหม่จาก สถานการณ์ COVID-19 ในประเทศไทยพบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ เทคนิคป่าสุ่ม Kayode-Ajala. (2022) งานวิจัยนี้เกี่ยวกับการประยุกต์ใช้อัลกอริทึมการเรียนรู้ของเครื่อง ในการตรวจจับเว็บไซต์ที่เป็นแฟร์ชิ่ง ซึ่งใช้วิธีการเรียนรู้ด้วยเครื่องประกอบด้วย วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) วิธีต้นไม้ตัดสินใจ (Decision Trees) และ วิธีป่าสุ่ม (Random Forest) ซึ่งวิธีที่ดีที่สุดคือ วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ Ballı (2021) งานวิจัยนี้เกี่ยวกับการวิเคราะห์ข้อมูลของการระบาดโควิด-19 และการพยากรณ์จำนวนผู้ติดเชื้อรวมในระยะสั้นๆ โดยใช้เทคนิคการเรียนรู้ด้วยเครื่องประกอบวิธีการถดถอยเชิงเส้น (Linear regression) วิธีโครงข่ายประสาทเทียมแบบเพอร์เซ็ปตรอนหลายชั้น (multi-layer perceptron) วิธีป่าสุ่ม (random forest) วิธีนาอีฟ เบย์ (Naive Bayes) และ วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) พบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ วิธีซัพพอร์ตเวกเตอร์แมชชีน Bemthuis et al. (2023) งานวิจัยนี้เกี่ยวกับระบบสนับสนุนการตัดสินใจ (Decision Support Systems) กำลังพัฒนาไปในทิศทางที่ซับซ้อนมากขึ้น โดยมุ่งหวังที่จะทำให้การตัดสินใจเป็นไปโดยอัตโนมัติมากที่สุด จึงวิธีการที่ใช้เทคนิคการจำแนกประเภทด้วยต้นไม้การตัดสินใจ และเปรียบเทียบประสิทธิภาพกับผลลัพธ์ที่ได้จากการใช้เทคนิคสนับสนุนเวกเตอร์แมชชีน การทดลองของเราพบว่า วิธีการของเรามีความแม่นยำและความยืดหยุ่นในด้านการดึงกฎทางธุรกิจ ต้นไม้การตัดสินใจ จากการศึกษางานวิจัยที่เกี่ยวข้องทางผู้วิจัยจึงสนใจศึกษาการเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่องจากข้อมูลอนุกรมเวลา โดยวิธีการช่วงเวลาที่ช้ากว่ากัน ซึ่งประกอบไปด้วยวิธีต้นไม้ตัดสินใจ (Decision Tree) วิธีป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยพิจารณาค่าเฉลี่ยของค่าคาดเคลื่อนกำลังสองเฉลี่ย (Mean Square Error: AMSE) และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ (Mean Absolute Percentage Error: AMAPE) เป็นเกณฑ์ในการวัดประสิทธิภาพของแบบจำลอง และเป็นแนวทางการในการเปรียบเทียบประสิทธิภาพด้วยวิธีการเรียนรู้ด้วยเครื่อง เพื่อตัดสินใจในการเลือกแบบจำลองที่ดีที่สุด

นวัตกรรมอื่น ๆ

การเปรียบเทียบรูปแบบโรงเรือนที่เหมาะสมสำหรับการผลิตพิทูเนียกระถาง

คณะเทคโนโลยีการเกษตร

การเปรียบเทียบรูปแบบโรงเรือนที่เหมาะสมสำหรับการผลิตพิทูเนียกระถาง

การวิจัยนี้มีวัตถุเพื่อศึกษาเปรียบเทียบระหว่างโรงเรือนพรางแสงและโรงเรือนอีแวปสำหรับการ ผลิตพิทูเนียกระถางที่เหมาะสมต่อการเจริญเติบโต การออกดอกและประสิทธิภาพการสังเคราะห์ ด้วยแสงของพิทูเนีย โดยแบ่งออกเป็น 2 กลุ่มประชากรดังนี้ 1) โรงเรือนอีแวป (evaporative cooling house) 2) โรงเรือนพรางแสง (shade net house) โดยแต่ละกลุ่มใช้พิทูเนียจำนวน 50 กระถางในการบันทึกผล ผลการทดลองพบว่า การปลูกพิทูเนียในโรงเรือนอีแวปส่งผลให้ลำต้นมี ความสูงมากที่สุด ดอกมีขนาดใหญ่และบานได้นานกว่า แต่การปลูกในโรงเรือนพรางแสงส่งผลให้ พิทูเนียแทงตาดอก ออกดอกได้เร็วกว่า รวมถึงดอกมีสีเข้มกว่า และมีจำนวนดอกใหม่ต่อต้น มากกว่าเท่าตัวหลังการย้ายปลูก 21 วัน ในส่วนของประสิทธิภาพการสังเคราะห์แสงในรอบวันหลัง การย้ายปลูก 30 วัน พบว่าในช่วงเวลา 12.00 น. ทำให้อัตราการสังเคราะห์ด้วยแสงสุทธิทั้ง 2 โรงเรือนสูงสุด และทำให้ค่าการนำไฟฟ้าของปากใบและอัตราการคายน้ำเพิ่มขึ้นสูงสุดในโรงเรือน อีแวป หลังการย้ายปลูก 60 วัน พบว่าอัตราการสังเคราะห์ด้วยแสงสุทธิ ค่าการนำไฟฟ้าของปาก ใบและค่าการคายน้ำมีค่าสูงสุดในโรงเรือนพรางแสงในช่วงเวลา 10.00 น. ส่วนการสังเคราะห์ด้วย แสงในความเข้มแสงที่แตกต่างกัน หลังการย้ายปลูก 30 วัน พบว่าอัตราการสังเคราะห์ด้วยแสง สุทธิ ค่าการนำไฟฟ้าปากใบและอัตราการคายน้ำสูงสุดเมื่อให้ความเข้มแสงที่ 2000 µmol m-2 s-1 โดยมีค่าสูงสุดในโรงเรือนพรางแสง หลังการย้ายปลูก 60 วัน อัตราการสังเคราะห์ด้วยแสงสุทธิ สูงสุดเมื่อให้ความเข้มแสงที่ 1400 µmol m-2 s-1 โดยมีค่าสูงสุดในโรงเรือนพรางแสง จากการศึกษา จึงสรุปผลได้ว่า การปลูกพิทูเนียในโรงเรือนพรางแสง เหมาะสมสำหรับการผลิตพิทูเนียกระถาง และมีประสิทธิภาพการสังเคราะห์ด้วยแสงของพิทูเนียมากกว่าการปลูกพิทูเนียในโรงเรือนอีแวป

ขนมอบกรอบเสริมไฟเบอร์จากปลีกล้วย

คณะอุตสาหกรรมอาหาร

ขนมอบกรอบเสริมไฟเบอร์จากปลีกล้วย

ผลิตภัณฑ์ Banana Blossom Chips เป็นขนมขบเคี้ยวเพื่อสุขภาพที่อุดมไปด้วยใยอาหาร สารต้านอนุมูลอิสระ และโปรตีนจากพืช โดยเกิดจากการผสมผสานวัตถุดิบท้องถิ่นของไทย คือปลีกล้วยที่มีใยอาหารและสารต้านอนุมูลอิสระสูง แป้งถั่วลูกไก่ที่เป็นแหล่งโปรตีนจากพืช และข้าวกล้องหอมมะลิแดง ที่มีค่า GI ต่ำและสารต้านอนุมูลอิสระสูง ผ่านกระบวนการแปรรูปที่ให้ความกรอบและมีรูปร่างที่เป็นเอกลักษณ์ ลดปริมาณไขมัน ปราศจากกลูเตน รวมทั้งช่วยคงคุณค่าสารอาหาร จึงเป็นทางเลือกใหม่ให้กับผู้บริโภคที่รักสุขภาพ และเป็นการเพิ่มมูลค่าให้กับผลผลิตทางการเกษตรของไทย

การศึกษาและวิเคราะห์แบคเทริโอซินจากลำดับจีโนมและความสามารถในการยับยั้งจุลชีพก่อโรคของ Lactococcus lactis TKP1-5 ที่คัดแยกได้จากอุจจาระของเป็ด

คณะวิทยาศาสตร์

การศึกษาและวิเคราะห์แบคเทริโอซินจากลำดับจีโนมและความสามารถในการยับยั้งจุลชีพก่อโรคของ Lactococcus lactis TKP1-5 ที่คัดแยกได้จากอุจจาระของเป็ด

แบคเทอริโอซินเป็นเปปไทด์ต้านจุลชีพชนิดหนึ่งที่จุลินทรีย์เป็นคนผลิตออกมาซึ่งมีความสามารถในการยับยั้งจุลชีพก่อโรคได้ จากงานวิจัยนี้นั้นได้มีการศึกษาความสามารถในการยับยั้งจุลชีพก่อโรคและระบุชนิดของแบคเทอริโอซินของแบคเรียกรดแลคติกสายพันธุ์ TKP1-5 ที่คัดแยกมาจากอุจจาระเป็ด ซึ่งมีการระบุลักษณะสปีชีส์ของสายพันธุ์ TKP1-5 โดยใช้การวิเคราะห์จากลำดับ 16s rRNA และลำดับจีโนมทั้งหมด พบว่าจากค่า ANIb, ANIm, และค่า dDDH พบว่าสายพันธุ์นี้คือ Lactococcus lactis อีกทั้งยังมีการทดสอบลักษณะเฉพาะของสายพันธุ์นี้พบว่ามีความสามารถในการเจริญเติบโตใดในสภาวะแวดล้อมดังต่อไปนี้ สามารถโตได้ที่เปอร์เซ็นต์เกลือที่ 2-6% อุณหภูมิ 25-45 องศาเซลเซียส และพีเอช 3-9 ตามลำดับ โดยการศึกษาและระบุชนิดของแบคเทอริโอซินผ่านการวิเคราะห์ลำดับจีโนมนั้นพบว่าเป็นชนิด ไนซิน-ซี (Nisin-Z) ที่ค่าคะแนนเท่ากับ 114.775 รวมไปถึงการวิเคราะห์ความสามารถในการยับยั้งจุลชีพก่อโรคพบว่ามีความสามารถในการยับยั้งจุลชีพก่อโรคดังนี้ Pediococcus pentosaceus JCM5885, Listeria monocytogenes ATCC 19115, Enterococcus faecalis JCM 5803T, Salmonella Typhimurium ATCC 13311ᵀ, Aeromonas hydrophila B1 AhB1, Streptococcus agalactiae 1611 และ Streptococcus cowan I ตามลำดับ การวิเคราะห์ลำดับจีโนมทั้งหมดยังยืนยันได้อีกว่า L.lactis TKP 1-5 นี้ไม่พบยีนที่สามารถจะเป็นจุลชีพก่อโรค ยีนดื้อยา และพลาสมิด อีกด้วย อีกทั้งยังพบยีนที่มีความเกี่ยวข้องในการเป็นโพรไบโอติกหรือยีนที่ก่อให้เกิดประโยชน์อีกด้วย ทั้งนี้หวังว่าสายพันธุ์ TKP1-5จะเป็นหนึ่งในตัวเลือกที่อุตสาหกรรมอาหารนั้นนำมาใช้ในอุตสาหกรรมอาหารในการต้านจุลชีพก่อโรคในอนาคต