ปัญหาพิเศษนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่อง ในการพยากรณ์ข้อมูลอนุกรมเวลา โดยใช้วิธีช่วงเวลาที่ล่าช้ากว่ากัน แบ่งออกเป็น 3 ช่วงเวลา คือ ช่วงเวลาที่ช้ากว่ากัน 10 หน่วย ช่วงเวลาที่ช้ากว่ากัน 15 หน่วย และช่วงเวลาที่ช้ากว่ากัน 20 หน่วย มาใช้เป็นตัวแปรอิสระ และใช้วิธีการเรียนรู้ด้วยเครื่องมีทั้งหมด 4 วิธี ได้แก่ วิธีต้นไม้ตัดสินใจ วิธีป่าสุ่ม วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ และวิธีซัพพอร์ตเวกเตอร์แมชชีน โดยการจำลองข้อมูลอนุกรมเวลาที่เป็นตัวแปรอิสระที่มีลักษณะหลากหลาย ได้แก่ ข้อมูลที่มีลักษณะการเดินแบบสุ่ม ข้อมูลที่มีลักษณะมีแนวโน้ม และข้อมูลที่มีลักษณะไม่เชิงเส้น ซึ่งมีขนาดตัวอย่าง 100, 300, 500 และ 700 วิธีดำเนินการวิจัยนี้ทำการแบ่งข้อมูลเป็นฝึกฝน 90% และข้อมูลทดสอบ 10% โดยใช้โปรแกรมอาร์ในการจำลองและวิเคราะห์ข้อมูล โดยทำซ้ำเป็นจำนวน 1000 รอบ และทำการหาค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ที่ต่ำที่สุดเพื่อแสดงว่าวิธีใดดีที่สุด ผลการวิจัยพบว่าข้อมูลมีลักษณะการเดินแบบสุ่มวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลมีลักษณะแนวโน้มวิธีที่ดีสุด คือวิธีป่าสุ่มและข้อมูลมีลักษณะไม่เชิงเส้นวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน และเมื่อนำมาทดสอบกับข้อมูลจริง พบว่าข้อมูลค่าเงิน 1 ยูโร ต่อบาทวิธีที่ดีสุด คือวิธีป่าสุ่มและวิธีซัพพอร์ตเวกเตอร์แมชชีน ข้อมูลดัชนี S&P 500 ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีป่าสุ่ม และข้อมูลดัชนี Bank of America Corp ในรูปของดอลลาร์สหรัฐวิธีที่ดีสุด คือวิธีซัพพอร์ตเวกเตอร์แมชชีน
ปัจจุบันเทคโนโลยีสารสนเทศมีบทบาทสำคัญต่อการดำรงชีวิตของมนุษย์ ทำให้มีการพัฒนาเทคโนโลยีเพื่ออำนวยความสะดวกต่อการดำรงชีวิตของมนุษย์ มีแหล่งข้อมูลข่าวสารที่ทันสมัย รวมถึงแหล่งข้อมูลขนาดใหญ่ที่เรียกกว่าข้อมูลมหัต (Big Data) เป็นข้อมูลที่มีปริมาณมาก (Volume) มีความเปลี่ยนแปลงอย่างรวดเร็วอยู่ตลอดเวลา (Velocity) และมีความหลากหลายสูง (Variety) เนื่องจากคุณสมบัติเหล่านี้จัดเป็นอุปสรรคหรือปัญหาของ ข้อมูลขนาดใหญ่ที่ไม่สามารถนำข้อมูลมาใช้ประโยชน์ได้ทันทีจึงต้องมีกระบวนการจัดการข้อมูล ขนาดใหญ่เสียก่อน โดยใช้วิธีการเรียนรู้ของเครื่อง (Machine Learning) เข้ามาเกี่ยวข้อง การเรียนรู้ด้วยเครื่อง (Machine Learning) คือวิทยาการคอมพิวเตอร์ประเภทหนึ่ง เกี่ยวข้องกับการศึกษาและสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ สามารถแบ่งการเรียนรู้ของเครื่องออกเป็น 2 กลุ่มประกอบด้วย การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning) คือการวิเคราะห์ข้อมูลที่ไม่มีตัวแปรตามหรือคำตอบกำกับไว้ มุ่งเน้นไปที่การหาความสัมพันธ์ระหว่างข้อมูลและการแบ่งกลุ่มเพื่อลดมิติของข้อมูล เช่น การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis) ซึ่งได้รับความนิยมใช้เพื่อลดมิติของข้อมูลและการแบ่งกลุ่มข้อมูลด้วยคุณลักษณะต่าง ๆ และการเรียนรู้แบบมีผู้สอน (Supervised Learning) คือการวิเคราะห์ข้อมูลที่มีตัวแปรตามหรือคำตอบกำกับไว้ ถ้าตัวแปรตามเป็นเชิงปริมาณจะเป็นการพยากรณ์ข้อมูลอนุกรมเวลา (Time series) แต่ถ้าตัวแปรตามเป็นเชิงคุณภาพจะเป็นการวิเคราะห์การจำแนก (Classification) โดยเทคนิคที่นิยมใช้อย่างแพร่หลายได้แก่ การถดถอยโลจิสติกส์ (Logistic Regression) ต้นไม้ตัดสินใจ (Decision Tree) เทคนิคป่าสุ่ม (Random Forest) และโครงข่ายประสาทเทียม (Artificial Neural Network) เป็นต้น การจำแนกถูกนำมาประยุกต์ใช้ในงานวิจัยในหลายด้าน (วริทธิ์พล , 2565) ข้อมูลอนุกรมเวลา (Time Series) คือ ชุดข้อมูลที่รวบรวมและจัดเก็บตามลำดับ ต่อเนื่องกันภายใต้การเพิ่มขึ้นของเวลา โดยข้อมูลดังกล่าวจะถูกเก็บรวบรวมอย่างต่อเนื่องในระยะเวลาติดต่อกัน ตามช่วงเวลาที่ต้องการ เช่น ข้อมูลราคาทองคำ ข้อมูลปริมาณน้ำในเขื่อน ซึ่งจะถูกบันทึกข้อมูลเป็นวัน ในบางกรณี การจัดเก็บข้อมูลอาจมีลักษณะการจัดเก็บแบบเป็นช่วงเวลาต่อเนื่องกัน เพื่อสร้างตัวแบบอนุกรมเวลา (Time Series Model) ในการทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคตโดยการวิเคราะห์อนุกรมเวลา (Time Series Analysis) ในการวิเคราะห์อนุกรมเวลา ส่วนใหญ่ข้อมูลอนุกรมเวลาเป็นข้อมูลที่เยอะ ซับซ้อน และมีการเปลี่ยนแปลงอยู่ตลอดเวลา จึงทำให้ยากต่อการหาวิธีที่ดีที่สุดในการพยากรณ์ จึงได้มีการนำการเรียนรู้ด้วยเครื่องมาใช้ในการวิเคราะห์ข้อมูล เพราะ วิธีการเรียนรู้ด้วยเครื่องมีประสิทธิภาพในการวิเคราะห์ข้อมูลอนุกรมเวลามากกว่า (พรทิวา , 2564) โดยทั่วไปในการวิเคราะห์อนุกรมเวลาจะใช้ตัวแปรเพียงตัวเดียว แต่ในวิธีของการเรียนรู้ด้วยเครื่องจะมีการใช้ตัวแปรอิสระ ( ) มาช่วยในการพยากรณ์ ในการวิจัยครั้งนี้จึงสนใจนำช่วงเวลาที่ช้ากว่ากัน (Lag) ของข้อมูลอนุกรมเวลา เข้ามาเป็นตัวแปรอิสระ โดยตัวแปรตาม ( ) คือ ข้อมูลอนุกรมเวลาชุดเดิม แล้วจึงนำไปวิเคราะห์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบด้วย วิธีต้นไม้ตัดสินใจ (Decision Tree) ป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยแต่ละวิธีจะทำการศึกษาเกี่ยวกับการวัดความถูกต้องและความผิดพลาดในการจำแนกข้อมูล Lai et al. (2023) งานวิจัยนี้เกี่ยวกับการพยากรณ์สถานการณ์ปัจจุบันของโควิด 19 โดยใช้ข้อมูลน้ำเสีย ให้ผู้ป่วยโควิด 19 เป็นตัวแปร และให้ปริมาณไวรัสในตัวอย่างน้ำเสียเป็นตัวแปร ผู้วิจัยไม่ทราบตัวแปร จึงได้ใช้วิธีช่วงเวลาที่ช้ากว่ากัน (Lag) เอามาช่วยในการพยากรณ์ตัวแปร พอทราบค่าได้นำไปพยากรณ์ด้วยวิธีการเรียนรู้ด้วยเครื่อง ประกอบไปด้วย แบบจำลองอารีแมกซ์ (Autoregressive Integrated Moving Average with Exogenous Variables : ARIMAX) และการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา (Time Series Machine Learning : TSML) โดยเทคนิคที่ดีที่สุด คือ วิธีการเรียนรู้ด้วยเครื่องจากชุดข้อมูลแบบลำดับเวลา พรทิวา (2564) งานวิจัยนี้เกี่ยวกับระบบวิเคราะห์ข้อมูลอนุกรมเวลาด้วยเทคนิคทางการเรียนรู้ของเครื่อง โดยเปรียบเทียบวิธีพยากรณ์ออกเป็น 3 เทคนิคประกอบไปด้วยเทคนิควิเคราะห์การถดถอยพหุคูณ (Multiple Linear Regression) วิธีต้นไม้ตัดสินใจ (Decision Tree) และ วิธีป่าสุ่ม (Random Forest) โดยใช้การคัดเลือกเทคนิคที่เหมาะสมที่สุดสำหรับการพยากรณ์โดยใช้เกณฑ์ค่าเฉลี่ยของค่าสัมบูรณ์เปอร์เซ็นต์ความคลาดเคลื่อน (Mean Absolute Percentage Error, MAPE) ต่ำที่สุดผลวิจัยพบว่าการเปรียบเทียบเทคนิคระหว่างวิธีต้นไม้ตัดสินใจ วิธีป่าไม้สุ่ม และ การถดถอยพหุคูณ สำหรับการพยากรณ์ยอดขายรวมรายวันแยกตามรายสินค้าและจำนวนผู้เสียชีวิตรายใหม่จาก สถานการณ์ COVID-19 ในประเทศไทยพบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ เทคนิคป่าสุ่ม Kayode-Ajala. (2022) งานวิจัยนี้เกี่ยวกับการประยุกต์ใช้อัลกอริทึมการเรียนรู้ของเครื่อง ในการตรวจจับเว็บไซต์ที่เป็นแฟร์ชิ่ง ซึ่งใช้วิธีการเรียนรู้ด้วยเครื่องประกอบด้วย วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) วิธีต้นไม้ตัดสินใจ (Decision Trees) และ วิธีป่าสุ่ม (Random Forest) ซึ่งวิธีที่ดีที่สุดคือ วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ Ballı (2021) งานวิจัยนี้เกี่ยวกับการวิเคราะห์ข้อมูลของการระบาดโควิด-19 และการพยากรณ์จำนวนผู้ติดเชื้อรวมในระยะสั้นๆ โดยใช้เทคนิคการเรียนรู้ด้วยเครื่องประกอบวิธีการถดถอยเชิงเส้น (Linear regression) วิธีโครงข่ายประสาทเทียมแบบเพอร์เซ็ปตรอนหลายชั้น (multi-layer perceptron) วิธีป่าสุ่ม (random forest) วิธีนาอีฟ เบย์ (Naive Bayes) และ วิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) พบว่าเทคนิคให้ค่า MAPE เฉลี่ยต่ำที่สุดคือ วิธีซัพพอร์ตเวกเตอร์แมชชีน Bemthuis et al. (2023) งานวิจัยนี้เกี่ยวกับระบบสนับสนุนการตัดสินใจ (Decision Support Systems) กำลังพัฒนาไปในทิศทางที่ซับซ้อนมากขึ้น โดยมุ่งหวังที่จะทำให้การตัดสินใจเป็นไปโดยอัตโนมัติมากที่สุด จึงวิธีการที่ใช้เทคนิคการจำแนกประเภทด้วยต้นไม้การตัดสินใจ และเปรียบเทียบประสิทธิภาพกับผลลัพธ์ที่ได้จากการใช้เทคนิคสนับสนุนเวกเตอร์แมชชีน การทดลองของเราพบว่า วิธีการของเรามีความแม่นยำและความยืดหยุ่นในด้านการดึงกฎทางธุรกิจ ต้นไม้การตัดสินใจ จากการศึกษางานวิจัยที่เกี่ยวข้องทางผู้วิจัยจึงสนใจศึกษาการเปรียบเทียบประสิทธิภาพของวิธีการเรียนรู้ด้วยเครื่องจากข้อมูลอนุกรมเวลา โดยวิธีการช่วงเวลาที่ช้ากว่ากัน ซึ่งประกอบไปด้วยวิธีต้นไม้ตัดสินใจ (Decision Tree) วิธีป่าสุ่ม (Random Forest) วิธีเพื่อนบ้านใกล้เคียงสุด K อันดับ (K Nearest-Neighbor: KNN) และวิธีซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) โดยพิจารณาค่าเฉลี่ยของค่าคาดเคลื่อนกำลังสองเฉลี่ย (Mean Square Error: AMSE) และค่าเฉลี่ยของค่าเฉลี่ยเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์ (Mean Absolute Percentage Error: AMAPE) เป็นเกณฑ์ในการวัดประสิทธิภาพของแบบจำลอง และเป็นแนวทางการในการเปรียบเทียบประสิทธิภาพด้วยวิธีการเรียนรู้ด้วยเครื่อง เพื่อตัดสินใจในการเลือกแบบจำลองที่ดีที่สุด
คณะเทคโนโลยีสารสนเทศ
ในปัจจุบันการประชาสัมพันธ์และการเรียนรู้ในรูปแบบดั้งเดิมมักขาดความน่าสนใจ และไม่สามารถสร้างประสบการณ์ที่ลึกซึ้งให้แก่ผู้ใช้งานได้ นอกจากนี้ยังไม่สามารถเข้าถึงกลุ่มเป้าหมายได้อย่างทั่วถึง โดยเฉพาะสำหรับผู้ที่ไม่สามารถเดินทางมายังสถานที่จริงได้ โครงงานนี้มีวัตถุประสงค์เพื่อแก้ไขปัญหาการเข้าถึงและการรับรู้ข้อมูลเกี่ยวกับหอเทิดพระเกียรติและหอประวัติของสถาบันพระจอมเกล้า เจ้าคุณทหารลาดกระบัง การใช้เทคโนโลยีเมตาเวิร์สในการจำลองสถานที่สำคัญช่วยให้ผู้ใช้สามารถ สำรวจสถานที่และรับชมข้อมูลที่สำคัญในรูปแบบเสมือนจริงเพื่อเพิ่มการมีส่วนร่วมของนักศึกษา บุคลากร ศิษย์เก่า และบุคคลทั่วไป ในการพัฒนาระบบเมตาเวิร์ส ได้พัฒนาผ่านระบบ Unity ซึ่งเป็นเกมเอนจินที่มีความสามารถในการพัฒนาระบบเมตาเวิร์ส เพื่อสร้างสภาพแวดล้อมเสมือนจริงที่สามารถโต้ตอบได้ Unity ยังรองรับ การจัดการฟิสิกส์ แสง และเสียง เพื่อเพิ่มความสมจริง อีกทั้งให้ผู้ใช้งานได้เข้าถึงโครงงานได้อย่างสะดวก นอกจากนี้ยังมีการเชื่อมต่อกับเว็บเบราวเซอร์ โดยใช้เทคโนโลยี WebGL ซึ่งช่วยให้โครงานที่สร้างขึ้นใน Unity สามารถแสดงผลได้โดยตรงผ่านเว็บเบราวเซอร์ ผู้ใช้งานสามารถเข้าชมได้จากทุกที่ และโต้ตอบกับสถานที่ในเมตาเวิร์สได้ทันที โดยไม่ต้องติดตั้งซอฟต์แวร์เพิ่มเติม ผู้พัฒนาจึงพัฒนาระบบระบบเมตาเวิร์สเพื่อสร้างประสบการณ์การเรียนรู้ที่สมจริงและดึงดูดความสนใจ ช่วยเพิ่มโอกาสในการประชาสัมพันธ์และสร้างความผูกพันกับสถาบันอย่างมีประสิทธิภาพ
คณะวิศวกรรมศาสตร์
การตรวจวินิจฉัยโรคดีซ่าน ซึ่งเป็นภาวะที่พบได้ทั่วไปในทารกเนื่องจากระดับบิลิรูบินในเลือดที่สูงขึ้น มักต้องการการวินิจฉัยและการตรวจสอบอย่างรวดเร็วเพื่อป้องกันภาวะแทรกซ้อนร้ายแรง โดยเฉพาะในทารกแรกเกิด วิธีการวินิจฉัยแบบดั้งเดิมสามารถใช้เวลานานและอาจเกิดข้อผิดพลาดจากมนุษย์ได้ งานวิจัยนี้เสนอแนวทางในการตรวจวินิจฉัยโรคดีซ่านแบบเรียลไทม์โดยใช้เทคนิคการประมวลผลภาพขั้นสูงและอัลกอริทึมแมชชีนเลิร์นนิง โดยการวิเคราะห์ภาพที่ถ่ายในพื้นที่สี RGB จะมีการสกัดและประมวลผลค่าพิกเซลผ่านการปรับค่าเกณฑ์ของ Otsu และการดำเนินการทางสัณฐานวิทยาเพื่อตรวจจับรูปแบบสีที่บ่งบอกถึงโรคดีซ่าน จากนั้นตัวจำแนกจะถูกฝึกฝนเพื่อแยกแยะระหว่างภาวะปกติและภาวะดีซ่าน นำเสนอนวัตกรรมเครื่องมือวินิจฉัยที่แม่นยำและมีประสิทธิภาพ การทำงานแบบเรียลไทม์ทำให้ระบบนี้เหมาะสำหรับสถานพยาบาล โดยให้ข้อมูลเชิงลึกที่ทันเวลาแก่บุคลากรทางการแพทย์เพื่อปรับปรุงผลลัพธ์ของผู้ป่วย วิธีการที่เสนอนี้เป็นนวัตกรรมสำคัญในด้านการดูแลสุขภาพ โดยการรวมปัญญาประดิษฐ์และการถ่ายภาพทางการแพทย์เพื่อเพิ่มประสิทธิภาพในการตรวจวินิจฉัยและจัดการโรคดีซ่านได้เร็วขึ้น ลดการพึ่งพาการแทรกแซงแบบแมนนวล และปรับปรุงการให้บริการด้านสุขภาพโดยรวม
คณะวิทยาศาสตร์
แผงโซลาร์เซลล์ที่ใช้กันในครัวเรือน ในปัจจุบันยังขาดระบบตรวจสอบที่มีประสิทธิภาพ ซึ่งส่งผลกระทบต่อการใช้งานอย่างมีประสิทธิภาพสูงสุด งานวิจัยนี้มีเป้าหมายในการออกแบบระบบตรวจสอบผ่านเทคโนโลยี Internet of Things (IoT) และ Machine Learning มาใช้ในการคาดการณ์กระแส และแรงดันไฟฟ้าที่ผลิตโดยแผงโซลาร์เซลล์ การศึกษาทดลองพบว่ามีความสัมพันธ์ระหว่างการสะสมของฝุ่นกับกระแสไฟฟ้าที่แผงโซลาร์เซลล์สามารถผลิตได้ ระบบที่นำเสนอสามารถคาดการณ์เวลาที่เหมาะสมในการทำความสะอาด