KMITL Innovation Expo 2025 Logo

Investigation variable star classification through light curve analysis using machine learning approach

Abstract

With the development of space technology, wide-field sky surveys using telescopes have expanded the range of new data available for time-domain astronomical research. Traditional data analysis methods can no longer respond quickly and accurately enough to the growing volume of data. Thus, classifying time-series data, such as light curves, has become a significant challenge in the era of big data. In modern times, analyzing light curves has become essential for using machine learning techniques to handle and filter through massive amounts of data. Machine learning algorithms can be divided into two categories: shallow learning and deep learning. Numerous researchers have proposed and developed a variety of algorithms for light curve classification. In this study, we experimented with Support Vector Machine (SVM) and XGBoost, which are shallow machine learning algorithms, as well as 1D-CNN and Long Short-Term Memory (LSTM), which are deep learning algorithms, which are branches of deep machine learning, to classify variable stars. The training and testing data used in this study were from the Optical Gravitational Lensing Experiment-III (OGLE-III), consisting of variable star data from the Large Magellanic Cloud (LMC), categorized into five main classes: Classical Cepheids, δ Scutis, eclipsing binaries, RR Lyrae stars, and Long-period variables. The results demonstrate the performance analysis of each machine learning algorithm type applied to light curve data, while also highlighting the accuracy and statistical metrics of the algorithms used in the experiments.

Objective

ในงานนี้เราได้เสนอการใช้อัลกอริทึมการเรียนรู้ของเครื่องที่ทำการแบ่งอัลกอริทึมได้เป็น 2 ประเภท คือ แบบตื้นและแบบลึกมาทดสอบประสิทธิภาพโดยแบบตื้นมีมีอัลกอริทึม Support Vector Machine (SVM) และ XGBoost แบบลึกมีอัลกอริทึม 1D-CNN และ Long Short-Term Memory (LSTM) เราพิจารณาข้อมูลการสังเกตที่ได้จากฐานข้อมูล Optical Gravitational Lensing Experiment-III (OGLE-III) ที่เป็นดาวแปรแสงในพื้นที่ Large Magellanic Cloud (LMC) ด้วยกล้องโทรทรรศน์ขนาด 1.3-m Warsaw ที่ติดตั้งที่หอดูดาวลาสคัมปานัส ประเทศชิลี ข้อมูลนี้ประกอบด้วยการสังเกตดาวแปรแสงมากกว่าหนึ่งแสนครั้งโดยพิจารณาจากกราฟแสง และใช้ข้อมูลสถิติต่างๆ เช่น Accuracy, Precision, Recall, F1-score, AUG, mPa, mcc และ kappa ซึ่งงานวิจัยนี้มีจุดมุ่งหมายเพื่อที่จะทดสอบประสิทธิภาพในการจำแนกประเภทของดาวแปรแสงโดยใช้ข้อมูลการวิเคราะห์ light curve ด้วยเทคนิคการเรียนรู้ของเครื่องทั้งสองประเภท เพื่อให้เห็นถึงความเข้าใจในลักษณะและพฤติกรรมของดาวแปรแสง ซึ่งใช้ในประโยชน์ต่างๆ เช่น ความรู้ในด้านดาราศาสตร์ฟิสิกส์หรือการค้นพบดาวเคราะห์ดวงใหม่ๆ และการป้องกันภัยจากดาวแปรแสงมีอาจจะมีผลกระทบต่อโลก อีกทั้งในเรื่องการประหยัดเวลาและทรัพยากรในการที่จะจำแนกประเภทดาวแปรแสงอย่างมีระบบและมีประสิทธิภาพ

Other Innovations

TPA Robot Contest Thailand Championship

คณะวิศวกรรมศาสตร์

TPA Robot Contest Thailand Championship

Inventing robots for the TPA Robotics Competition Thailand Championship 2024, game “Rice Way, Thai Way to the International Way (HARVEST DAY)”

Read more
SignGen: An LLM-Based Thai Sign Language Generator

คณะวิศวกรรมศาสตร์

SignGen: An LLM-Based Thai Sign Language Generator

The Thai Sign Language Generation System aims to create a comprehensive 3D modeling and animation platform that translates Thai sentences into dynamic and accurate representations of Thai Sign Language (TSL) gestures. This project enhances communication for the Thai deaf community by leveraging a landmark-based approach using a Vector Quantized Variational Autoencoder (VQVAE) and a Large Language Model (LLM) for sign language generation. The system first trains a VQVAE encoder using landmark data extracted from sign videos, allowing it to learn compact latent representations of TSL gestures. These encoded representations are then used to generate additional landmark-based sign sequences, effectively expanding the training dataset using the BigSign ThaiPBS dataset. Once the dataset is augmented, an LLM is trained to output accurate landmark sequences from Thai text inputs, which are then used to animate a 3D model in Blender, ensuring fluid and natural TSL gestures. The project is implemented using Python, incorporating MediaPipe for landmark extraction, OpenCV for real-time image processing, and Blender’s Python API for 3D animation. By integrating AI, VQVAE-based encoding, and LLM-driven landmark generation, this system aspires to bridge the communication gap between written Thai text and expressive TSL gestures, providing the Thai deaf community with an interactive, real-time sign language animation platform.

Read more
Café Customer Classification and Behavioral Analysis

คณะวิทยาศาสตร์

Café Customer Classification and Behavioral Analysis

In a highly competitive business, understanding customers is crucial for an organization to determine its success. Effective marketing is not just about offering good products, promotions, or services; it also requires strategies to reach and build strong relationships with customer groups. Segmenting customers is one method that helps businesses deeply understand the needs and behaviors of the customers who use their services In this internship, the objective is to understand the behavior of customers purchasing coffee and tea at a large cafe group by analyzing stored customer data. As a result of this process, customer groups purchasing coffee and tea were segmented using Naive Bayes, Random Forest, and Deep Learning techniques to compare the accuracy and suitability of different Machine Learning methods, and the insights gained from this analysis can be for further development in analyzing other data set in the future

Read more