KMITL Expo 2026 LogoKMITL 66th Anniversary Logo

SignGen: An LLM-Based Thai Sign Language Generator

SignGen: An LLM-Based Thai Sign Language Generator

Abstract

The Thai Sign Language Generation System aims to create a comprehensive 3D modeling and animation platform that translates Thai sentences into dynamic and accurate representations of Thai Sign Language (TSL) gestures. This project enhances communication for the Thai deaf community by leveraging a landmark-based approach using a Vector Quantized Variational Autoencoder (VQVAE) and a Large Language Model (LLM) for sign language generation. The system first trains a VQVAE encoder using landmark data extracted from sign videos, allowing it to learn compact latent representations of TSL gestures. These encoded representations are then used to generate additional landmark-based sign sequences, effectively expanding the training dataset using the BigSign ThaiPBS dataset. Once the dataset is augmented, an LLM is trained to output accurate landmark sequences from Thai text inputs, which are then used to animate a 3D model in Blender, ensuring fluid and natural TSL gestures. The project is implemented using Python, incorporating MediaPipe for landmark extraction, OpenCV for real-time image processing, and Blender’s Python API for 3D animation. By integrating AI, VQVAE-based encoding, and LLM-driven landmark generation, this system aspires to bridge the communication gap between written Thai text and expressive TSL gestures, providing the Thai deaf community with an interactive, real-time sign language animation platform.

Objective

การสื่อสารระหว่างบุคคลที่ได้ยินกับผู้พิการทางการได้ยินหรือบุคคลที่ไม่สามารถใช้คำพูดเป็นอุปสรรคสำคัญ โดยเฉพาะเมื่อบุคคลที่ได้ยินไม่มีความคุ้นเคยกับภาษามือไทย (TSL) ภาษามือไทยมีความซับซ้อนและต้องใช้การฝึกฝน ความตั้งใจ และประสบการณ์อย่างมากจึงจะเชี่ยวชาญได้ ซึ่งมักต้องใช้เวลาหลายเดือนของการศึกษาอย่างต่อเนื่อง แม้แต่เพื่อให้ได้ระดับความคล่องแคล่วขั้นพื้นฐาน สิ่งนี้ก่อให้เกิดช่องว่างด้านการเข้าถึง โดยเฉพาะกับผู้พิการทางการได้ยินที่อาจไม่เคยเรียนรู้ไวยากรณ์หรือภาษาไทยมาตรฐาน อาจพบความยากลำบากในการทำความเข้าใจข้อความภาษาไทยที่เขียน ซึ่งยิ่งทำให้การสื่อสารเป็นเรื่องที่ท้าทายยิ่งขึ้น แม้ว่าการใช้ข้อความเขียนอาจดูเหมือนเป็นทางออกหนึ่งของการสื่อสาร แต่ในความเป็นจริงอาจไม่ได้ผลเสมอไป เนื่องจากผู้พิการทางการได้ยินบางคนอาจไม่สามารถอ่านหรือทำความเข้าใจข้อความภาษาไทยได้อย่างคล่องแคล่ว อันเนื่องมาจากการไม่ได้สัมผัสกับไวยากรณ์ของภาษาพูดแบบดั้งเดิม นี่จึงเป็นเหตุผลสำคัญที่ต้องมีเครื่องมือแปลภาษาแบบเรียลไทม์ที่สามารถแปลงข้อความภาษาไทยเป็นภาษามือไทยได้อย่างถูกต้อง เพื่อช่วยลดช่องว่างนี้ และส่งเสริมให้เกิดปฏิสัมพันธ์ที่มีความหมายระหว่างผู้พิการทางการได้ยิน บุคคลที่ไม่สามารถใช้คำพูด และบุคคลที่ได้ยิน

Other Innovations

none

คณะเทคโนโลยีการเกษตร

none

-

Read more
Mulberry Kefir Prebiotic Plus

คณะครุศาสตร์อุตสาหกรรมและเทคโนโลยี

Mulberry Kefir Prebiotic Plus

Mulberry Kefir is a fermented drink made from ripe mulberry fruit, made from ripe mulberry juice. Its pinkish-red color is the color of the natural anthocyanin in mulberries. Anthocyanins have antioxidant properties and contain the prebiotic fructo-oligosaccharides, the probiotic microorganisms Lactobacillus and Saccharomeces. It has a sweet and sour taste, is fizzy and has a little alcohol. The taste and fizz come from production technology, which uses a fermentation process from microorganisms. Mulberry kefir is considered a functional beverage made from plants (Plant Based Beverage), suitable for people who are lactose intolerant and those who do not consume beverages made from milk. It makes you feel refreshed after drinking it.

Read more
Café Customer Classification and Behavioral Analysis

คณะวิทยาศาสตร์

Café Customer Classification and Behavioral Analysis

In a highly competitive business, understanding customers is crucial for an organization to determine its success. Effective marketing is not just about offering good products, promotions, or services; it also requires strategies to reach and build strong relationships with customer groups. Segmenting customers is one method that helps businesses deeply understand the needs and behaviors of the customers who use their services In this internship, the objective is to understand the behavior of customers purchasing coffee and tea at a large cafe group by analyzing stored customer data. As a result of this process, customer groups purchasing coffee and tea were segmented using Naive Bayes, Random Forest, and Deep Learning techniques to compare the accuracy and suitability of different Machine Learning methods, and the insights gained from this analysis can be for further development in analyzing other data set in the future

Read more