KMITL Expo 2026 LogoKMITL 66th Anniversary Logo

CLASSIFICATION OF OTITIS MEDIA TYPE USING OTOSCOPIC IMAGES

Abstract

Otitis Media is an infection of the middle ear that can occur in individuals of all ages. Diagnosis typically involves analyzing images taken with an otoscope by specialized physicians, which relies heavily on medical experience to expedite the process. This research introduces computer vision technology to assist in the preliminary diagnosis, aiding expert decision-making. By utilizing deep learning techniques and convolutional neural networks, specifically the YOLOv8 and Inception v3 architectures, the study aims to classify the disease and its five characteristics used by physicians: color, transparency, fluid, retraction, and perforation. Additionally, image segmentation and classification methods were employed to analyze and predict the types of Otitis Media, which are categorized into four types: Otitis Media with Effusion, Acute Otitis Media with Effusion, Perforation, and Normal. Experimental results indicate that the classification model performs moderately well in directly classifying Otitis Media, with an accuracy of 65.7%, a recall of 65.7%, and a precision of 67.6%. Moreover, the model provides the best results for classifying the perforation characteristic, with an accuracy of 91.8%, a recall of 91.8%, and a precision of 92.1%. In contrast, the classification model that incorporates image segmentation techniques achieved the best overall performance, with an mAP50-95 of 79.63%, a recall of 100%, and a precision of 99.8%. However, this model has not yet been tested for classifying the different types of Otitis Media.

Objective

โรคหูน้ำหนวกเป็นโรคที่เกิดจากการอักเสบของหูชั้นกลาง โดยมีอาการปวดหู หูอื้อ และมีน้ำไหลซึมออกมาจากหู ในบางกรณีที่ได้รับการรักษาไม่ถูกต้องหรือไม่ทันการ อาจพบว่ามีน้ำหนองซึมรวมอยู่ด้วย นอกจากนี้หากอาการอักเสบเกิดความรุนแรงเพิ่มมากขึ้น อาจส่งผลให้ผู้ป่วยสูญเสียการได้ยินและเกิดภาวะแทรกซ้อนซึ่งเป็นสาเหตุอันนำไปสู่การเกิดโรคอื่น ๆ ในกระบวนการรักษาโรคหูน้ำหนวกจำเป็นต้องมีแพทย์ผู้เชี่ยวชาญทำการวินิจฉัย โดยสอดกล้องออโตสโคปเข้าไปในรูหูเพื่อตรวจสอบ อย่างไรก็ตาม ในขั้นตอนนี้มักพบปัญหาและข้อจำกัดบางประการ เช่น ทักษะและประสบการณ์ของแพทย์ผู้ตรวจอาจไม่ชำนาญพอจะวินิจฉัยได้อย่างถูกต้องแม่นยำ ความพร้อมของเครื่องมือและอุปกรณ์ซึ่ง ในบางครั้งจำเป็นต้องมีการวินิจฉัยเพิ่มด้วยการวัดขนาดแก้วหูหรือการถ่ายภาพ ดังนั้นแล้วในขั้นตอนการรักษานี้สามารถพัฒนาเครื่องมือร่วมกับการประยุกต์ใช้ศาสตร์องค์-ความรู้ทางด้านคอมพิวเตอร์เข้ามาเพื่อแก้ปัญหา รวมทั้งช่วยลดภาระงานของบุคลากรทางการแพทย์ โดยเฉพาะอย่างยิ่งคือการขาดแคลนบุคลากรซึ่งมีไม่เพียงพอต่อปริมาณผู้ป่วย นอกจากนี้เพื่อให้การรักษามีประสิทธิภาพ ยังต้องคำนึงถึงความพร้อมของแพทย์ผู้รักษาซึ่งไม่ใช่เพียงทักษะหรือเครื่องมือ แต่รวมไปถึงสภาพร่างกายที่อาจเกิดจากความเหนื่อยล้าและโอกาสเกิดข้อผิดพลาดจากการวินิจฉัย หัวข้อปัญหาพิเศษนี้จึงได้นำเสนอแนวทางการแก้ไขปัญหาโดยการนำทฤษฎีการเรียนรู้เชิงลึก(Deep Learning) มาประยุกต์ใช้ เพื่อเป็นเครื่องมือช่วยในการจำแนกอาการผิดปกติของโรคหูน้ำหนวกจากภาพถ่ายและภาพเคลื่อนไหว ซึ่งเก็บรวบรวมจากแพทย์ผู้เชี่ยวชาญ ทั้งนี้ ปัจจัยสำคัญที่เป็นจุดสังเกตในการวินิจฉัยโรค ได้แก่ ปริมาณของเหลวในหูชั้นกลาง การหดตัวของเยื่อหูชั้นกลาง สีของของเหลวในหูชั้นกลาง ความโปร่งใสของเยื่อหูชั้นกลาง การทะลุของเยื่อหู และการขยับของเยื่อ-แก้วหูเมื่อเป่าลมทดสอบ ทั้งหมดนี้สามารถนำไปวิเคราะห์และจำแนกเป็นอาการได้ดังนี้ หูปกติ เยื่อ-แก้วหูยุบ เยื่อแก้วหูทะลุ มีของเหลวขังในเยื่อแก้วหู เยื่อแก้วหูอักเสบเฉียบพลัน และหูชั้นกลางทะลุ

Other Innovations

Developing An Open-Source Tool for Power System and Microgrid Analysis

คณะวิศวกรรมศาสตร์

Developing An Open-Source Tool for Power System and Microgrid Analysis

In this project, we introduce Power Grid Analyzer (PGAz), an open-source software package based on MATLAB, specifically designed for analyzing and controlling future power grids. Initially, PGAz is equipped with four fundamental features: power flow (PF), optimal power flow (OPF), small-signal stability analysis (SSSA), and time-domain simulation (TS). At this stage, Part I concentrates on the development of PF and OPF. The formats of our developed tool are presented, along with its command prompts. In this part, we have developed several conventional yet effective methods in the PGAz package to address PF and OPF problems, including techniques such as the Newton-Raphson method, Gauss-Seidel method, Interior Point Method, Iwamoto’s method, Fast Decoupled Load Flow, Genetic Algorithm, and Particle Swarm Optimization. Additionally, it emphasizes important aspects, algorithms, and various case studies that have been tested against IEEE benchmarks ranging from the IEEE 5-bus to the IEEE 300-bus test systems. The results demonstrate the capabilities of PGAz for future educational and research applications in PF and OPF. Finally, we outline a plan for developing Part II, which will mainly focus on SSSA and TS.

Read more
Web Application System Prototype for Hand Dental Instruments Identifying and Counting using Deep Learning

คณะเทคโนโลยีสารสนเทศ

Web Application System Prototype for Hand Dental Instruments Identifying and Counting using Deep Learning

This research presents the development of an AI-powered system designed to automate the identification and quantification of dental surgical instruments. By leveraging deep learning-based object detection, the system ensures the completeness of instrument sets post-procedure. The system's ability to process multiple images simultaneously streamlines the inventory process, reducing manual effort and potential errors. The extracted data on instrument quantity and type can be seamlessly integrated into a database for various downstream applications.

Read more
Metaverse Ho Klong For tourism in Phitsanulok Province

คณะเทคโนโลยีสารสนเทศ

Metaverse Ho Klong For tourism in Phitsanulok Province

This research project aims to study and develop a metaverse system for tourism in Horklong Subdistrict, Phitsanulok Province. The primary goal is to create a prototype metaverse system that showcases the cultural and historical tourist attractions in Horklong Subdistrict through virtual reality technology. This will help promote tourism in rural areas that are not yet widely known and enhance the modern promotion of tourist attractions in the province. The development of the metaverse system in this project utilizes virtual reality technology to simulate the experience of touring Horklong Subdistrict via a virtual boat ride. Users will be able to access the system through the Unity platform, which is a tool used to develop 3D and VR applications. The system is designed to allow users to choose to ride a virtual boat and visit various places that have been creatively recreated in a virtual format. These locations are designed and developed using 3D models based on real data collected from the Horklong Subdistrict area. This project is therefore an initiative to sustainably promote cultural and historical tourism in Phitsanulok Province. It has the potential to increase income for local communities as well as to disseminate local knowledge and wisdom to a broader audience. The metaverse system for tourism in Horklong Subdistrict is thus an important project in modernizing the province’s tourism sector and attracting more visitors, both domestically and internationally.

Read more