KMITL Expo 2026 LogoKMITL 66th Anniversary Logo

CLASSIFICATION OF OTITIS MEDIA TYPE USING OTOSCOPIC IMAGES

Abstract

Otitis Media is an infection of the middle ear that can occur in individuals of all ages. Diagnosis typically involves analyzing images taken with an otoscope by specialized physicians, which relies heavily on medical experience to expedite the process. This research introduces computer vision technology to assist in the preliminary diagnosis, aiding expert decision-making. By utilizing deep learning techniques and convolutional neural networks, specifically the YOLOv8 and Inception v3 architectures, the study aims to classify the disease and its five characteristics used by physicians: color, transparency, fluid, retraction, and perforation. Additionally, image segmentation and classification methods were employed to analyze and predict the types of Otitis Media, which are categorized into four types: Otitis Media with Effusion, Acute Otitis Media with Effusion, Perforation, and Normal. Experimental results indicate that the classification model performs moderately well in directly classifying Otitis Media, with an accuracy of 65.7%, a recall of 65.7%, and a precision of 67.6%. Moreover, the model provides the best results for classifying the perforation characteristic, with an accuracy of 91.8%, a recall of 91.8%, and a precision of 92.1%. In contrast, the classification model that incorporates image segmentation techniques achieved the best overall performance, with an mAP50-95 of 79.63%, a recall of 100%, and a precision of 99.8%. However, this model has not yet been tested for classifying the different types of Otitis Media.

Objective

โรคหูน้ำหนวกเป็นโรคที่เกิดจากการอักเสบของหูชั้นกลาง โดยมีอาการปวดหู หูอื้อ และมีน้ำไหลซึมออกมาจากหู ในบางกรณีที่ได้รับการรักษาไม่ถูกต้องหรือไม่ทันการ อาจพบว่ามีน้ำหนองซึมรวมอยู่ด้วย นอกจากนี้หากอาการอักเสบเกิดความรุนแรงเพิ่มมากขึ้น อาจส่งผลให้ผู้ป่วยสูญเสียการได้ยินและเกิดภาวะแทรกซ้อนซึ่งเป็นสาเหตุอันนำไปสู่การเกิดโรคอื่น ๆ ในกระบวนการรักษาโรคหูน้ำหนวกจำเป็นต้องมีแพทย์ผู้เชี่ยวชาญทำการวินิจฉัย โดยสอดกล้องออโตสโคปเข้าไปในรูหูเพื่อตรวจสอบ อย่างไรก็ตาม ในขั้นตอนนี้มักพบปัญหาและข้อจำกัดบางประการ เช่น ทักษะและประสบการณ์ของแพทย์ผู้ตรวจอาจไม่ชำนาญพอจะวินิจฉัยได้อย่างถูกต้องแม่นยำ ความพร้อมของเครื่องมือและอุปกรณ์ซึ่ง ในบางครั้งจำเป็นต้องมีการวินิจฉัยเพิ่มด้วยการวัดขนาดแก้วหูหรือการถ่ายภาพ ดังนั้นแล้วในขั้นตอนการรักษานี้สามารถพัฒนาเครื่องมือร่วมกับการประยุกต์ใช้ศาสตร์องค์-ความรู้ทางด้านคอมพิวเตอร์เข้ามาเพื่อแก้ปัญหา รวมทั้งช่วยลดภาระงานของบุคลากรทางการแพทย์ โดยเฉพาะอย่างยิ่งคือการขาดแคลนบุคลากรซึ่งมีไม่เพียงพอต่อปริมาณผู้ป่วย นอกจากนี้เพื่อให้การรักษามีประสิทธิภาพ ยังต้องคำนึงถึงความพร้อมของแพทย์ผู้รักษาซึ่งไม่ใช่เพียงทักษะหรือเครื่องมือ แต่รวมไปถึงสภาพร่างกายที่อาจเกิดจากความเหนื่อยล้าและโอกาสเกิดข้อผิดพลาดจากการวินิจฉัย หัวข้อปัญหาพิเศษนี้จึงได้นำเสนอแนวทางการแก้ไขปัญหาโดยการนำทฤษฎีการเรียนรู้เชิงลึก(Deep Learning) มาประยุกต์ใช้ เพื่อเป็นเครื่องมือช่วยในการจำแนกอาการผิดปกติของโรคหูน้ำหนวกจากภาพถ่ายและภาพเคลื่อนไหว ซึ่งเก็บรวบรวมจากแพทย์ผู้เชี่ยวชาญ ทั้งนี้ ปัจจัยสำคัญที่เป็นจุดสังเกตในการวินิจฉัยโรค ได้แก่ ปริมาณของเหลวในหูชั้นกลาง การหดตัวของเยื่อหูชั้นกลาง สีของของเหลวในหูชั้นกลาง ความโปร่งใสของเยื่อหูชั้นกลาง การทะลุของเยื่อหู และการขยับของเยื่อ-แก้วหูเมื่อเป่าลมทดสอบ ทั้งหมดนี้สามารถนำไปวิเคราะห์และจำแนกเป็นอาการได้ดังนี้ หูปกติ เยื่อ-แก้วหูยุบ เยื่อแก้วหูทะลุ มีของเหลวขังในเยื่อแก้วหู เยื่อแก้วหูอักเสบเฉียบพลัน และหูชั้นกลางทะลุ

Other Innovations

3D Soundscape Healing: The L-R Beat Exploration in Binaural Beats Therapy

วิทยาลัยวิศวกรรมสังคีต

3D Soundscape Healing: The L-R Beat Exploration in Binaural Beats Therapy

This project explores the therapeutic potential of binaural beats within a 3D soundscape environment, focusing on the effects of left-right (L-R) beating sound positioning. Using Dolby Atmos technology to create immersive auditory experiences, the research aims to investigate how varying spatial beating sound placements in binaural beat therapy influence mental and emotional healing. Binaural beats, a form of auditory brainwave entrainment, have been shown to promote relaxation, reduce anxiety, and enhance cognitive performance. However, there has been limited exploration of how spatial sound technologies, like Dolby Atmos, can enhance the efficacy of these therapies. This study examines how different beating L-R configurations in a 3D soundscape impact the listener’s perception and therapeutic outcomes. Participants will experience binaural beat sessions in various beating L-R orientations, and physiological and psychological measures, such as heart rate variability and self-reported relaxation levels, will be assessed. The results are expected to provide new insights into the interaction between spatial audio environments and sound-based therapies, potentially improving sound therapy practices by leveraging advanced audio technologies.

Read more
Effect of Packaging Thickness on Corn Silage Quality

คณะเทคโนโลยีการเกษตร

Effect of Packaging Thickness on Corn Silage Quality

Climate change and the increasing unpredictability of environmental conditions have aggravated the shortage of animal feed crops during the dry season. This study examines effect of packaging thickness on the quality of corn silage during long-term storage, to maintain its nutritional value during feed shortages. The results show that packaging with thicknesses of 80, 120, 150, and 200 microns effectively maintain good physical quality, including odor, texture, color, and pH levels, during the 0–21day storage period. The silage had a fermented like fruit flavor or vinegar flavor, a silage texture, and well-preserved leaves and stems. Its color remained yellowish-green, with pH values between 3.7 and 4.7. Additionally, lactic acid analysis found that silage in 200-micron-thick packaging for 21 days had the highest lactic acid content (5.64%). However, there were no significant differences in the nutritional value of the silage across different packaging thicknesses

Read more
Artifical intelligence for agriculture and enviroment

คณะวิศวกรรมศาสตร์

Artifical intelligence for agriculture and enviroment

Artificial intelligence for agriculture and environment is a collection of significant models for enviromental friendly Thailand development. The models create with machine learning and deep learning by Near infrared spectroscopy research center for agricultural and food products, including: Determining the nutrient needs (N P K) of durian trees by measuring durian leaves using a non-destructive technique using artificial intelligence, Identification of combustion properties of biomass from fast-growing trees and agricultural residues using non-destructive techniques combined with artificial intelligence, and Evaluation of global warming due to biomass combustion using non-destructive techniques using artificial intelligence. The basic technology used is Near infrared Fourier transform spectroscopy technology which measurement and output display can be done quickly without chemical, no requirement for special expert, and measurement price per sample is very low. But the instrument cannot be produced in Thailand.

Read more