KMITL Innovation Expo 2025 Logo

CLASSIFICATION OF OTITIS MEDIA TYPE USING OTOSCOPIC IMAGES

Abstract

Otitis Media is an infection of the middle ear that can occur in individuals of all ages. Diagnosis typically involves analyzing images taken with an otoscope by specialized physicians, which relies heavily on medical experience to expedite the process. This research introduces computer vision technology to assist in the preliminary diagnosis, aiding expert decision-making. By utilizing deep learning techniques and convolutional neural networks, specifically the YOLOv8 and Inception v3 architectures, the study aims to classify the disease and its five characteristics used by physicians: color, transparency, fluid, retraction, and perforation. Additionally, image segmentation and classification methods were employed to analyze and predict the types of Otitis Media, which are categorized into four types: Otitis Media with Effusion, Acute Otitis Media with Effusion, Perforation, and Normal. Experimental results indicate that the classification model performs moderately well in directly classifying Otitis Media, with an accuracy of 65.7%, a recall of 65.7%, and a precision of 67.6%. Moreover, the model provides the best results for classifying the perforation characteristic, with an accuracy of 91.8%, a recall of 91.8%, and a precision of 92.1%. In contrast, the classification model that incorporates image segmentation techniques achieved the best overall performance, with an mAP50-95 of 79.63%, a recall of 100%, and a precision of 99.8%. However, this model has not yet been tested for classifying the different types of Otitis Media.

Objective

โรคหูน้ำหนวกเป็นโรคที่เกิดจากการอักเสบของหูชั้นกลาง โดยมีอาการปวดหู หูอื้อ และมีน้ำไหลซึมออกมาจากหู ในบางกรณีที่ได้รับการรักษาไม่ถูกต้องหรือไม่ทันการ อาจพบว่ามีน้ำหนองซึมรวมอยู่ด้วย นอกจากนี้หากอาการอักเสบเกิดความรุนแรงเพิ่มมากขึ้น อาจส่งผลให้ผู้ป่วยสูญเสียการได้ยินและเกิดภาวะแทรกซ้อนซึ่งเป็นสาเหตุอันนำไปสู่การเกิดโรคอื่น ๆ ในกระบวนการรักษาโรคหูน้ำหนวกจำเป็นต้องมีแพทย์ผู้เชี่ยวชาญทำการวินิจฉัย โดยสอดกล้องออโตสโคปเข้าไปในรูหูเพื่อตรวจสอบ อย่างไรก็ตาม ในขั้นตอนนี้มักพบปัญหาและข้อจำกัดบางประการ เช่น ทักษะและประสบการณ์ของแพทย์ผู้ตรวจอาจไม่ชำนาญพอจะวินิจฉัยได้อย่างถูกต้องแม่นยำ ความพร้อมของเครื่องมือและอุปกรณ์ซึ่ง ในบางครั้งจำเป็นต้องมีการวินิจฉัยเพิ่มด้วยการวัดขนาดแก้วหูหรือการถ่ายภาพ ดังนั้นแล้วในขั้นตอนการรักษานี้สามารถพัฒนาเครื่องมือร่วมกับการประยุกต์ใช้ศาสตร์องค์-ความรู้ทางด้านคอมพิวเตอร์เข้ามาเพื่อแก้ปัญหา รวมทั้งช่วยลดภาระงานของบุคลากรทางการแพทย์ โดยเฉพาะอย่างยิ่งคือการขาดแคลนบุคลากรซึ่งมีไม่เพียงพอต่อปริมาณผู้ป่วย นอกจากนี้เพื่อให้การรักษามีประสิทธิภาพ ยังต้องคำนึงถึงความพร้อมของแพทย์ผู้รักษาซึ่งไม่ใช่เพียงทักษะหรือเครื่องมือ แต่รวมไปถึงสภาพร่างกายที่อาจเกิดจากความเหนื่อยล้าและโอกาสเกิดข้อผิดพลาดจากการวินิจฉัย หัวข้อปัญหาพิเศษนี้จึงได้นำเสนอแนวทางการแก้ไขปัญหาโดยการนำทฤษฎีการเรียนรู้เชิงลึก(Deep Learning) มาประยุกต์ใช้ เพื่อเป็นเครื่องมือช่วยในการจำแนกอาการผิดปกติของโรคหูน้ำหนวกจากภาพถ่ายและภาพเคลื่อนไหว ซึ่งเก็บรวบรวมจากแพทย์ผู้เชี่ยวชาญ ทั้งนี้ ปัจจัยสำคัญที่เป็นจุดสังเกตในการวินิจฉัยโรค ได้แก่ ปริมาณของเหลวในหูชั้นกลาง การหดตัวของเยื่อหูชั้นกลาง สีของของเหลวในหูชั้นกลาง ความโปร่งใสของเยื่อหูชั้นกลาง การทะลุของเยื่อหู และการขยับของเยื่อ-แก้วหูเมื่อเป่าลมทดสอบ ทั้งหมดนี้สามารถนำไปวิเคราะห์และจำแนกเป็นอาการได้ดังนี้ หูปกติ เยื่อ-แก้วหูยุบ เยื่อแก้วหูทะลุ มีของเหลวขังในเยื่อแก้วหู เยื่อแก้วหูอักเสบเฉียบพลัน และหูชั้นกลางทะลุ

Other Innovations

Development of tea from longan peels and seeds

คณะบริหารธุรกิจ

Development of tea from longan peels and seeds

This research aimed to develop the mixed tea from longan peels and seeds. Population studied were longan farmers who planted longan and preserved the longan product in Ampur Wang Nam Yen, Sa Kaeo Province. From the results, it was found that from By-product in the production of dehydrated longan, longan peels and seeds, which can be processed into ready-to-drink powdered tea. This not only helps reduce waste from the production process but also contributes to generating additional income from these by-products.

Read more
Vision-Based Spacecraft Pose Estimation

วิทยาลัยอุตสาหกรรมการบินนานาชาติ

Vision-Based Spacecraft Pose Estimation

The capture of a target spacecraft by a chaser is an on-orbit docking operation that requires an accurate, reliable, and robust object recognition algorithm. Vision-based guided spacecraft relative motion during close-proximity maneuvers has been consecutively applied using dynamic modeling as a spacecraft on-orbit service system. This research constructs a vision-based pose estimation model that performs image processing via a deep convolutional neural network. The pose estimation model was constructed by repurposing a modified pretrained GoogLeNet model with the available Unreal Engine 4 rendered dataset of the Soyuz spacecraft. In the implementation, the convolutional neural network learns from the data samples to create correlations between the images and the spacecraft’s six degrees-of-freedom parameters. The experiment has compared an exponential-based loss function and a weighted Euclidean-based loss function. Using the weighted Euclidean-based loss function, the implemented pose estimation model achieved moderately high performance with a position accuracy of 92.53 percent and an error of 1.2 m. The in-attitude prediction accuracy can reach 87.93 percent, and the errors in the three Euler angles do not exceed 7.6 degrees. This research can contribute to spacecraft detection and tracking problems. Although the finished vision-based model is specific to the environment of synthetic dataset, the model could be trained further to address actual docking operations in the future.

Read more
Biogas and Bio-products for Agriculture and Environment

คณะวิทยาศาสตร์

Biogas and Bio-products for Agriculture and Environment

-

Read more