Back
Cyberbullying Detection from Social Media with Thai Memes
การตรวจจับการระรานทางไซเบอร์บนสื่อสังคมออนไลน์จากมีมไทย
@คณะเทคโนโลยีสารสนเทศ
#KLLC 2024
#Digital Technology
Details
In the present day, people tend to communicate more through the Internet due to its speed and convenience. However, there are hidden drawbacks, such as the misuse of online social media and the occurrence of cyberbullying, which can lead to negative feelings or even mental health issues. Therefore, it is necessary to develop cyberbullying detection methods, which have been studied in various languages but are still lacking in Thai. This research aims to develop a model for detecting cyberbullying in online social media, with the primary objective of creating a Thai dataset for model development using deep learning techniques. This data will be collected from Facebook, the largest online social media platform in Thailand. The developed model will utilize multimodal concepts, incorporating text and image analysis, considering various aspects such as gender, sexual orientation, physical appearance, race, religion, politics, and other Thai contextual factors.
Objective
ในปัจจุบันสมาร์ทโฟนหรืออุปกรณ์คอมพิวเตอร์ได้ถูกพัฒนาให้มีราคาที่ผู้คนสามารถเข้าถึงได้ มากกว่าในอดีต ส่งผลให้ผู้คนนิยมติดต่อสื่อสารผ่านทางอินเทอร์เน็ตมากยิ่งขึ้น เนื่องจากรวดเร็วและสะดวกสบาย ทำให้สถิติการใช้สื่อสังคมออนไลน์ของประเทศไทยมีผู้ใช้สูงถึง 56.85 ล้านราย ซึ่งเป็นอัตราส่วนต่อประชากรทั้งหมดอยู่ที่ 81.2% โดยคนไทยใช้เวลาเล่นสื่อสังคมออนไลน์โดยเฉลี่ยอยู่ที่ 2 ชั่วโมง 59 นาทีต่อวัน (we are social, 2022) แสดงให้เห็นว่าสื่อสังคมออนไลน์เป็นส่วนหนึ่งในชีวิตประจำวัน ทั้งนี้สื่อสังคมออนไลน์ไม่ได้มีเพียงแค่ข้อดีในการติดต่อสื่อสารเท่านั้น แต่ยังแฝงไปด้วยข้อเสียที่เกิดจากพฤติกรรมการใช้สื่อสังคมออนไลน์ในทางที่ผิด เช่น การหลอกลวง การสวมตัวตนผู้อื่น รวมไปถึงการระรานทางไซเบอร์ที่ปัจจุบันเป็นหนึ่งในปัญหาที่ก่อเกิดความรู้สึกเชิงลบ หรือนำไปสู่อาการทางจิตใจในผู้คนกลุ่มหนึ่งได้ ดังนั้นการตรวจจับการะรานทางไซเบอร์จึงมีความจำเป็นต้องถูกพัฒนาเพื่อป้องกันไม่ให้เกิดปัญหาเหล่านี้ขึ้น โดยการตรวจจับการระรานทางไซเบอร์นั้นถูกศึกษาในภาษาอื่น ๆ ในหลาย ๆ ด้านแล้ว เช่น ข้อความ รูปภาพมีม แต่ในภาษาไทยนั้นยังไม่มีการริเริ่มการตรวจจับการระรานทางไซเบอร์ด้วยการพิจารณาจากรูปภาพมีม เพราะฉะนั้นจึงมีความต้องการที่จะจัดทำชุดข้อมูล Cyberbullying Detection from Social Media with Thai Memes ขึ้น เพื่อพัฒนาการตรวจจับการระรานทางไซเบอร์ในบริบทของคนไทย โดยจะจัดเก็บข้อมูลจาก Facebook ซึ่งเป็นสื่อสังคมออนไลน์ที่มีผู้ใช้มากที่สุดในประเทศไทย โดยมีผู้ใช้มากถึง 50.05 ล้านราย คิดเป็น 93.3% ของประชากรทั้งหมด (we are social, 2022) และสร้างแบบจำลองการเรียนรู้ของเครื่องเชิง Multimodal (Text, Image) สำหรับตรวจจับการระรานทางไซเบอร์ในบริบทของคนไทย โดยพิจารณาการระรานทางไซเบอร์ในด้านต่าง ๆ เช่น เพศ รสนิยมทางเพศ ลักษณะรูปลักษณ์ เชื้อชาติ ศาสนา การเมือง ซึ่งพิจารณาจากงาน (Task) อื่น ๆ นอกเหนือจากการระรานทางไซเบอร์ในบริบทของคนไทยร่วมด้วย ได้แก่ Sentiment, Emotion, Sarcasm, Harmful, Offensive, Topic
Project Members
ศลิษา โพธิ์สิทธิ์
SALISA PHOSIT
#นักศึกษา
Member
สวรส คงสัมฤทธิ์
SAWAROD KONGSAMLIT
#นักศึกษา
Member
กิติ์สุชาต พสุภา
Kitsuchart Pasupa
#อาจารย์
Advisor
Vote for this Innovation!
Loading...
Powered By KMITL Innovation Project