กลับไปที่นวัตกรรมทั้งหมด

การวิเคราะห์ข้อมูลพอยต์คลาวด์ไลดาร์เพื่อการตรวจจับวัตถุแบบสามมิติในรถยนต์ขับเคลื่อนอัตโนมัติ

LiDAR point cloud analysis for 3D Object Detection in autonomous vehicles

@คณะวิศวกรรมศาสตร์

#KLLC 2024
#Industry 4.0
การวิเคราะห์ข้อมูลพอยต์คลาวด์ไลดาร์เพื่อการตรวจจับวัตถุแบบสามมิติในรถยนต์ขับเคลื่อนอัตโนมัติ

รายละเอียด

ในปัจจุบัน ไลดาร์เป็นเซนเซอร์ชนิดหนึ่งซึ่งเข้ามามีบทบาทสำคัญในระบบยานยนต์ขับเคลื่อนอัตโนมัติเพื่อใช้ตรวจจับวัตถุ โดยไลดาร์นั้นจะใช้การวัดระยะทางด้วยเลเซอร์ในย่านใกล้อินฟราเรดซึ่งทำให้มีความละเอียดของข้อมูลที่มากกว่าการใช้เรดาร์ และ ข้อมูลจากกล้อง และด้วยการประยุกต์ใช้ไลดาร์เพื่อตรวจจับวัตถุแบบสามมิติ ทำให้การตรวจจับมีความแม่นยำมากขึ้น อย่างไรก็ตาม ข้อมูลที่ได้จากไลดาร์นั้นกระจัดกระจายมาก กล่าวคือ ไม่มีโครงสร้างของข้อมูลที่ชัดเจน โดยเปรียบเทียบกับข้อมูลรูปภาพที่มีโครงสร้างของพิกเซลที่ชัดเจน สามารถระบุตำแหน่งได้ชัด มากไปกว่านั้น ข้อมูลไลดาร์ยังมีปริมาณที่ค่อนข้างมาก โดยทั่วไปแล้วอาจมีจำนวนข้อมูลประมาณหนึ่งแสนจุดต่อการประมวลผลหนึ่งครั้ง ซึ่งอาจทำให้การคำนวณต่างๆต้องใช้ระยะเวลาพอสมควร ดังนั้น ในโครงงานฉบับนี้จึงมุ่งเน้นไปที่การศึกษาระเบียบวิธีการประมวลผลข้อมูลไลดาร์แบบต่างๆ รวมถึงการใช้โครงข่ายประสาทเทียมในการสร้างตัวตรวจจับวัตถุแบบสามมิติโดยใช้ข้อมูลไลดาร์ เพื่อใช้เป็นพื้นฐานสำหรับการพัฒนาการตรวจจับวัตถุแบบสามมิติในอนาคต

วัตถุประสงค์

ในระบบยานยนต์สมัยใหม่ ระบบขับเคลื่อนอัตโนมัติเริ่มมีส่วนเข้ามาเกี่ยวข้องในชีวิตประจำวัน ซึ่งทำให้เกิดความสะดวกสบาย และ ความปลอดภัยมากยิ่งขึ้นสำหรับผู้ใช้โดยเฉพาะในรถยนต์ หนึ่งในองค์ประกอบของระบบขับเคลื่อนอัตโนมัติก็คงจะเป็นอะไรไปไม่ได้นอกจากการตรวจรู้วัตถุ และ สภาพแวดล้อมโดยรอบของตัวยานยนต์นั้นๆ ซึ่งในปัจจุบันก็มีวิธีมากมายในการตรวจรู้ ไม่ว่าจะเป็นการใช้กล้องเดี่ยว (Monoscopic) หรือ กล้องรอบคันรถ (Surround Camera) และเซนเซอร์อย่างเรดาร์ (Radio Detection and Ranging) หรือ ไลดาร์ (Light Detection and Ranging) อย่างไรก็ตาม เซนเซอร์แต่ละชนิดนั้นก็มีคุณสมบัติเฉพาะตัวที่ต่างกันออกไป และ เหมาะสมกับในสถานการณ์ที่ต่างกันออกไป เช่น ในกล้องเดี่ยวหน้ารถ อาจเหมาะกับการใช้งานในช่วงเวลากลางวัน เพราะมีระดับแสงที่เหมาะสม แต่ในช่วงเวลากลางคืนอาจไม่เหมาะสมมากนัก เพราะปริมาณแสงที่ไม่เพียงพอ (กรณีที่มีไฟทางไม่สว่างพอ) จึงทำให้ประสิทธิภาพการทำงานของกล้องเดี่ยวลดลง อย่างไรก็ตาม ในโครงงามฉบับนี้จะมุ่งเน้นไปที่การศึกษาเซนเซอร์ไลดาร์ ซึ่งใช้หลักการของการสะท้อนกลับของแสงโดยเทียบกับระยะเวลาที่แสงเดินทางไปตกกระทบกับวัตถุและสะท้อนกลับมา เพื่อใช้คำนวณเป็นระยะทาง แต่สิ่งที่ชุดข้อมูลจากไลดาร์มีความแตกต่างจากข้อมูลรูปเลยนั่นคือ ข้อมูลไลดาร์มีโครงสร้างที่ไม่แน่นอน และ มีการกระจายตัวของข้อมูลอย่างมาก หากเปรียบเทียบกับรูปภาพนั้น รูปภาพมีโครงสร้างที่แน่นอนกว่า นั่นคือ มีการเรียงตัวของพิกเซลอย่างแน่นอน แต่สำหรับไลดาร์นั้นไม่ได้มีการเรียงตัวเป็นพิกเซลอย่างในรูปภาพ แต่เป็นจุดที่เรียกว่าพอยต์คลาวด์ (Point Cloud) กระจายตัวอยู่ทั่วปริภูมิ 3 มิติ ดังนั้น การประมวลผลรูปภาพต่างๆ ซึ่งทำในปริภูมิ 2 มิติ ไม่สามารถปรับใช้กับชุดข้อมูลพอยต์คลาวด์ได้โดยตรง เพียงเพราะเป็นข้อมูลแบบ 3 มิติ แต่เป็นข้อมูลที่ไม่มีโครงสร้างแน่นอนอีกด้วย แต่ในปัจจุบัน มีการพัฒนาโครงสร้างประสาทเทียมหลายชนิดเพื่อนำมาใช้ในการจำแนกประเภทวัตถุแบบ 3 มิติโดยใช้ไลดาร์ได้เป็นจำนวนมาก ซึ่งอาจแบ่งประเภทของโครงสร้างได้เป็น 3 แบบหลักๆคือ 1) โครงสร้างที่ประมวลผลพอยต์คลาวด์โดยตรง และ 2) โดยสร้างที่ประมวลผลพอยต์คลาวด์ทางอ้อม เช่นการทำ Voxelization เพื่อแปลงพอยต์คลาวด์ให้เป็นกล่อง 3 มิติและประมวลผลต่อจากนั้น หรือแปลงให้เป็นรูป 2 มิติ (Bird’s Eye View) และประมวลผลต่อ ซึ่งในแต่ละแบบก็จะมีข้อดีและข้อเสียที่ต่างกันออกไป อย่างไรก็ตาม ในแต่ละโครงสร้างนั้น ไม่ว่าจะเป็นการประมวลผลทางตรงหรือทางอ้อม ก็จะต้องประกอบไปด้วยองค์ประกอบของโครงข่ายประสาทเทียมประเภทเดียวกัน โครงงานนี้จึงจะทำการศึกษาโครงสร้างของประสาทเทียมประเภทต่างๆ และพัฒนาโครงสร้างที่มีอยู่ ให้ดียิ่งขึ้นต่อไป

ผู้จัดทำ

ศิรัส ทองอรุณ
SIRUS THONGARUN

#นักศึกษา

สมาชิก
สุเมฆ วิศยทักษิณ
Sumek Wisayataksin

#อาจารย์

อาจารย์ที่ปรึกษา

โหวตนวัตกรรมนี้

กำลังดาวน์โหลด