LiDAR point cloud analysis for 3D Object Detection in autonomous vehicles @ KMITL Innovation Expo 2024

Currently, LiDAR is a type of sensor that plays an important role in autonomous vehicle systems for detecting objects. LiDAR uses laser to measure the distance in the near-infrared region, which provides higher resolution than radar and camera data. and by applying lidar to detect objects in three dimensions. This makes the detection more accurate. However, the information obtained from LiDAR is very sparse, that is, there is no clear data structure. By comparing with image data that has a clear pixel structure. more than that, the amount of LiDAR data is still quite large. Generally, the point cloud may contain up to 10k points per sample, which take various calculations and considerable amount of time. Therefore, this project focuses on studying different LiDAR data processing methods. This includes using neural networks to create 3D object detectors using LiDAR data.

ในระบบยานยนต์สมัยใหม่ ระบบขับเคลื่อนอัตโนมัติเริ่มมีส่วนเข้ามาเกี่ยวข้องในชีวิตประจำวัน ซึ่งทำให้เกิดความสะดวกสบาย และ ความปลอดภัยมากยิ่งขึ้นสำหรับผู้ใช้โดยเฉพาะในรถยนต์ หนึ่งในองค์ประกอบของระบบขับเคลื่อนอัตโนมัติก็คงจะเป็นอะไรไปไม่ได้นอกจากการตรวจรู้วัตถุ และ สภาพแวดล้อมโดยรอบของตัวยานยนต์นั้นๆ ซึ่งในปัจจุบันก็มีวิธีมากมายในการตรวจรู้ ไม่ว่าจะเป็นการใช้กล้องเดี่ยว (Monoscopic) หรือ กล้องรอบคันรถ (Surround Camera) และเซนเซอร์อย่างเรดาร์ (Radio Detection and Ranging) หรือ ไลดาร์ (Light Detection and Ranging) อย่างไรก็ตาม เซนเซอร์แต่ละชนิดนั้นก็มีคุณสมบัติเฉพาะตัวที่ต่างกันออกไป และ เหมาะสมกับในสถานการณ์ที่ต่างกันออกไป เช่น ในกล้องเดี่ยวหน้ารถ อาจเหมาะกับการใช้งานในช่วงเวลากลางวัน เพราะมีระดับแสงที่เหมาะสม แต่ในช่วงเวลากลางคืนอาจไม่เหมาะสมมากนัก เพราะปริมาณแสงที่ไม่เพียงพอ (กรณีที่มีไฟทางไม่สว่างพอ) จึงทำให้ประสิทธิภาพการทำงานของกล้องเดี่ยวลดลง อย่างไรก็ตาม ในโครงงามฉบับนี้จะมุ่งเน้นไปที่การศึกษาเซนเซอร์ไลดาร์ ซึ่งใช้หลักการของการสะท้อนกลับของแสงโดยเทียบกับระยะเวลาที่แสงเดินทางไปตกกระทบกับวัตถุและสะท้อนกลับมา เพื่อใช้คำนวณเป็นระยะทาง แต่สิ่งที่ชุดข้อมูลจากไลดาร์มีความแตกต่างจากข้อมูลรูปเลยนั่นคือ ข้อมูลไลดาร์มีโครงสร้างที่ไม่แน่นอน และ มีการกระจายตัวของข้อมูลอย่างมาก หากเปรียบเทียบกับรูปภาพนั้น รูปภาพมีโครงสร้างที่แน่นอนกว่า นั่นคือ มีการเรียงตัวของพิกเซลอย่างแน่นอน แต่สำหรับไลดาร์นั้นไม่ได้มีการเรียงตัวเป็นพิกเซลอย่างในรูปภาพ แต่เป็นจุดที่เรียกว่าพอยต์คลาวด์ (Point Cloud) กระจายตัวอยู่ทั่วปริภูมิ 3 มิติ ดังนั้น การประมวลผลรูปภาพต่างๆ ซึ่งทำในปริภูมิ 2 มิติ ไม่สามารถปรับใช้กับชุดข้อมูลพอยต์คลาวด์ได้โดยตรง เพียงเพราะเป็นข้อมูลแบบ 3 มิติ แต่เป็นข้อมูลที่ไม่มีโครงสร้างแน่นอนอีกด้วย แต่ในปัจจุบัน มีการพัฒนาโครงสร้างประสาทเทียมหลายชนิดเพื่อนำมาใช้ในการจำแนกประเภทวัตถุแบบ 3 มิติโดยใช้ไลดาร์ได้เป็นจำนวนมาก ซึ่งอาจแบ่งประเภทของโครงสร้างได้เป็น 3 แบบหลักๆคือ 1) โครงสร้างที่ประมวลผลพอยต์คลาวด์โดยตรง และ 2) โดยสร้างที่ประมวลผลพอยต์คลาวด์ทางอ้อม เช่นการทำ Voxelization เพื่อแปลงพอยต์คลาวด์ให้เป็นกล่อง 3 มิติและประมวลผลต่อจากนั้น หรือแปลงให้เป็นรูป 2 มิติ (Bird’s Eye View) และประมวลผลต่อ ซึ่งในแต่ละแบบก็จะมีข้อดีและข้อเสียที่ต่างกันออกไป อย่างไรก็ตาม ในแต่ละโครงสร้างนั้น ไม่ว่าจะเป็นการประมวลผลทางตรงหรือทางอ้อม ก็จะต้องประกอบไปด้วยองค์ประกอบของโครงข่ายประสาทเทียมประเภทเดียวกัน โครงงานนี้จึงจะทำการศึกษาโครงสร้างของประสาทเทียมประเภทต่างๆ และพัฒนาโครงสร้างที่มีอยู่ ให้ดียิ่งขึ้นต่อไป

LiDAR point cloud analysis for 3D Object Detection in autonomous vehicles

การวิเคราะห์ข้อมูลพอยต์คลาวด์ไลดาร์เพื่อการตรวจจับวัตถุแบบสามมิติในรถยนต์ขับเคลื่อนอัตโนมัติ

Details

Objective

Project Members

ศิรัส ทองอรุณ

SIRUS THONGARUN

สุเมฆ วิศยทักษิณ

Sumek Wisayataksin

Vote for this Innovation!