Bạch Ngọc Minh

Main Article Content

Abstract

Tóm tắt: Có ba phương pháp cơ bản để so sánh sự tương hợp giữa hai ảnh là SAD, SSD và NCC. Phương pháp NCC sử dụng sự tương quan chéo giữa các điểm ảnh nên các phép toán rất phức tạp. Chúng bao gồm phép toán bình phương, tổng, tích các tổng, khai căn nên việc thực hiện chắc chắn rất tốn thời gian. Còn hai phương pháp SAD và SSD có độ phức tạp của thuật toán không khác biệt quá lớn nên chúng ta cần làm một thực nghiệm để kiểm chứng chất lượng bản đồ độ sâu và tốc độ thực hiện.  Từ đó chọn ra một phương pháp thích hợp hơn

So sánh thời gian chạy giữa hai giải thuật SAD và SSD  cho thấy việc lựa chọn các thuật toán SAD là hợp lý hơn, bởi vì các thuật toán SSD cần gần gấp đôi thời gian chạy. Phương pháp SAD có thể giải quyết vấn đề đối với việc tìm độ sâu trong ảnh 3D. Một điểm ở không gian lấy ảnh ở hai ống kính máy tại hai vị trí khác nhau. Chính vì thế nên trước khi tìm được độ sâu của điểm ảnh, ta cần tìm được các điểm ảnh tương ứng đã. Phương pháp SAD là phương pháp đơn giản nhất để tìm được điểm ảnh đó.

Phương pháp SAD lại có nhiều cách tính toán, tính theo phương pháp SAD truyền thống, phương pháp SAD điều chỉnh (dựa vào biên ảnh), phương pháp SAD phân đoạn ( phân vùng ảnh). Ở đây ta lại lựa chọn giữa 2 phương pháp SAD điều chỉnh và SAD phân đoạn giảm 20% so với SAD truyền thống.

 Tiếp theo chúng ta xem xét các thuật toán SAD phân vùng lai được tạo ra bởi sự kết hợp của hai kỹ thuật: Belief Propagation và các thuật toán phân đoạn Mean Shift. Cách tiếp cận này kết hợp những ưu điểm của cả hai phương pháp phân đoạn. Các thuật toán Mean Shift cho kết quả nhanh chóng và Belief Propagation thực hiện phân đoạn rất chính xác.

Từ khóa: Phân vùng ảnh, Belief Propagation, Mean Shift, SAD , hình ảnh 3D.

References

[1] Dorit Borrmann, Jan Elseberg, Kai Lingemann, Andreas Nüchter (2011), “ The 3D Hough transform for plane detection in point clouds: A Review and a new Accumulator Design”, Received: 13 January 2011 / Revised: 13 February 2011 / Accepted: 10 March 2011, © 3D Research Center and Springer 2011
[2] Yedida, J. S, Freeeman, W. T, Weiss, Y. Understanding belief propagation and it is genneralizstions. Exploring Artificial Intellrgence in the New Millennium, 2003, Chap.8, p, 236 – 239.
[3] POINT GREY, Bumblebee Stereo Vision Camera Sytems. BB2 – 08S2 (datasheet). 2 pages. [Online] Cited 2011-10-23. Advailable at: http://www.ptgrey.com/products/bumblebee2_xb3_datasheet.pdf
[4] Scharstein, D, Szeliski,R, A taxonomy and evaluation of dense two frame stereo correspondence algorithms. International Jounrnal of Computer Vision, 2003, vol, 47, no. (1/2/3), p.& - 42
[5] Brown, M, Z, Burschka, D, Hager, G, D, Bhartia, P. Advances in computional stereo. IEEE Transactions on Pattenrn Analysis and Machine Itelligence, 2003, vol, 25, no.8.
[6] KUHL, A. Comparison of stereo matching algorithms for mobile robots. Centre for Intelligent Information Processing Sytem 2005, University of Western Australia, p. 4 – 24.
[7] Cao, X., Foroosh, H, H. Camera calibration using symmetric objects. Image Processing IEEE Transactions, 2006, vol, 15, no. 11, p.3614 – 3619.
[8] Shimizu, M., Okutomi, M, Calibration and rectification for reflection stereo. In IEEE Conference on Computer Vision and Pattern Recognition CVPR Anchorage ( USA), 2008, p.1 – 8.
[9] Hartley, R, Zisserman, A, Multiple View Geometry in Computer Vision 2nd ed. Cambridge: University Press, 2005.
[10] Zhang, Y. J. Advance in Image and Video Segmentation. 1nd ed. USA: IRM Press, 2006.
[11] Wang, G, JU, H, A disparity map extraction algorithm for lunar rover BH 2. In IEEE International Conference on Intelligent Computing and Intelligent Sytems ICIS 2009. Shanghai, 2009, vol. 4, p. 385 – 389.
[12] Mckinnon, B., Baltes, J. Practical region – based matching for stereo vision. In IWCIA, 2005, vol. 3322 of Lecture Notes in Computer Science, Springer, p. 726 – 738.
[13] Craig Watman, “Fast Sum of Absolute Differences Visual Landmark Detector”, Robotic Systems Laboratory Department of Systems Engineering, RSISE, Australian National University, Canberra, ACT 0200 Australia, Email: d.austin@computer.org
[14] Christor Georgoulas, Georgios CH, Real-time stereo vision applicasions.Laboratory of Electronics,Democritris University of Thrace Xanthi, Greece p.267-292.
[15] Guan, S, Klette, R, Belief Propagation on edge image sequences. InmProceedingx Robot Vision LNCS 4931, 2006, p. 291 – 302.
[16] Siqiang, L., Wei, L, Image segmentation basedon the Mean – Shift in the HSV space. In 26th Chinese Control Conference, 2007. [Online], p. 476 – 479.
[17] Benco, M., Hudec, R, The advances image segmentation techniques for broadly useful retrieval in large image database. In NSSS IX, Tatranske Zruby (Slovakia), 2006, p. 40 – 44.
[18] He, R, Zhu, Y. A hybrid image segmentation approach based on Mean Shift and fuzzy C – Means. In Asia Pacific Conference on Information Processing. [Online], 2009.
[19] Comaniciu, D., Meer, P. Mean Shift: A robust approach toward feature space analysis IEEE Transaction on Pattern Analysis and Machine Intel., 2002, vol. 24, no. 5, p. 1 – 18.
[20] Rodriguez, R., Suarez, A. G. An image segmentation algorithm using interatively the Mean Shift. Progress in Pattern Recognition, Image Analysis and Appliscations. 2006, LNCS 4225, Berlin Heidelberg: Springer, vol. 4225/2006, p. 326 – 335.
[21] Hudec, R. Adaptive Order – statistics L – filters, 1st ed. University of Zilina: EDIS Press, 155 pages, ISBN 978 – 80 – 554 – 0248 – 2, 2011 (in Slovak).
[22] Rostam Affendi Hamzah, Hasrul Nisham Rosly, “An Obstacle Detection and Avoidance of A Mobile Robot with Stereo Vision Camera” , Faculty of Electronics & Computer Engineering, UTeM, Malaysia. rostamaffendi@utem.edu.my