九遊會官網平台

新闻資訊

計算機視覺中的雙目立體視覺和體積怀抱

作者:Yauheni Marushko


編譯:ronghuaiyang


導讀

一個雙目立體視覺的常用應用場景的介紹,很基礎。


立體視覺

立體視覺意味着人工智能可以通过一对相机来感知图像的深度以及物体的距离。大多数三维相机模型都是基于立體視覺理论和技术的。两台摄像机之间设置一定的距离,这样它们就可以从差异的角度“看”物体。评估两个图像之间的对应关系,人工智能确定到目标的距离,分析,并建设目标的3D结构。


640(1).jpg


接纳立體視覺,不需要红外传感器、声波定位仪、激光雷达等测距传感器,可大大降低了技术解决方案的成本。


640 (2).png


主要應用場景:

1、人體姿態和手勢識別。


2、3D模型和3D場景的構建。


3、自動駕駛系統的障礙定位和檢測。


每个特定的场景都可以改动以解决特定的问题。因此,3D场景重建可以用来丈量物体或産品的体积。


在实践中,立體視覺通过两台摄像机分四个阶段实现:


1、畸变校正 — 一种去除图像上透镜的径向和切向畸变的数学要领,以获得未失真的图像。


2、在校正過程中調整相機之間的角度和距離。結果是直線對齊和細化圖像,即同一平面的兩幅圖像共面,其直線對齊偏向相同,具有相同的y坐標。


640 (3).png


3、点匹配历程 — 搜索左、右摄像头点之间的对应关系。在那之后,你会获得有一个视差图 —— 其中的值对应于左右摄像机同一点的图像x坐标的差异。


4、因此,有了相機的幾何排列,我們産生了視差圖的三角怀抱。這是重投影階段,形成深度圖,也就是想要的3D場景。


對于前兩個階段,你必須首先計算這一對相機的配置參數。這可以通過各種二值化的標定板自動完成,好比ArUco或ChArUco。這些標定板的主要優點是,纵然是單個標定板也能提供足夠的一致性來獲得相機的姿勢。此外,內部的二進制編碼使它們特別可靠,因爲它可以進行錯誤檢測和糾正。你也可以使用標定板來確定相機下區域的幾何形狀。


640 (4).png


體積怀抱

爲了怀抱體積,你還需要進行下面的步驟:


1、對一組連續的幀進行累積,這將增加錯誤恢複的彈性,用于對3D場景進行平均或細化。


2、只在场景中选择産品界说的点。这是通过使用颜色支解、模板匹配或神经网络语义支解来实现的。最快的要领是颜色支解。该要领的缺点是将设置绑定到特定的産品上,如果配景颜色和工具不是很清楚,可能会发生欠好的结果。如果GPU优化是可能的,那么使用U形卷积神经网络如U-net和高级U-net,或全卷积神经网络会有较高的性能和支解精度。


3、对一个由産品界说的3D点组成的场景进行聚类。每个簇是一个工具。


640 (5).png



640 (6).png


4、爲每個簇形成一個凸多邊形,消除3d場景對象的邊緣缺陷


5、使用線性插值恢複缺失的3D點


6、通過基于場景的幾何聚類區域積分來計算單個對象的體積。


640 (7).png


7、最後,計算所有物體的總體積。



英文原文:https://medium.com/@softarex/computer-vision-stereo-vision-and-volume-measurement-910c381f0f75


來源:AI公園


本文僅做學術分享,如有侵權,請聯系刪文。


來源丨新機器視覺


(*如有版權問題請聯系後台,將在24小時內刪除文章)





获得更多産品支持与培訓

加入WELINKIRT

是否有任何疑問?

世界各地的WELINKIRT代表可以隨時爲您提供支持,滿足您的視覺和工業讀碼需求。

聯系九游会官网平台