You are here: Home Proceedings
Document Actions

Proceedings

Deep-Learning-Verfahren zur 3D-Objekterkennung in der Logistik

Deep learning for 3D object recognition in logistics

  1. M.Sc. Marko Thiel Institut für Technische Logistik, TU Hamburg
  2. Dr. Johannes Hinckeldeyn Institut für Technische Logistik, TU Hamburg
  3. Prof. Dr.-Ing. Jochen Kreutzfeldt Institut für Technische Logistik, TU Hamburg

Abstracts

Die zuverlässige Erkennung von Objekten in Sensordaten ist Grundvoraussetzung für die Autonomisierung logistischer Prozesse. Insbesondere die Erkennung von Objekten in 3D-Sensordaten ist für flexible autonome Anwendungen wichtig. Für die Objekterkennung in 2D-Bilddaten stellen auf neuronalen Netzen basierenden Deep-Learning-Verfahren den Stand der Technik dar. Dieser Beitrag diskutiert verschiedene aktuelle Ansätze, Deep-Learning-Verfahren auch für die 3D-Objekterkennung zu nutzen. Wesentliches Merkmal dieser Ansätze ist die Verwendung von Punktwolken als Eingangsdaten, gegebenenfalls nach vorheriger Segmentierung oder Umwandlung in Voxelgitter. Beispielhafte Anwendungen in der Logistik sind autonome Flurförderzeuge und Kommissionierroboter. Herausforderungen für einen Einsatz bestehen in fehlenden Trainingsdaten, hohen erforderlichen Rechenleistungen für Echtzeitanwendungen und einer noch nicht ausreichenden Erkennungsgenauigkeit.

The reliable detection of objects in sensor data is a fundamental requirement for the autonomization of logistic processes. Especially the recognition of objects in 3D sensor data is important for flexible autonomous applications. Deep learning represents the state of the art for object recognition in 2D image data. This article presents various current approaches to use deep learning for 3D object recognition. An essential feature of these approaches is the use of point clouds as input data, possibly after prior segmentation or conversion into voxel grids. Examples of applications in logistics are autonomous guided vehicles and order picking robots. The challenges for an application are a lack of training data, high computing requirements for real-time applications and an accuracy that is not yet sufficient.

Keywords

Fulltext

License

Any party may pass on this Work by electronic means and make it available for download under the terms and conditions of the free Digital Peer Publishing License. The text of the license may be accessed and retrieved at http://www.dipp.nrw.de/lizenzen/dppl/fdppl/f-DPPL_v1_de_11-2004.html.

Number of citations

Visit Google Scholar to find out, how often this paper is cited.