Improving Visual Object Detection Using Synthetic Self-Training

Mayershofer, Christopher; Fischer, Adrian; Fottner, Johannes

Artikelaktionen

Proceedings

Improving Visual Object Detection Using Synthetic Self-Training

Verbesserung der Objekterkennung durch Selbst-Training mit synthetischen Bildern

M.Sc. Christopher Mayershofer Chair of Materials Handling, Material Flow, Logistics Department of Mechanical Engineering Technical University of Munich
B.Sc. Adrian Fischer Chair of Materials Handling, Material Flow, Logistics Department of Mechanical Engineering Technical University of Munich
Prof. Dr.-Ing. Johannes Fottner Chair of Materials Handling, Material Flow, Logistics Department of Mechanical Engineering Technical University of Munich

Zusammenfassungen

The current era of supervised learning requires a large corpus of application-specific training data with ground-truth annotations. The creation of large annotated datasets however is a costly endeavor. Moreover, the availability of a large annotated set of training data cannot be guaranteed in certain domains. Self-training attempts to overcome these problems by using a set of labeled data and a potentially infinite pool of unlabeled data to train a model in a semi-supervised manner. Self-training however only works if the annotated data is sufficient for training a strong teacher model, which depending on the application domain, is not always available. In this work, we propose and formulate a simple extension to the self-training paradigm and refer to it as Synthetic Self-Training (SST). SST is able to overcome the aforementioned problem by incorporating synthetically generated images into the training process, therefore improving model performance. Specifically, we address the problem of object detection in a logistics environment and are able to improve the state-of-the-art detection performance on the LOCO dataset by 12% mAP0.5.

Die gegenwärtige Praxis des überwachten Lernens erfordert einen umfangreichen Korpus annotierter Trainingsdaten. Die Erstellung großer annotierter Datensätze ist jedoch ein kostspieliges Unterfangen. Darüber hinaus variiert die Verfügbarkeit eines großen annotierten Trainingsdatensatzes über unterschiedliche Anwendungsbereiche. Selbsttraining versucht, diese Probleme zu überwinden, indem eine Kombination aus annotierten Daten und nicht-annotierten Daten verwendet wird, um ein Modell zu trainieren. Selbsttraining bedarf jedoch einer ausreichenden Menge annotierter Trainingsdaten, um ein starkes Lehrermodell zu trainieren. Diese Arbeit stellt das Synthetische Selbst-Training (SST) vor, eine Erweiterung des konventionellen Selbst-Trainings. SST löst zuvor genannte Problem, durch Einbeziehung synthetisch erzeugte Daten in den Trainingsprozess. Diese Arbeit formuliert SST im Bereich der Visuellen Objekterkennung und zeigt empirische dessen Vorteile. Konkret ermöglicht es SST die Erkennungsgenauigkeit logistikspezifischer Objekte im LOCO Benchmark um 12% mAP0.5 zu verbessern.

Keywords

DOI: 10.2195/lj_Proc_mayershofer_en_202112_01
URN: urn:nbn:de:0009-14-54288

Volltext ¶

Volltext als PDF ( Größe: 3.0 MB )

Lizenz ¶

Jedermann darf dieses Werk unter den Bedingungen der freien Digital Peer Publishing Lizenz elektronisch übermitteln und zum Download bereitstellen. Der Lizenztext ist im Internet unter der Adresse http://www.dipp.nrw.de/lizenzen/dppl/fdppl/f-DPPL_v1_de_11-2004.html abrufbar.

Empfohlene Zitierweise ¶

Mayershofer C, Fischer A, Fottner J (2021). Improving Visual Object Detection Using Synthetic Self-Training. Logistics Journal : Proceedings, Vol. 2021. (urn:nbn:de:0009-14-54288)

Bitte geben Sie beim Zitieren dieses Artikels die exakte URL und das Datum Ihres letzten Besuchs bei dieser Online-Adresse an.

Anzahl der Zitationen

Besuchen Sie Google Scholar um herauszufinden, wie oft dieser Artikel zitiert wurde.

Logistics Journal

Sektionen

Artikelaktionen

Proceedings

Improving Visual Object Detection Using Synthetic Self-Training

Verbesserung der Objekterkennung durch Selbst-Training mit synthetischen Bildern

Zusammenfassungen

Keywords

Volltext ¶

Lizenz ¶

Empfohlene Zitierweise ¶

Anzahl der Zitationen