This thesis falls in the general category of computer vision. In particular, it regards the study of the reconstruction and analysis of 3D models problems with a focus on two different domains: autonomous vehicles and the manufacturing industry. Computer vision is a research topic deeply studied in the last decades with great interest from both researchers and industries. Contrary to image processing, computer vision aims to extract 3D structures and semantic means from images for a rich and complete understanding. The development of Convolutional Neural Networks (CNNs), allowed computer vision to face up new complex problems reaching impressive results. But computer vision does not regard only bi-dimensional images but also multidimensional data. Indeed, the diffusion of new sensors such as Lidars and 3D scanners requested the design of new algorithms to deal with their data structures. In fact, point clouds - the classic data produced by 3D sensors - have a really different nature compared with images. Autonomous driving represents a domain in which computer vision finds a wide range of applications. Furthermore, to safely move in the urban environment, driverless cars need an accurate and rich perception of the environment. For this reason, data from different sensors are fused to create a 360° 3D representation of the scene. On the other hand, the manufacturing industry can leverage computer vision approaches, in synergy with other technologies, to automate and facilitate several processes to make lean the production chain. In particular, quality control and warehouse management processes can leverage robotics, 3D scanning, and mixed reality to facilitate human work. In this thesis, several contributions mainly based on computer vision are proposed in both domains. It investigates the power of computer vision leveraging both bi-dimensional and tri-dimensional data peculiarity in different identified tasks typical of both domains. Experimental results shown, analyzed, and discussed in this thesis, support the effectiveness of each proposed method.

Questa tesi rientra nel campo della computer vision. In particolare, questa ricopre lo studio della ricostruzione ed analisi di modelli 3D con particolare riguardo a 2 differenti domini d’applicazione: i veicoli autonomi e l’industria manifatturiera. La computer vision è un dominio di ricerca particolarmente studiato negli ultimi decenni suscitando grande interesse sia da parte di ricercatori che da parte delle industrie. A differenza dell’image processing, la computer vision punta all’estrazione di strutture tridimensionali ed del significato semantico dalle immagini per una comprensione completa della scena. Lo sviluppo delle Convolutional Neural Networks (CNN), ha permesso alla computer vision di affrontare nuovi problemi, più complessi, raggiungendo risultati impressionanti. Le tecniche di computer vision non si limitano solo alle immagini, ma anche dati multidimensionali. Infatti, la diffusione di nuovi sensori come Lidar e scanner 3D hanno portato lo sviluppo di nuovi algoritmi in grado di lavorare con le strutture dati tipiche di questi sensori. Infatti, le point cloud, ovvero le classiche strutture in cui sono organizzati i dati acquisiti con sensori 3D, hanno caratteristiche molto diverse rispetto alle più classiche immagini. Quello dei veicoli a guida autonoma è sicuramente un dominio in cui la computer vision trova una grande varietà di applicazioni. Infatti, per spostarsi in sicurezza all’interno dell’ambiente urbano, le auto a guida autonoma necessitano di un’accurata percezione dello scenario circostante. Per questa ragione, diversi sensori vengono utilizzati insieme allo scopo di creare una rappresentazione 3D a 360° della scena. D’altra parte, l’industria manifatturiera offre grande spazio ad applicazioni di tecniche di computer vision. Infatti, in sinergia con altre tecnologie, questa può automatizzare e facilitare diversi processi per migliorare i processi produttivi. In particolare, processi come il controllo qualità e la gestione di magazzini possono trarre grande vantaggio da tecniche di robotica, 3D scanning e mixed reality allo scopo di alleggerire il lavoro. In questa tesi, sono stati proposti diversi contributi in entrambi i domini analizzati. Lo scopo è di analizzare diversi approcci basati sulla computer vision per affrontare task differenti in entrambi i domini sfruttando sia dati bi-dimensionali che tri-dimensionali. Per ogni approccio proposto, sono stati mostrati i risultati sperimentali allo scopo di validare e supportare l’efficacia del metodo specifico.

Reconstruction and analysis Of 3D models for autonomous vehicles and manufacturing industry

Pernisco, Gaetano
2023-01-01

Abstract

This thesis falls in the general category of computer vision. In particular, it regards the study of the reconstruction and analysis of 3D models problems with a focus on two different domains: autonomous vehicles and the manufacturing industry. Computer vision is a research topic deeply studied in the last decades with great interest from both researchers and industries. Contrary to image processing, computer vision aims to extract 3D structures and semantic means from images for a rich and complete understanding. The development of Convolutional Neural Networks (CNNs), allowed computer vision to face up new complex problems reaching impressive results. But computer vision does not regard only bi-dimensional images but also multidimensional data. Indeed, the diffusion of new sensors such as Lidars and 3D scanners requested the design of new algorithms to deal with their data structures. In fact, point clouds - the classic data produced by 3D sensors - have a really different nature compared with images. Autonomous driving represents a domain in which computer vision finds a wide range of applications. Furthermore, to safely move in the urban environment, driverless cars need an accurate and rich perception of the environment. For this reason, data from different sensors are fused to create a 360° 3D representation of the scene. On the other hand, the manufacturing industry can leverage computer vision approaches, in synergy with other technologies, to automate and facilitate several processes to make lean the production chain. In particular, quality control and warehouse management processes can leverage robotics, 3D scanning, and mixed reality to facilitate human work. In this thesis, several contributions mainly based on computer vision are proposed in both domains. It investigates the power of computer vision leveraging both bi-dimensional and tri-dimensional data peculiarity in different identified tasks typical of both domains. Experimental results shown, analyzed, and discussed in this thesis, support the effectiveness of each proposed method.
2023
Questa tesi rientra nel campo della computer vision. In particolare, questa ricopre lo studio della ricostruzione ed analisi di modelli 3D con particolare riguardo a 2 differenti domini d’applicazione: i veicoli autonomi e l’industria manifatturiera. La computer vision è un dominio di ricerca particolarmente studiato negli ultimi decenni suscitando grande interesse sia da parte di ricercatori che da parte delle industrie. A differenza dell’image processing, la computer vision punta all’estrazione di strutture tridimensionali ed del significato semantico dalle immagini per una comprensione completa della scena. Lo sviluppo delle Convolutional Neural Networks (CNN), ha permesso alla computer vision di affrontare nuovi problemi, più complessi, raggiungendo risultati impressionanti. Le tecniche di computer vision non si limitano solo alle immagini, ma anche dati multidimensionali. Infatti, la diffusione di nuovi sensori come Lidar e scanner 3D hanno portato lo sviluppo di nuovi algoritmi in grado di lavorare con le strutture dati tipiche di questi sensori. Infatti, le point cloud, ovvero le classiche strutture in cui sono organizzati i dati acquisiti con sensori 3D, hanno caratteristiche molto diverse rispetto alle più classiche immagini. Quello dei veicoli a guida autonoma è sicuramente un dominio in cui la computer vision trova una grande varietà di applicazioni. Infatti, per spostarsi in sicurezza all’interno dell’ambiente urbano, le auto a guida autonoma necessitano di un’accurata percezione dello scenario circostante. Per questa ragione, diversi sensori vengono utilizzati insieme allo scopo di creare una rappresentazione 3D a 360° della scena. D’altra parte, l’industria manifatturiera offre grande spazio ad applicazioni di tecniche di computer vision. Infatti, in sinergia con altre tecnologie, questa può automatizzare e facilitare diversi processi per migliorare i processi produttivi. In particolare, processi come il controllo qualità e la gestione di magazzini possono trarre grande vantaggio da tecniche di robotica, 3D scanning e mixed reality allo scopo di alleggerire il lavoro. In questa tesi, sono stati proposti diversi contributi in entrambi i domini analizzati. Lo scopo è di analizzare diversi approcci basati sulla computer vision per affrontare task differenti in entrambi i domini sfruttando sia dati bi-dimensionali che tri-dimensionali. Per ogni approccio proposto, sono stati mostrati i risultati sperimentali allo scopo di validare e supportare l’efficacia del metodo specifico.
Computer vision, point clouds, autonomous vehicles, deep learning, convolutional neural networks, manufacturing industry
Visione artificiale; point clouds; veicoli autonomi; deep learning: convolutional neural networks; industria manifatturiera
File in questo prodotto:
File Dimensione Formato  
35 ciclo-PERNISCO Gaetano.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Dominio pubblico
Dimensione 9.28 MB
Formato Adobe PDF
9.28 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11589/246740
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact