liu.seSearch for publications in DiVA
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Make it Flat: Detection and Correction of Planar Regions in Triangle Meshes
Linköping University, Department of Electrical Engineering, Computer Vision.
2016 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Detektion och tillrättning av plana ytor i triangelmodeller (Swedish)
Abstract [en]

The art of reconstructing a real-world scene digitally has been on the mind of researchers for decades. Recently, it has attracted more and more attention from companies seeing a chance to bring this kind of technology to the market. Digital reconstruction of buildings in particular is a niche that has both potential and room for improvement. With this background, this thesis will present the design and evaluation of a pipeline made to find and correct approximately flat surfaces in architectural scenes. The scenes are 3D-reconstructed triangle meshes based on RGB images. The thesis will also comprise an evaluation of a few different components available for doing this, leading to a choice of best components. The goal is to improve the visual quality of the reconstruction.

The final pipeline is designed with two blocks - one to detect initial plane seeds and one to refine the detected planes. The first block makes use of a multi-label energy formulation on the graph that describes the reconstructed surface. Penalties are assigned to each vertex and each edge of the graph based on the vertex labels, effectively describing a Markov Random Field. The energy is minimized with the help of the alpha-expansion algorithm. The second block uses heuristics for growing the detected plane seeds, merging similar planes together and extracting deviating details.

Results on several scenes are presented, showing that the visual quality has been improved while maintaining accuracy compared with ground truth data.

Abstract [sv]

Konsten att digitalt rekonstruera en verklig miljö har länge varit intressant för forskare. Nyligen har området även tilldragit sig mer och mer uppmärksamhet från företag som ser en möjlighet att föra den här typen av teknik till produkter på marknaden. I synnerhet är digital rekonstruktion av byggnader en nisch som har både stor potential och möjlighet till förbättring. Med denna bakgrund så presenterar detta examensarbete designen för och utvärderingen av en pipeline som skapats för att detektera och rätta till approximativt platta regioner i arkitektoniska miljöer. Miljöerna är 3D-rekonstruerade triangelmeshar skapade från RGB-bilder. Examensarbetet omfattar även utvärdering av olika komponenter för att uppnå detta, som avslutas med att de mest lämpliga komponenterna presenteras. Målet i korthet är att förbättra den visuella kvaliteten av en rekonstruerad modell.

Den slutgiltiga pipelinen består av två övergripande block - ett för att detektera initiala plan och ett för att förbättra de funna planen. Det första blocket använder en multi-label energiformulering på grafen som beskriver den rekonstruerade ytan. Straffvärden tilldelas varje vertex och varje båge i grafen baserade på varje vertex label. På så sätt beskriver grafen ett Markov Random Field. Energin är sedan minimerad med alpha-expansion-algoritmen. Det andra blocket använder heuristiker för att låta planen växa, slå ihop närliggande plan och för att extrahera avvikande detaljer.

Resultat på flera miljöer presenteras också för att påvisa att den visuella kvaliteten har förbättrats utan att rekonstruktionens noggrannhet har försämrats jämfört med ground truth-data.

Place, publisher, year, edition, pages
2016. , p. 82
Keywords [en]
3D reconstruction, Markov Random Field, plane detection
National Category
Signal Processing
Identifiers
URN: urn:nbn:se:liu:diva-126589ISRN: LiTH-ISY-EX--16/4930--SEOAI: oai:DiVA.org:liu-126589DiVA, id: diva2:917230
External cooperation
Spotscale AB
Subject / course
Computer Vision Laboratory
Presentation
2016-03-22, Algoritmen, 09:00 (Swedish)
Supervisors
Examiners
Available from: 2016-04-13 Created: 2016-03-30 Last updated: 2016-04-13Bibliographically approved

Open Access in DiVA

fulltext(35178 kB)519 downloads
File information
File name FULLTEXT01.pdfFile size 35178 kBChecksum SHA-512
bb659a1555885783f31d3610c1185fe49ce82454b3251c4819aae5d39c388212bd4e519bd661c09c574604fd7966e368ef491b04179d2df6cf7fe0b6888f2f19
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Jonsson, Mikael
By organisation
Computer Vision
Signal Processing

Search outside of DiVA

GoogleGoogle Scholar
Total: 519 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 1167 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf