liu.seSök publikationer i DiVA
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Learning Local Descriptors by Optimizing the Keypoint-Correspondence Criterion: Applications to Face Matching, Learning From Unlabeled Videos and 3D-Shape Retrieval
Univ Zagreb, Croatia.
Univ Zagreb, Croatia.
Linköpings universitet, Institutionen för systemteknik, Datorseende. Linköpings universitet, Tekniska fakulteten.ORCID-id: 0000-0002-6763-5487
2019 (Engelska)Ingår i: IEEE Transactions on Image Processing, ISSN 1057-7149, E-ISSN 1941-0042, Vol. 28, nr 1, s. 279-290Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Current best local descriptors are learned on a large data set of matching and non-matching keypoint pairs. However, data of this kind are not always available, since the detailed keypoint correspondences can be hard to establish. On the other hand, we can often obtain labels for pairs of keypoint bags. For example, keypoint bags extracted from two images of the same object under different views form a matching pair, and keypoint bags extracted from images of different objects form a non-matching pair. On average, matching pairs should contain more corresponding keypoints than non-matching pairs. We describe an end-to-end differentiable architecture that enables the learning of local keypoint descriptors from such weakly labeled data. In addition, we discuss how to improve the method by incorporating the procedure of mining hard negatives. We also show how our approach can be used to learn convolutional features from unlabeled video signals and 3D models.

Ort, förlag, år, upplaga, sidor
IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC , 2019. Vol. 28, nr 1, s. 279-290
Nyckelord [en]
Image matching; distance learning; multi-layer neural network; local descriptors
Nationell ämneskategori
Datorseende och robotik (autonoma system)
Identifikatorer
URN: urn:nbn:se:liu:diva-151931DOI: 10.1109/TIP.2018.2867270ISI: 000445364000022PubMedID: 30235113OAI: oai:DiVA.org:liu-151931DiVA, id: diva2:1256386
Anmärkning

Funding Agencies|Visage Technologies AB, Linkoping, Sweden; Croatian Science Foundation [8065]

Tillgänglig från: 2018-10-16 Skapad: 2018-10-16 Senast uppdaterad: 2019-03-18

Open Access i DiVA

fulltext(3934 kB)75 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 3934 kBChecksumma SHA-512
66265cd74e298603e825103dbd0c81c8ca9debad24e9f8e7c78ea47e7469127345d72254828ee0ddf29e1092d4bb0141d152d3561e3c6a6ae4400eaefca14d76
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextPubMed

Sök vidare i DiVA

Av författaren/redaktören
Ahlberg, Jörgen
Av organisationen
DatorseendeTekniska fakulteten
I samma tidskrift
IEEE Transactions on Image Processing
Datorseende och robotik (autonoma system)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 75 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
pubmed
urn-nbn

Altmetricpoäng

doi
pubmed
urn-nbn
Totalt: 3263 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf