SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:lup.lub.lu.se:758b9f34-9b6a-49a3-b0c9-b78118b1b442"
 

Sökning: onr:"swepub:oai:lup.lub.lu.se:758b9f34-9b6a-49a3-b0c9-b78118b1b442" > Seg2Pose: Pose Esti...

Seg2Pose: Pose Estimations from Instance Segmentation Masks in One or Multiple Views for Traffic Applications

Ahrnbom, Martin (författare)
Lund University,Lunds universitet,Mathematical Imaging Group,Forskargrupper vid Lunds universitet,Matematik LTH,Matematikcentrum,Institutioner vid LTH,Lunds Tekniska Högskola,Lund University Research Groups,Mathematics (Faculty of Engineering),Centre for Mathematical Sciences,Departments at LTH,Faculty of Engineering, LTH
Persson, Ivar (författare)
Lund University,Lunds universitet,Matematik LTH,Matematikcentrum,Institutioner vid LTH,Lunds Tekniska Högskola,Mathematics (Faculty of Engineering),Centre for Mathematical Sciences,Departments at LTH,Faculty of Engineering, LTH
Nilsson, Mikael (författare)
Lund University,Lunds universitet,Mathematical Imaging Group,Forskargrupper vid Lunds universitet,Matematik LTH,Matematikcentrum,Institutioner vid LTH,Lunds Tekniska Högskola,Lund University Research Groups,Mathematics (Faculty of Engineering),Centre for Mathematical Sciences,Departments at LTH,Faculty of Engineering, LTH
 (creator_code:org_t)
SCITEPRESS - Science and Technology Publications, 2022
2022
Svenska 8 s.
Ingår i: Proceedings of the 17th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications: VISAPP. - : SCITEPRESS - Science and Technology Publications. - 9789897585555 ; 5, s. 777-784
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • A system we denote Seg2Pose is presented which converts pixel coordinate tracks, represented by instance segmentation masks across multiple video frames, into world coordinate pose tracks, for road users seen by static surveillance cameras. The road users are bound to a ground surface represented by a number of 3D points and does not necessarily have to be perfectly flat. The system works with one or more views, by using a late fusion scheme. An approximate position, denoted the normal position, is computed from the camera calibration, per-class default heights and the ground surface model. The position is then refined a novel Convolutional Neural Network we denote Seg2PoseNet, taking instance segmentations and cropping positioning as its input. We evaluate this system quantitatively both on synthetic data from CARLA Simulator and on a real recording from a trinocular camera. The system outperforms the baseline method of only using the normal positions, which is roughly equivalent of a typical 2D to 3D conversion system, in both datasets.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datorseende och robotik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Vision and Robotics (hsv//eng)
NATURVETENSKAP  -- Matematik (hsv//swe)
NATURAL SCIENCES  -- Mathematics (hsv//eng)

Nyckelord

Pose Estimation
Instance Segmentation
Convolutional Neural Network
Traffic Safety
Road Users
Tracking
Stereo Camera
Trinocular Camera Array
Traffic Surveillance

Publikations- och innehållstyp

kon (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Ahrnbom, Martin
Persson, Ivar
Nilsson, Mikael
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datorseende och ...
NATURVETENSKAP
NATURVETENSKAP
och Matematik
Artiklar i publikationen
Proceedings of t ...
Av lärosätet
Lunds universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy