SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Pritz Michael)
 

Sökning: WFRF:(Pritz Michael) > A Neuro-Symbolic AS...

A Neuro-Symbolic ASP Pipeline for Visual Question Answering

Eiter, Thomas (författare)
Institute of Logic and Computation, Vienna University of Technology (TU Wien), Austria
Higuera, Nelson (författare)
Institute of Logic and Computation, Vienna University of Technology (TU Wien), Austria
Oetsch, Johannes (författare)
Institute of Logic and Computation, Vienna University of Technology (TU Wien), Austria
visa fler...
Pritz, Michael (författare)
Institute of Logic and Computation, Vienna University of Technology (TU Wien), Austria
visa färre...
 (creator_code:org_t)
Cambridge University Press, 2022
2022
Engelska.
Ingår i: Theory and Practice of Logic Programming. - : Cambridge University Press. - 1471-0684 .- 1475-3081. ; 22:5, s. 739-754
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • We present a neuro-symbolic visual question answering (VQA) pipeline for CLEVR, which is a well-known dataset that consists of pictures showing scenes with objects and questions related to them. Our pipeline covers (i) training neural networks for object classification and bounding-box prediction of the CLEVR scenes, (ii) statistical analysis on the distribution of prediction values of the neural networks to determine a threshold for high-confidence predictions, and (iii) a translation of CLEVR questions and network predictions that pass confidence thresholds into logic programmes so that we can compute the answers using an answer-set programming solver. By exploiting choice rules, we consider deterministic and non-deterministic scene encodings. Our experiments show that the non-deterministic scene encoding achieves good results even if the neural networks are trained rather poorly in comparison with the deterministic approach. This is important for building robust VQA systems if network predictions are less-than perfect. Furthermore, we show that restricting non-determinism to reasonable choices allows for more efficient implementations in comparison with related neuro-symbolic approaches without losing much accuracy.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)

Nyckelord

answer-set programming
neuro-symbolic computation
visual question answering
Computation theory
Encoding (symbols)
Forecasting
Logic programming
Program translators
Answer set programming
Deterministics
Encodings
Network prediction
Neural-networks
Object classification
Question Answering
Symbolic computation
Pipelines

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Eiter, Thomas
Higuera, Nelson
Oetsch, Johannes
Pritz, Michael
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
Artiklar i publikationen
Theory and Pract ...
Av lärosätet
Jönköping University

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy