SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Higuera Nelson)
 

Sökning: WFRF:(Higuera Nelson) > A Neuro-Symbolic AS...

  • Eiter, ThomasInstitute of Logic and Computation, Vienna University of Technology (TU Wien), Austria (författare)

A Neuro-Symbolic ASP Pipeline for Visual Question Answering

  • Artikel/kapitelEngelska2022

Förlag, utgivningsår, omfång ...

  • Cambridge University Press,2022
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:hj-63556
  • https://urn.kb.se/resolve?urn=urn:nbn:se:hj:diva-63556URI
  • https://doi.org/10.1017/S1471068422000229DOI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:art swepub-publicationtype

Anmärkningar

  • We present a neuro-symbolic visual question answering (VQA) pipeline for CLEVR, which is a well-known dataset that consists of pictures showing scenes with objects and questions related to them. Our pipeline covers (i) training neural networks for object classification and bounding-box prediction of the CLEVR scenes, (ii) statistical analysis on the distribution of prediction values of the neural networks to determine a threshold for high-confidence predictions, and (iii) a translation of CLEVR questions and network predictions that pass confidence thresholds into logic programmes so that we can compute the answers using an answer-set programming solver. By exploiting choice rules, we consider deterministic and non-deterministic scene encodings. Our experiments show that the non-deterministic scene encoding achieves good results even if the neural networks are trained rather poorly in comparison with the deterministic approach. This is important for building robust VQA systems if network predictions are less-than perfect. Furthermore, we show that restricting non-determinism to reasonable choices allows for more efficient implementations in comparison with related neuro-symbolic approaches without losing much accuracy.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Higuera, NelsonInstitute of Logic and Computation, Vienna University of Technology (TU Wien), Austria (författare)
  • Oetsch, JohannesInstitute of Logic and Computation, Vienna University of Technology (TU Wien), Austria(Swepub:hj)oetjoh (författare)
  • Pritz, MichaelInstitute of Logic and Computation, Vienna University of Technology (TU Wien), Austria (författare)
  • Institute of Logic and Computation, Vienna University of Technology (TU Wien), Austria (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Theory and Practice of Logic Programming: Cambridge University Press22:5, s. 739-7541471-06841475-3081

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Eiter, Thomas
Higuera, Nelson
Oetsch, Johannes
Pritz, Michael
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
Artiklar i publikationen
Theory and Pract ...
Av lärosätet
Jönköping University

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy