SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:kth-311517"
 

Sökning: onr:"swepub:oai:DiVA.org:kth-311517" > The edge of chaos :

The edge of chaos : Quantum field theory and deep neural networks

Grosvenor, Kevin T. (författare)
Max Planck Inst Phys Komplexer Syst & Wurzburg D, Cluster Excellence Ctqmat, Nothnitzer Str 38, D-01187 Dresden, Germany.;Leiden Univ, Inst Lorentz, POB 9506, NL-2300 RA Leiden, Netherlands.
Jefferson, Ro (författare)
Stockholms universitet,Nordiska institutet för teoretisk fysik (Nordita)
Max Planck Inst Phys Komplexer Syst & Wurzburg D, Cluster Excellence Ctqmat, Nothnitzer Str 38, D-01187 Dresden, Germany;Leiden Univ, Inst Lorentz, POB 9506, NL-2300 RA Leiden, Netherlands. Nordiska institutet för teoretisk fysik (Nordita) (creator_code:org_t)
Stichting SciPost, 2022
2022
Engelska.
Ingår i: SciPost Physics. - : Stichting SciPost. - 2542-4653. ; 12:3
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • We explicitly construct the quantum field theory corresponding to a general class of deep neural networks encompassing both recurrent and feedforward architectures. We first consider the mean-field theory (MFT) obtained as the leading saddlepoint in the action, and derive the condition for criticality via the largest Lyapunov exponent. We then compute the loop corrections to the correlation function in a perturbative expansion in the ratio of depth T to width N, and find a precise analogy with the well-studied O(N) vector model, in which the variance of the weight initializations plays the role of the 't Hooft coupling. In particular, we compute both the O(1) corrections quantifying fluctuations from typicality in the ensemble of networks, and the subleading O(T IN) corrections due to finite-width effects. These provide corrections to the correlation length that controls the depth to which information can propagate through the network, and thereby sets the scale at which such networks are trainable by gradient descent. Our analysis provides a first-principles approach to the rapidly emerging NN-QFT correspondence, and opens several interesting avenues to the study of criticality in deep neural networks.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)
NATURVETENSKAP  -- Fysik (hsv//swe)
NATURAL SCIENCES  -- Physical Sciences (hsv//eng)

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Grosvenor, Kevin ...
Jefferson, Ro
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
NATURVETENSKAP
NATURVETENSKAP
och Fysik
Artiklar i publikationen
SciPost Physics
Av lärosätet
Kungliga Tekniska Högskolan
Stockholms universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy