Title Variational autoencoders with applications
Title (croatian) Varijacijski autoenkoderi i primjene
Author Roberto Grabovac
Mentor Hrvoje Planinić (mentor)
Mentor Zvonimir Bujanović (sumentor)
Committee member Hrvoje Planinić (predsjednik povjerenstva)
Committee member Boris Širola (član povjerenstva)
Committee member Marko Horvat (član povjerenstva)
Committee member Andrej Dujella (član povjerenstva)
Granter University of Zagreb Faculty of Science (Department of Mathematics) Zagreb
Defense date and country 2025-02-27, Croatia
Scientific / art field, discipline and subdiscipline NATURAL SCIENCES Mathematics
Abstract This thesis presents the theoretical background and describes the concrete implementation of the variational autoencoder (VAE), a key example of generative models that, as an integral part of artificial intelligence, have significantly influenced current trends. The first chapter thoroughly explores the expectation-maximization (EM) algorithm, which serves as the foundational motivation for the loss function of our model. Here, the encoder aims to approximate the true posterior distribution as closely as possible, while the decoder minimizes the reconstruction loss to enhance the generative capabilities. The second chapter introduces the neural network, which forms the type of model for both the encoder and the decoder. Due to its flexibility, the VAE is capable of modeling highly complex distributions. Specifically, we focus on a special type of convolutional neural network, which is well-suited for image processing and generation tasks. The third chapter defines the encoder and decoder models, which together make up the VAE, along with the evidence lower bound loss function and the reparameterization trick, which reduces gradient variance during backpropagation, compared to the traditional REINFORCE estimator. The fourth chapter presents two VAE implementations, differing in their reconstruction loss functions. The first variant uses mean squared error, while the second takes the nature of the data (images) into account and uses the MSSIM metric to measure the difference between the input data and the reconstruction from the decoder. The results of this work aim to bridge theory, understanding, and intuition behind how generative models function, especially in fields like image processing and generation, where such models are becoming increasingly prevalent.
Abstract (croatian) U ovom radu izložena je teorijska pozadina i opisana konkretna implementacija varijacijskog autoenkodera, jednog od primjera generativnih modela koji su kao važan dio umjetne inteligencije značajno utjecali na današnje trendove. Prvim poglavljem detaljno razrađujemo algoritam maksimizacije očekivanja koji predstavlja polazišnu točku za motivaciju funkcije gubitka našeg modela gdje enkoder nastoji što bolje aproksimirati pravu posteriori distribuciju, a dekoder smanjiti rekonstrukcijski gubitak u svrhu što boljih generativnih sposobnosti. Drugo poglavlje uvodi neuronsku mrežu koja upravo predstavlja tip modela enkodera i dekodera, a zbog čije fleksibilnosti varijacijski autoenkoder dobiva mogućnost modelirati vrlo kompleksne distribucije. Točnije, promatramo poseban tip konvolucijske neuronske mreže pogodnom za probleme obrade, odnosno kreiranja slika. Treće poglavlje definira oba modela koji međusobnim funkcioniranjem čine varijacijski autoenkoder, zajedno s funkcijom gubitka (eng. evidence lower bound) i reparametrizacijskim trikom koji, naspram tradicionalnog REINFORCE aproksimatora, smanjuje varijancu gradijenata tijekom provođenja algoritma propagacije unatrag. U četvrtom poglavlju prikazujemo dvije implemetacije varijacijskog autoenkodera koje se razlikuju po svojim rekonstrukcijskim funkcijama gubitka. Prva varijanta implementira prosječnu kvadratnu pogrešku, dok druga ipak uzima u obzir prirodu podataka (slike) te koristi MSSIM metriku za mjeru različitosti između ulaznog podatka i onog dobivenog rekonstrukcijom iz dekodera. Rezultati ovog rada nastojali su približiti teoriju, razumijevanje i intuiciju iza načina kako funkcioniraju generativni modeli, a koji su danas sve češće viđeni, pogotovo u području obrade i kreiranja slika.
Keywords
variational autoencoder
expectation-maximization algorithm
neural network
encoder
decoder
reparametrization trick
Keywords (croatian)
varijacijski autoenkoder
algoritam maksimizacije očekivanja
neuronska mreža
enkoder
dekoder
reparametrizacijski trik
Language english
URN:NBN urn:nbn:hr:217:786225
Study programme Title: Computer science and mathematics Study programme type: university Study level: graduate Academic / professional title: sveučilišni magistar računarstva i matematike (sveučilišni magistar računarstva i matematike)
Type of resource Text
File origin Born digital
Access conditions Open access
Terms of use
Created on 2025-02-11 12:45:46