Untitled Document
Untitled Document
ﭼﮑﯾده
اﯾن ﻣﻘﺎﻟﮫ ﺑﮫ ﺑررﺳﯽ ﺗﻘﺎطﻊ ﻓﯾزﯾﮏ آﻣﺎری و ھوش ﻣﺻﻧوﻋﯽ ) (AIﻣﯽﭘردازد و ﺑر روی ﻣدلھﺎی ﻣﺑﺗﻧﯽ ﺑر اﻧرژی
و ﺷﺑﮑﮫھﺎی ﻣوﻟد ﺗﻣرﮐز دارد .ﻣﺎ ﺑﮫ ﻣﺑﺎﻧﯽ رﯾﺎﺿﯽ ﻣﺎﺷﯾنھﺎی ﺑوﻟﺗزﻣن ) ،(BMsﻣﺎﺷﯾنھﺎی ﺑوﻟﺗزﻣن ﻣﺣدودﺷده
) ،(RBMsﺷﺑﮑﮫھﺎی ﻣوﻟد ﺗﺧﺎﺻﻣﯽ ) (GANsو رﻣزﮔذارھﺎی ﺧودﮐﺎر وارﯾﺎﻧﺳﯽ ) (VAEsو ﮐﺎرﺑردھﺎی آﻧﮭﺎ
در وظﺎﯾف ﯾﺎدﮔﯾری ﺑدون ﻧظﺎرت ﻣﺎﻧﻧد اﺳﺗﺧراج وﯾژﮔﯽ ،ﮐﺎھش اﺑﻌﺎد و ﺗوﻟﯾد ﺗﺻوﯾر ﻣﯽﭘردازﯾم .اﯾن ﻣﻘﺎﻟﮫ
ھﻣﭼﻧﯾن ﻣﺑﺎﻧﯽ ﻧظری اﯾن ﻣدلھﺎ را ﺑررﺳﯽ ﮐرده و ارﺗﺑﺎط آﻧﮭﺎ ﺑﺎ ﻣﮑﺎﻧﯾﮏ آﻣﺎری را ﻧﺷﺎن ﻣﯽدھد .در ﻧﮭﺎﯾت،
ﻧﺗﺎﯾﺞ آزﻣﺎﯾﺷﯽ ﺑرای ﺗﺄﯾﯾد اﺛرﺑﺧﺷﯽ اﯾن ﻣدلھﺎ اراﺋﮫ ﻣﯽﺷود.
Abstract
This paper explores the intersection of statistical physics and artificial intelligence (AI), focusing
on energy-based models and generative networks. We delve into the mathematical foundations
of Boltzmann Machines (BMs), Restricted Boltzmann Machines (RBMs), Generative Adversarial
Networks (GANs), and Variational Autoencoders (VAEs), and their applications in unsupervised
learning tasks such as feature extraction, dimensionality reduction, and image generation. The
paper also discusses the theoretical underpinnings of these models, drawing parallels with
statistical mechanics, and presents experimental results to validate their effectiveness.
ﻣﻘدﻣﮫ
ﺣوزه ھوش ﻣﺻﻧوﻋﯽ در ﺳﺎلھﺎی اﺧﯾر ﭘﯾﺷرﻓتھﺎی ﭼﺷﻣﮕﯾری داﺷﺗﮫ اﺳت ﮐﮫ ﻋﻣدﺗﺎ ً ﺑﮫ دﻟﯾل ﺗوﺳﻌﮫ ﻣدلھﺎی ﯾﺎدﮔﯾری ﻋﻣﯾق ﺑوده
اﺳت .ﺑﺎ اﯾن ﺣﺎل ،ﺑﺳﯾﺎری از اﯾن ﻣدلھﺎ ﺑﮫ ﻋﻧوان "ﺟﻌﺑﮫھﺎی ﺳﯾﺎه" ﻋﻣل ﻣﯽﮐﻧﻧد و درک ﻣﮑﺎﻧﯾﺳمھﺎی داﺧﻠﯽ آﻧﮭﺎ دﺷوار اﺳت .ﻓﯾزﯾﮏ
آﻣﺎری ،ﺑﺎ ﭼﺎرﭼوب رﯾﺎﺿﯽ ﻏﻧﯽ ﺧود ﺑرای درک ﺳﯾﺳﺗمھﺎی ﭘﯾﭼﯾده ،راهﺣﻠﯽ اﻣﯾدوارﮐﻧﻧده ﺑرای ﺗوﺳﻌﮫ ﻣدلھﺎی ھوش ﻣﺻﻧوﻋﯽ ﻗﺎﺑل
ﺗﻔﺳﯾر و ﮐﺎرآﻣد اراﺋﮫ ﻣﯽدھد .اﯾن ﻣﻘﺎﻟﮫ ﺑر روی ﻣدلھﺎی ﻣﺑﺗﻧﯽ ﺑر اﻧرژی و ﺷﺑﮑﮫھﺎی ﻣوﻟد ﺗﻣرﮐز دارد ﮐﮫ از اﺻول ﻓﯾزﯾﮏ آﻣﺎری
.اﻟﮭﺎم ﮔرﻓﺗﮫاﻧد و ﮐﺎرﺑردھﺎی آﻧﮭﺎ در ﺣوزهھﺎی ﻣﺧﺗﻠف را ﺑررﺳﯽ ﻣﯽﮐﻧد
ﻣﺎﺷﯾنھﺎی ﺑوﻟﺗزﻣن و ﻣﺎﺷﯾنھﺎی ﺑوﻟﺗزﻣن ﻣﺣدودﺷده
ﻣﺑﺎﻧﯽ رﯾﺎﺿﯽ
ﻣﺎﺷﯾنھﺎی ﺑوﻟﺗزﻣن ) (BMsدﺳﺗﮫای از ﻣدلھﺎی ﻣﺑﺗﻧﯽ ﺑر اﻧرژی ھﺳﺗﻧد ﮐﮫ از اﺻول ﻣﮑﺎﻧﯾﮏ آﻣﺎری ﺑرای ﻣدلﺳﺎزی ﺗوزﯾﻊھﺎی داده
ﺑﮫ ﺻورت زﯾر ﺗﻌرﯾف ﻣﯽﺷود:
ﮐﮫ در آن:
ﺗوزﯾﻊ اﺣﺗﻣﺎل روی واﺣدھﺎی ﻣرﺋﻲ و ﭘﻧﮭﺎن ﺗوﺳط ﺗوزﯾﻊ ﺑوﻟﺗزﻣن داده ﻣﯽﺷود:
1 )−𝐸(𝑣,ℎ
= )𝑃(𝑣, ℎ 𝑧
𝑒
)−𝐸(𝑣,ℎ
𝑒∑ = 𝑧
𝑣,ℎ
RBMsﻧﺳﺧﮫ ﺳﺎدهﺷدهای از BMsھﺳﺗﻧد ﮐﮫ در آﻧﮭﺎ اﺗﺻﺎﻻت ﺑﯾن واﺣدھﺎی ﻣرﺋﻲ و ﺑﯾن واﺣدھﺎی ﭘﻧﮭﺎن ﻣﺣدود ﺷدهاﻧد .ﺗﺎﺑﻊ اﻧرژی
ﯾﮏ RBMﺑﮫ ﺻورت زﯾر اﺳت:
اﺣﺗﻣﺎﻻت ﺷرطﯽ ﺑرای واﺣدھﺎی ﻣرﺋﻲ و ﭘﻧﮭﺎن ﺑﮫ ﺻورت زﯾر داده ﻣﯽﺷوﻧد:
)𝑗𝑖𝑤𝑖𝑣 ∑ 𝑃(ℎ𝑗 = 1|𝑣) = σ (𝑏𝑗 +
𝑖
1
)𝑥(σﺗﺎﺑﻊ sigmoidاﺳت. = 𝑋− ﮐﮫ در آن
𝑒1+
ﮐﺎرﺑردھﺎی RBMs
RBMsدر وظﺎﯾف ﯾﺎدﮔﯾری ﺑدون ﻧظﺎرت ﻣﺧﺗﻠﻔﯽ ﺑﺎ ﻣوﻓﻘﯾت ﺑﮫ ﮐﺎر ﮔرﻓﺗﮫ ﺷدهاﻧد ،از ﺟﻣﻠﮫ:
اﺳﺗﺧراج وﯾژﮔﯽ RBMs :ﻣﯽﺗواﻧﻧد وﯾژﮔﯽھﺎی ﻣﻌﻧﺎدار را از دادهھﺎی ﺧﺎم ﯾﺎد ﺑﮕﯾرﻧد ﮐﮫ ﻣﯽﺗواﻧﻧد ﺑرای وظﺎﯾف ﺑﻌدی ●
ﻣﺎﻧﻧد طﺑﻘﮫﺑﻧدی اﺳﺗﻔﺎده ﺷوﻧد.
ﮐﺎھش اﺑﻌﺎد RBMs :ﻣﯽﺗواﻧﻧد ﺑرای ﮐﺎھش اﺑﻌﺎد دادهھﺎ در ﺣﺎﻟﯽ ﮐﮫ ﺳﺎﺧﺗﺎر اﺳﺎﺳﯽ آﻧﮭﺎ ﺣﻔظ ﻣﯽﺷود ،اﺳﺗﻔﺎده ﺷوﻧد. ●
٣.١ﭼﺎرﭼوب ﻧظری
ﺷﺑﮑﮫھﺎی ﻣوﻟد ﺗﺧﺎﺻﻣﯽ ) (GANsاز دو ﺷﺑﮑﮫ ﻋﺻﺑﯽ ﺗﺷﮑﯾل ﺷدهاﻧد :ﯾﮏ ﻣوﻟد GGو ﯾﮏ ﺗﺷﺧﯾصدھﻧده .DDﻣوﻟد ﺳﻌﯽ ﻣﯽﮐﻧد
دادهھﺎﯾﯽ ﺗوﻟﯾد ﮐﻧد ﮐﮫ از دادهھﺎی واﻗﻌﯽ ﻏﯾرﻗﺎﺑل ﺗﺷﺧﯾص ﺑﺎﺷﻧد ،در ﺣﺎﻟﯽ ﮐﮫ ﺗﺷﺧﯾصدھﻧده ﺳﻌﯽ ﻣﯽﮐﻧد ﺑﯾن دادهھﺎی واﻗﻌﯽ و
ﺗوﻟﯾدﺷده ﺗﻣﺎﯾز ﻗﺎﺋل ﺷود .ﺗﺎﺑﻊ ھدف ﯾﮏ GANﺑﮫ ﺻورت زﯾر اﺳت:
ﮐﮫ در آن:
ﻓرآﯾﻧد آﻣوزش GANsﺷﺎﻣل ﯾﮏ ﺑﺎزی ﻣﯾﻧﯾﻣﮑس ﺑﯾن ﻣوﻟد و ﺗﺷﺧﯾصدھﻧده اﺳت .ﻣوﻟد ﺳﻌﯽ ﻣﯽﮐﻧد ﺗﺎﺑﻊ ھدف را ﮐﻣﯾﻧﮫ ﮐﻧد ،در ﺣﺎﻟﯽ
ﮐﮫ ﺗﺷﺧﯾصدھﻧده ﺳﻌﯽ ﻣﯽﮐﻧد آن را ﺑﯾﺷﯾﻧﮫ ﮐﻧد .اﯾن ﻓرآﯾﻧد آﻣوزش ﺗﺧﺎﺻﻣﯽ را ﻣﯽﺗوان ﺑﮫ ﻋﻧوان ﯾﮏ ﺳﯾﺳﺗم دﯾﻧﺎﻣﯾﮑﯽ ﺗﺻور ﮐرد ﮐﮫ
در آن ﻣوﻟد و ﺗﺷﺧﯾصدھﻧده در طول زﻣﺎن ﺗﮑﺎﻣل ﻣﯽﯾﺎﺑﻧد.
٣.٣ﮐﺎرﺑردھﺎی GANs
ﺗوﻟﯾد ﺗﺻوﯾر GANs :ﻣﯽﺗواﻧﻧد ﺗﺻﺎوﯾر ﺑﺎ ﮐﯾﻔﯾت ﺑﺎﻻ ﺗوﻟﯾد ﮐﻧﻧد ﮐﮫ از ﺗﺻﺎوﯾر واﻗﻌﯽ ﻏﯾرﻗﺎﺑل ﺗﺷﺧﯾص ھﺳﺗﻧد. ●
طراﺣﯽ ﻣوﻟﮑوﻟﯽ GANs :ﻣﯽﺗواﻧﻧد ﺑرای ﺗوﻟﯾد ﺳﺎﺧﺗﺎرھﺎی ﻣوﻟﮑوﻟﯽ ﺟدﯾد ﺑﺎ ﺧواص ﻣورد ﻧظر اﺳﺗﻔﺎده ﺷوﻧد. ●
۴.١ﻣﺑﺎﻧﯽ رﯾﺎﺿﯽ
رﻣزﮔذارھﺎی ﺧودﮐﺎر وارﯾﺎﻧﺳﯽ ) (VAEsﻣدلھﺎی ﻣوﻟد ھﺳﺗﻧد ﮐﮫ از اﺳﺗﻧﺗﺎج وارﯾﺎﻧﺳﯽ ﺑرای ﻣدلﺳﺎزی ﺗوزﯾﻊھﺎی داده ﭘﯾﭼﯾده اﺳﺗﻔﺎده
ﻣﯽﮐﻧﻧد VAE .از ﯾﮏ رﻣزﮔذار)𝑥|𝑧( 𝑞ϕو ﯾﮏ رﻣزﮔﺷﺎ )𝑧|𝑥( 𝑝ϕﺗﺷﮑﯾل ﺷده اﺳت .ﺗﺎﺑﻊ ھدف ﯾﮏ VAEﺗوﺳط ﮐران ﭘﺎﯾﯾن ﺷواھد
) (ELBOداده ﻣﯽﺷود:
ﮐﮫ در آن:
۴.٢ﻓرآﯾﻧد آﻣوزش
ﻓرآﯾﻧد آﻣوزش VAEsﺷﺎﻣل ﺑﮭﯾﻧﮫﺳﺎزی ELBOﺑﺎ ﺗوﺟﮫ ﺑﮫ ﭘﺎراﻣﺗرھﺎی θو ϕاﺳت .اﯾن ﮐﺎر ﻣﻌﻣوﻻً ﺑﺎ اﺳﺗﻔﺎده از روشھﺎﯾﯽ ﻣﺎﻧﻧد
ﻧزول ﮔرادﯾﺎن ﺗﺻﺎدﻓﯽ ) (SGDﯾﺎ ﯾﮑﯽ از اﻧواع آن اﻧﺟﺎم ﻣﯽﺷود.
۴.٣ﮐﺎرﺑردھﺎی VAEs
ﺗوﻟﯾد ﺗﺻوﯾر VAEs :ﻣﯽﺗواﻧﻧد ﺗﺻﺎوﯾر ﺟدﯾدی را ﺑﺎ ﻧﻣوﻧﮫﮔﯾری از ﻓﺿﺎی ﭘﻧﮭﺎن ﺗوﻟﯾد ﮐﻧﻧد. ●
ﭘﯾشﺑﯾﻧﯽ ﺳﺎﺧﺗﺎر ﭘروﺗﺋﯾن VAEs :ﻣﯽﺗواﻧﻧد ﺑرای ﻣدلﺳﺎزی ﺗوزﯾﻊ ﺳﺎﺧﺗﺎرھﺎی ﭘروﺗﺋﯾﻧﯽ و ﭘﯾشﺑﯾﻧﯽ ﺳﺎﺧﺗﺎرھﺎی ﺟدﯾد ●
اﺳﺗﻔﺎده ﺷوﻧد.
.۵ﻧﺗﺎﯾﺞ آزﻣﺎﯾﺷﯽ
آزﻣﺎﯾشھﺎﯾﯽ روی ﭼﻧدﯾن ﻣﺟﻣوﻋﮫ داده ﻣﻌﯾﺎر ،از ﺟﻣﻠﮫ MNIST، CIFAR-10و ﺑﺎﻧﮏ داده ﭘروﺗﺋﯾن ) (PDBاﻧﺟﺎم داده ﺷده اﺳت.
ﻣدلھﺎ ﺑﺎ اﺳﺗﻔﺎده از TensorFlowو PyTorchﭘﯾﺎدهﺳﺎزی ﺷدﻧد و آزﻣﺎﯾشھﺎ روی GPUھﺎی NVIDIAاﺟرا ﺷده اﻧد.
۵.٢ﻧﺗﺎﯾﺞ و ﺑﺣث
ﻧﺗﺎﯾﺞ آزﻣﺎﯾﺷﯽ اﺛرﺑﺧﺷﯽ ﻣدلھﺎی ھوش ﻣﺻﻧوﻋﯽ اﻟﮭﺎمﮔرﻓﺗﮫ از ﻓﯾزﯾﮏ را در وظﺎﯾف ﻣﺧﺗﻠف ﻧﺷﺎن ﻣﯽدھﻧد .ﺑﮫ ﻋﻧوان ﻣﺛﺎلRBMs ،
ﺑﮫ ﻋﻣﻠﮑرد ﭘﯾﺷرﻓﺗﮫای در اﺳﺗﺧراج وﯾژﮔﯽ و ﮐﺎھش اﺑﻌﺎد دﺳت ﯾﺎﻓﺗﮫ اﻧد ،در ﺣﺎﻟﯽ ﮐﮫ GANsو VAEsﺗﺻﺎوﯾر و ﺳﺎﺧﺗﺎرھﺎی
ﻣوﻟﮑوﻟﯽ ﺑﺎ ﮐﯾﻔﯾت ﺑﺎﻻ ﺗوﻟﯾد ﮐرده اﻧد.
.۶ﻧﺗﯾﺟﮫﮔﯾری
اﯾن ﻣﻘﺎﻟﮫ ﺑﮫ ﺑررﺳﯽ ﺗﻘﺎطﻊ ﻓﯾزﯾﮏ آﻣﺎری و ھوش ﻣﺻﻧوﻋﯽ ﭘرداﺧﺗﮫ و ﺑر روی ﻣدلھﺎی ﻣﺑﺗﻧﯽ ﺑر اﻧرژی و ﺷﺑﮑﮫھﺎی ﻣوﻟد ﺗﻣرﮐز
ﮐرده اﺳت .ﻣﺑﺎﻧﯽ رﯾﺎﺿﯽ ﻣﺎﺷﯾنھﺎی ﺑوﻟﺗزﻣن ،ﻣﺎﺷﯾنھﺎی ﺑوﻟﺗزﻣن ﻣﺣدودﺷده ،ﺷﺑﮑﮫھﺎی ﻣوﻟد ﺗﺧﺎﺻﻣﯽ و رﻣزﮔذارھﺎی ﺧودﮐﺎر
وارﯾﺎﻧﺳﯽ و ﮐﺎرﺑردھﺎی آﻧﮭﺎ در ﺣوزهھﺎی ﻣﺧﺗﻠف را ﺑررﺳﯽ ﮐردم .ﻧﺗﺎﯾﺞ آزﻣﺎﯾﺷﯽ اﺛرﺑﺧﺷﯽ اﯾن ﻣدلھﺎ را در وظﺎﯾﻔﯽ ﻣﺎﻧﻧد اﺳﺗﺧراج
وﯾژﮔﯽ ،ﮐﺎھش اﺑﻌﺎد و ﺗوﻟﯾد ﺗﺻوﯾر ﻧﺷﺎن ﻣﯽدھﻧد.
ﻣراﺟﻊ
1. Hinton, G. E., & Salakhutdinov, R. R. (2006). Reducing the dimensionality of data with
neural networks. Science, 313(5786), 504-507.
& 2. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ...
Bengio, Y. (2014). Generative adversarial nets. Advances in neural information
processing systems, 27.
3. Kingma, D. P., & Welling, M. (2013). Auto-encoding variational bayes. arXiv preprint
arXiv:1312.6114
ﺷﮑل :٢دﯾﻧﺎﻣﯾﮏ آﻣوزش ﯾﮏ ﺷﺑﮑﮫ ﻣوﻟد ﺗﺧﺎﺻﻣﯽ ).(GAN ﺷﮑل :١ﻣﻌﻣﺎری ﯾﮏ ﻣﺎﺷﯾن ﺑوﻟﺗزﻣن ﻣﺣدودﺷده )(RBM
ﺷﮑل :۴ﺗﺻﺎوﯾر ﺗوﻟﯾدﺷده ﺑﺎ اﺳﺗﻔﺎده از GANو VAE ﺷﮑل :٣ﻧﻣﺎﯾش ﻓﺿﺎی ﭘﻧﮭﺎن ﯾﮏ رﻣزﮔذار ﺧودﮐﺎر وارﯾﺎﻧﺳﯽ )(VAE