登录
首页 » Others » RBM 算法理解

RBM 算法理解

于 2020-12-11 发布
0 223
下载积分: 1 下载次数: 1

代码说明:

RBM 算法理解 这份笔记参考了很多网上的资源,也加入很多自己的理解和详细推导, 非常适合初学者使用, 这篇笔记属于复合型产物,感谢那些网上无私奉献自己心得的人们。RBM能量模型这里说一下RBM的能量模型,这里关系到RBM的理解能量模型是个什么样的东西呢?直观上的理解就是,把一个表面粗糙又不太圆的小球,敚到一个表面也匕较粗糙的碗里,就随便往里面一扔,看看小球停在硫的哪个地方。一般来说停在碗底的可能性比较大,停在靠近碗底的其他地方也可能,甚至运气好还会停在碗口附近(这个碗是比较浅的一个碗):能量模型把小球停在哪个地方定义为一种状态,每种状态都对应着个能量,这个能量由能量函数来定义,小球处在某和状态的概率(如停在碗底的概率跟停在碗口的慨率当然不一样)可以通过这种状态下小球具有的能量来定义(换个说法,如小球停在了碗∏附近,这是·种状态,这个状态对应着一个能量,而发生“小球停在碗口附近”这种状态的概率,可以用来表小,表小成,其中是能量函数),其实还有一个简单的理解,球在碗底的能量一般小于在碗边缘的,比如重力势能这,显然碗底的状态稳定些,并且概率大些,就是我认为的能量模型。1.概率分布函数。各个节点的取值状态是概率的、随机的,这里用了3种概率分布来描述整个RBM网络,有联合概率密度,条件概率密度和边缘概率密度2.能量函数。随机神经网络的基础是统计力学,差不多思想是热力学米的,能量函数是描述整个系统状态的一种测度。系统越有序或者概率分布越集中(比如小球在碗底的情况),系统的能量越小,反之,系统越无序并且概率分布发散(比如平均分布),则系统的能量越大,能量函数的最小值,对应着整个系统最稳定的状态RBM能量模型的作用是什么呢?为什么要弄清楚能量模型的作用呢?第一、RBM网终是一种无监督学习的方法,无监督学习的目的自然就是最大限度的拟合输入数据和输出数据。第二、对于组输入数据来说,如果不知道它的分布,那是非常难对这个数据进行学习的。例如:如果我们实现写出了高斯函数,就可以写出似然睬数,那么就可以进行求解,就知道大致的参数,所以实现如果不知道分布是非常痛苫的·件事情,但是,没关系啊,统计力学的一项硏究成果表明,任何概率分布都可以转变成基于能量的模型,即使这个概率分布是未知的。我们仍然可以将这个分布改写成能量函数第三、能量函数能够为无监督学习方法提供个特殊的东两)日标函数b)标解换句话说,使用能量模型使得学丬一个数据的变得容易叮行了。能否把最优解的求解嵌入能量模型中至关重要,决定着我们具体问题求解的好坏。能量模型要捕获变量(这里我理解的是各个分量之间的关系)之间的相关性,变量之间的相关程度决定了能量的高低。把变量的相关关系用图表是一个图,以概率为测度,所以是概率图)模型的能量模型。由上面所说,RBM是一种概率图模型,既然引入了概率,那么就可以通过采样技术来求解,在CD( contrastive diⅳ vergence)算法中采栟部分扮演着模拟求解梯度的角色。能量模型需要定义一个能量函数,RBM能量函数如下:()=∑∑∑∑这个式子的含义非常明显,每个节点有一个能量, hidden和wsbe之间的连接也有个能量,如何求解呢?如果ⅵ isible有组取值(1,0,1),对应的 hidden取值是(1,0,1,01,0,分别带入上面的公式,最后得到的结果就是能量,这里要注意到()里面的地位是相等的,不存在先后顺序,这是一个结构整体的能量值为什么要搞能量函数?前面指出未知分布不好求解但是可以通过能量函数米表示,那么能量函数的概率模型很大程度上可以得到未知分布的概率模型,这样大致就知道了未知分布的分布既然知道了—个RBM网络 hidden和 visible整个框架的能量函数,那么可以定义这个能量函数(能量)出现的概率,很显然这个能量的出现与 hidden和sbe的每个节点的取值都有关系,那么这个能量出现的概率就是和的联合概率密度里可以将能量函数理解成小球在碗里面具体的一个位置所具有的一个能量,那么联合概率密度就是能量也就是这个状态出现的概率)这个概率不是随便定义的,是有统计热力学解释的定义了联合概率密度,那么我就可以得到一个分布,现在再回来前面的知识,可以得到1最初是未知分布的数据,求解参数,完全无从下手2.将未知分布的数据与能量函数联合在起3定义这个能量函数出现的概率,其实也就是对应着未知分布数据一个函数出现的概率4我们可以得到能量函数的概率分布,这个分布就叫 Gibbs分布,这里不是一个标准的Gibs分布,而是一个特殊的 Gibbs分布,这个分布有一组参数,其实就是能量函数中的那儿个前面知道∫下面可以得到边缘概率密度和()∑∑也可以得到条件概率密度和∑∑从概率到极大似然上面的内容已经得到了Gb分布的各种概率密度函数,现在回到最初的目的,即求解让RBM网络表示的Gibs分布最大可能的拟合输入数据,或者换一种说法,求解的目标可以认为是让RBM网终表示的 Gibbs分布与输入样本的分布尽可能的接近现在的小问题是“最大可能的拟合输入数据"这句话怎么定义:假设表小样本空间,即里面含有很多个不同的,是输入样本的分布,()表示训练样本的概率,再假设是RBM网络表示的 Gibbs分布的的边缘分布,即可以理解成每种不同情况的都对应着一个概率。输入样本的集合定义为,那么样木真实的分布和RBM网络表示的边缘分布的KL距离就是2者之间的差异性(KL的详细讲解见附录),样本的真实分布(什么是样本的分布?见附录)与RBM网络表示的边缘分布的KL距离如下所示()20)-0=2()0)2()(如果输入样本表小的分布与RBM表小的Gbbs分布完全符合,这个KL距离就是0,否则是一个大于0的数山附录对熵的定义(在KL讲解里面)可知,上面)的第一项是输入样本的熵,这个是·个固定的数,输入样本固定了,熵就固定了,第二项明显无法直接求。由KL的性质可知,KL是一定大于0的,那么当第二项最大的时候,整个KL最小,我们本来的日的也是求KL最小。注意到第二项-∑()()中的()当样木固定的时候,是固定的而函数是递增的,即当∑()最大即可。在实际应用中,我们采用的是∑(),其中是样本的个数。这里的-∑()就是极大似然估计(这里大家可以∈代替了∈Ω,这是为什么呢?拿一个2维向量来说,(1,0),(1,1),(0,0)这3个的概率和是1,(0,1)出现的概率是0,那么样本空间是(1,0),(1,1),(0,0),但是我们采样的时候只采样到∫(1,0),(1,1),那么这次的输入样本的集合就是(1,0)(1,1))。结论就是求解输入样本的极大似然,就能让RBM网络表示的 Gibbs分布和样本本身表示的分布最接近。求解极大似然这里对似然的定义参考我的另一篇笔记EM算法这个样本从所有样本被取到的概率为0)=∏(b)b∈6()=(0)=∑(0)c⊙在RBM模型中,上面的似然函数写成(上面的式子中是样本,也可以理解为一个isbe节点):(O)-(0)-l()O∈()=∏(b)=∑()0∈对这个函数进行求导02(066∈⊙66我们由能量模型应该也知道了()的概率∑,那么下面开始求导∑06∑c8上面这个式子一定要注意一个问题,即第一项的和第二项的00是不一样的。第一项的是固定的里面的取多少它就取多少而第二项里面的是所有可能的,其实这个细节也可以从∑和∑中发现出来()注意到()和,上面的式子可以写成∑0606∑()∑x((2m0)2x(2m0606第一项和第二项分别是和的期望,这2个是不同的,第一060个求在下的期望,第二项求的是这个函数在概率()下的期望。将O和()由最前面的东西代换,可得到以下3个式了∑∑∑∑∑∑()∑∑()∑()∑∑(这里用到了一个技巧∑这里∑是指hden中第个向量为0,其他分量的值任取的一组向量。?岁∑()∑()∑()∑()∑∑∑∑)-∑()-∑∑()()-∑()∑()∑∑=∑()-∑∑()()=∑()-∑()∑())-∑()(可以发现和的第二项都含有∑,这意味着要对进行遍历,这明显不可能,但是算梯度需要怎么小呢?这时就可以通过 markov采样来算,只要抽取一堆样本,这些样本符合RBM网络表示的Gibs分布,就可以把上面3个偏导数算出来。具体的处理过程是对于每个训练样本,都用某种抽样方法抽取一个对应的,这个是符合RBM网络所表示的Gbs分布的。那么对于整个训练集{米说,就得到一组对应的符合RBM网络表示的Gibs分布的样本集{然后拿这个样本去估算第二项∑,那么梯度就可以用以下的式了来近似了:()(=)-∑()(=)-∑()上面的式子中表小第个训练样木,是所对应的符合RBM网络表小的Gs分布的样本,在式子中用表示。梯度求出来了,就可以求解了,最后不断迭代就可以得到

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • MATLAB DL工具箱 (deep learning toolbox)
    一直在看Deep Learning,我目前也没能力自己去写一个toolbox。后来发现了一个matlab的Deep Learning的toolbox,发现其代码很简单,感觉比较适合用来学习算法。matlab的实现可以省略掉很多数据结构的代码,使算法思路非常清晰。有SAE、NN、DBN、CNN、CAE。有栈式自编码实现、神经网络、深度置信网络、卷积神经网络等。
    2020-12-12下载
    积分:1
  • matlab gui之贷款计算器BY罗华飞
    【实例简介】因最近在学习建设工程经济(一建考试项目),萌发了想写一个贷款计算器的想法。花了一个下午终于搞定。 功能: 根据等额本金和等额本息的计算公式(等额本金是利用终值公式计算得来,等额本息是利用终值公式和等额现金流量公式联合得来,不懂得同学可以问百度),推导出商业贷款和公积金贷款的还款明细,并分析哪种贷款方式利息和更少。 欢迎广大读者共同学习交流。 运行环境:matlab 2010b+win7
    2021-11-08 00:35:47下载
    积分:1
  • 常用EXE文件反译工具
    Resource Hacker Reshacker因原英文版附带的帮助文件格式太老,Win7下无法使用,现已转换为 CHM 帮助文件,去掉了 hlp 文件,仍为中文,但无法从软件的帮助菜单中直接调用,如要查阅帮助文件,请直接点击 ResHacker.chm 文件。* 新增对 PNG 图标的支持。此为官方简体中文版,包括中文程序及中文文档。时隔7年后作者再次更新,主要是提供对64位程序及PNG 图像的支持。Resource Hacker(TM) 可以用来: 1. 查看 Windows 32 位和 64 位可执行文件(*.exe、*.dll、*.cpl、*.ocx、*.mssty
    2021-05-07下载
    积分:1
  • Intel汇指令集(共七卷).pdf
    Intel汇编指令集(共七卷) 英特尔最新汇编指令全集,包括32为和64位汇编指南。
    2019-11-27下载
    积分:1
  • 计算机图形学绘制任意斜率直线段.rar
    计算机图形学绘制任意斜率直线段,孔令德版教程配套实验,含实验源代码和运行后生成的各种文件
    2020-11-29下载
    积分:1
  • Key Technologies for 5G Wireless Systems
    5G无线通信系统关键技术(剑桥大学出版社) 2017年出版 对于5G所有最新技术进行了详细说明 很全的工具书Key Technologies for5G Wireless SystemsVINCENT W. S, WONGUniversity of British ColumbiaROBERT SCHOBERUniversity of Erlangen-NurembergDERRICK WING KWAN NGUniversity of New South WalesLI-CHUN WANGNational Chiao-Tung University即CAMBRIDGEUNIVERSITY PRESSCAMBRIDGEUNIVERSITY PRESSUniversity Printing House. Cambridge CB2 SBS. United KindomOne Liberty Plaza, 20h Floor New York, NY I(H0X, USA477 williamstown Road, port Melbourne, yic 3207 australia48424, 2nd Floor, Ansar Rod, Daryaganj. Delhi- I l4XH2, India79 Anson Road, #o6-(/ 00, Singapore 079%MCambridge University Press is part of the Lniversity of CambridgeIt furthers the University s mission by disseminating knowledge in the pursuit ofeducation, leaming and research at the highest international levels of excellence.www.cermbrid吧eInformtiononthistitlewww.cambridgeorg/978110713241810,1017③781316771655C Cambridge University Press 2017This puhlication is in copyright. Subjcct to sututonry exceptionand to the provisions of relewant collective licensing agreementsno reproduction of any part may take place without the writtenpermission of Cutmbridgre University Press.First published 2(117Printed in the United Kingdom by TJ International Ltd. Padstow, CornwallA catalogue recor for this pudlieafiove is aailable fromm the British LibraryLibrary of Congress Cataloging- in Pi hlicaiomz dataNames: Wong, Vincent W.S., editorTitle: Key technologies for 5G wireless systems/edited by Vincent W.S. Wong [and 3 otherOther titles key technologies for five g wireless svstemsDescription: Carmbrisige: New York, NY: Cambridge Lniversity Press, 2017.Identifiers: l CCN 2016045220)1 ISBN 9781 172418 (hardback)Subjects: LCSH: Wireless communication systems, I Machine-to-machinecommunications. Internet of things.Classitication: LCC TKs1032K49 2(17 DDC 621.38450-dc23LcrecordavailaBleathttps://lccnioc-gov/2016m5220)ISBN 978-1-107-17241- HardbackCambridge University Press has no responsibility for the persistence or accuracy ofURLs for extermal or third-party Internet websites referred to in this puhlication,and does not guarantee that any content on such websites is, or will remainaccurate of appropriateContentsList of Contributorspage xvIPrefaceKXIOverview of New Technolog ies for 5G SystemsVincent W S, Wong, Robert Schober, Derrick Wing Kwan Ng, and Li-Chun Wang1.1 Introduction1.2 Cloud Radio Access Networks1.3 Cloud Computing and Fog Computing1. 4 Non-orthogonal Multiple Access1. 5 Flexible Physical Layer Design334.4671. 6 Massive MIMo1. 7 Full-Duplex Communications1. 8 Millimeter wave1.9 Mobile Data Offloading, LTE-Unlicensed, and Smart Data Pricing131. 10 IoT M2M. and D2D1. I1 Radio Resource Management, Interference Mitigation, and Caching61. 12 Energy Harvesting Communications1. 13 Visible Light Communication19Acknowledgments20ReferencesPart I Communication Network Architectures for 5G Systems25Cloud Radio Access Networks for 5G Systems27Chih-Lin I, Jinn Huang, Xueyan Husang, Rongwved Ren, and Yami. Chen2.1 Rethinking the Fundamentals for 5G Systems272 User- Centric Networks2923 C-RAN Basics292.3.1 C-RAN Challenges Toward SGI302.4 Next Generation Fronthaul Interface (NGFI: The FH Solutionfor SGC-RAN312. 4.1 Proof-of-Concept Development of NGFI33Contents2.5 Proof-of-Concept Verification of Virtualized C-RAN2.5.1 Data packets3725.2 Test Procedure382.5.3 Test Results392. 6 Rethinking the Protocol Stack for C-RAN2.6.1 Motivation402.6.2 Multilevel Centralized and Distributed Protocol Stack402.7 Conclusion45AcknowledgmentsReferencesFronthaul-Aware Design for Cloud Radio Access Networks48Liang Liu, Wei Yu, and Osvaldo Simeone3. 1 Introduction483.2 Fronthaul-Aware Cooperative Transmission and Reception493. 2.1 Uplink513.2.2 Downlink573.3 Fronthaul-Aware Data Link and Physical layers61.3. I Uplink633.3.2 Downlink693.4 Conclusion73Acknowledgments74References74MobEdge computing76Ben Liang4.1 Introduction764.2 Mobile Edge Computing774.3 Reference architecture794.4 Benefits and Application Scenarios804 4.1 User-Oriented Use cases4. 4.2 Operator-Oriented Use Ca814 5 Research challenges824.5.1 Computation Offloading824.5.2 Communication Access to Computational Resources834.5.3 Multi-resource Schedulin844.5 4 Mobility Management854.5.5 Resource Allocation and Pricing4.5.6 Network functions virtualization864.5, 7 Security and Pri864.5.8 Integration with Emerging Technologies874.6 Conclusion88ReferencesContentsDecentralized Radio Resource Management for Dense HeterogeneousWireless networksAbolfazl Mehhodniya and Fumiyuki Adach5.1 Introduction925.2 System Model935.2.1 SINR Expression5.2.2 Load and Cost Function Expressions955.3 Joint BSCSA/UECSA ON/OFF Switching Scheme965.3.1 StrateTy Selection and Beacon Transmission53.2 UE AssocIation5.3.3 Proposed Channel Segregation Algorithms985.3.4 Mixed-Strategy Update3.4 Computer Simulation5.5 Conclusion104Acknowledgments04References105Part ll Physical Layer Communication Techniques107Non-Orthogonal Multiple Access(NOMA)for 5G Systems109Wei Llang, Zhiguo Ding, and H. Vincent Poor6.1 Introduction1106.2 NOMA in Single-Input Single-Output(SISO)Systems1126.2.1 The basics of nomaI126. 2. 2 Impact of User Pairing on NOMA136.2,3 Cognitive Radio Inspired NOMA6. 3 NOMA in MIMO Systems1206.3.1 System Model for MIMO-NOMA Schemes1216.3.2 Design of Precoding and Detection Matrices with Limited CSIT 1236.3.3 Design of Precoding and Detection Matrices with Perfect CSIT 1266.4 Summary and Future Directions128ReferencesFlexible Physical Layer Design133Maximilian Matthe, Martin Danneberg, Dan Zhang, and Gerhard Fettweis7.1 Introduction1337. 2 Generalized Frequency Division Multiplexing357.3 Software-Defined waveform1377. 3. 1 Time Domain Processing1387.3.2 Implementation Architecture1387.4 GFDM Receiver Design14174 Synchronization unit1427. 4.2 Channel Estimation Unit1474.3 MIMo-GFDM Detection Unit145Contents7.5 Summary and Outlook147Acknowledgments148References488Distributed Massive MIMO in Cellular Networks15IMichail Matthaiou and Shi Jin8. I Introduction15l8. 2 Massive MIMO: Basic Principles1528.2.1 Uplink Downlink Channel Models1538.2.2Favorable Propagation1548.3 Performance of Linear Receivers in a Massive MIMO Uplink1548.4 performance of linear precoders in a massive mimo downlink1578. s Channel estimation in massive mimo systems1588.5.1 Uplink Transmission1598.5.2 Downlink Transmission1608.6 Applications of Massive MIMO Technology1618.6.1 Full-Duplex Relaying with Massive Antenna Arrays1618.6.2 Joint Wireless Information Transfer and Energy Transfer forDistributed massive mimo1638.7 Open Future Research Directions1678. 8 Conclusionl68References169Full-Duplex Protocol Design for 5G Networks172Tanelf Ahonen and Risto wichman9.1 Introduction1729. 2 Basics of Full-Duplex Systems1739.2.1 In-Band Full-Duplex Operation Mode1739.2.2 Self-Interference and Co-channel Interference1749.2.3 Full-Duplex Transceivers in Communication Links1759. 2. 4 Other Applications of Full-Duplex Transceivers1789.3 Design of Full-Duplex Protocols1799.3, 1 Challenges and Opportunities in Full-Duplex Operation1799.3.2 Full-Duplex Communication Scenarios in 5G NetworksR9.4 Analysis of Full-Duplex Protocols1829.4.1 Operation Modes in Wideband Fading Channels1829. 4, 2 Full- Duplex Versus Half-Duplex in Wideband Transmission1849.5 Conclusion1849.5.1 Prospective Scientific Research DirectionsI849.5.2 Full-Duplex in Commercial 5G Networks185RLItrtncekl8610Millimeter Wave Communications for 5G Networks188Jiho Song, Miguel R Castellanos, and David J. LoweContentsⅸx10.1 Motivations and Opportunities18810.2 Millimeter Wave Radio Propagation18910. 2.1 Radio Attenuation1890. 2. 2. Free-Space Path LOSs19I10.2.3 Severe shadow19310.2 4 Millimeter Wave Channel model19310.2.5 Link Budget Analysis19410.3 Beamforming Architectures19510.3, Analog beamforming solutions19610.3.2 Hybrid Beamforming Solutions20010.3.3 Low-Resolution Receiver Architecture2010.4 Channel Acquisition Techniques20110.4.1 Subspace Sampling for Beam Alignment20210.4.2 Compressed Channel estimation Techniques20510.5 Deployment Challenges and Applications20710.5.1 EM Exposure at Millimeter Wave Frequencies20710.5.2 Heterogeneous and Small-Cell Networks208Acknowledgments209References209Interference Mitigation Techniques for Wireless Networks214Koralia N Pappi and George K, Karag annidis1 1.1 Introduction21411.2 The Interference Management Challenge in the 5G vision21411. 2. 1 The 5G Primary Goals and Their Impact on Interference2141 1.2.2 Enabling Technologies for Improving Network Efficiencyand Mitigating Interference21611.3 Improving the Cell-Edge User Experience: Coordinated Multipoint218I 1.3.1 Deployment Scenarios and Network Architecture2181 13. 2 CoMP Techniques for the Uplink22011.3.3 CoMP Techniques for the Downlink2211 1.4 Interference Alignment: Exploiting Signal Space Dimensions2231 1.4.1 The Concept of Linear Interference Alignment224L1. 4.2 The Example of the X-Channel225I 1. 4.3 The K-User Interference Channel and Cellular NetworksAsymptotic Interference Alignment22611.4.4 Cooperative Interferenee Networks22711.4.5 Insight from IA into the Capacity Limits of Wireless Networks 22711.5 Compute-and-Forward Protocol: Cooperation at the ReceiverSide for the Uplink22811.5.1 Encoding and Decoding of the CoF Protocol22811.5.2 Achievable-Rate Region and Integer Equation Selection23011.5.3 Advantages and Challenges of the CoF Protocol232IL6 Conclusion233References233
    2020-12-06下载
    积分:1
  • GPS单点定位序设计
    该文档介绍了GPS基于伪距的单点定位的原理与编程实现方法,内含程序源代码和运行结果截图。
    2020-12-11下载
    积分:1
  • DDR布局布线规则与实例【中为电子科技工作室】
    【实例简介】DDR属于高速电子电路范畴,在Layout时需要做等长处理,本文介绍了DDR的布局布线规则,图文并茂,易学易懂。
    2021-11-19 00:38:34下载
    积分:1
  • max262的原理和PCB图
    【实例简介】max262的资料 自己画的板子 可编程滤波器
    2021-11-07 00:36:52下载
    积分:1
  • 小波基构造函数 Matlab函数
    此函数可以构造小波基通过小波函数找到合适的小波基
    2020-11-27下载
    积分:1
  • 696516资源总数
  • 106914会员总数
  • 0今日下载