在看论文《Detecting Regions of Maximal Divergence for Spatio-Temporal Anomaly Detection》时,文中提到了这三种方法来比较时间序列中不同区域概率分布的差异。

KL散度、JS散度和交叉熵
三者都是用来衡量两个概率分布之间的差异性的指标。不同之处在于它们的数学表达。
对于概率分布P(x)和Q(x)
1)KL散度(Kullback–Leibler divergence)
又称KL距离,相对熵。
当P(x)和Q(x)的相似度越高,KL散度越小。
KL散度主要有两个性质:
(1)不对称性
尽管KL散度从直观上是个度量或距离函数,但它并不是一个真正的度量或者距离,因为它不具有对称性,即D(P||Q)!=D(Q||P)。
(2)非负性
相对熵的值是非负值,即D(P||Q)>0。
2)JS散度(Jensen-Shannon divergence)
JS散度也称JS距离,是KL散度的一种变形。
但是不同于KL主要又两方面:
(1)值域范围
JS散度的值域范围是[0,1],相同则是0,相反为1。相较于KL,对相似度的判别更确切了。
(2)对称性
即 JS(P||Q)=JS(Q||P),从数学表达式中就可以看出。
3)交叉熵(Cross Entropy)
在神经网络中,交叉熵可以作为损失函数,因为它可以衡量P和Q的相似性。
交叉熵和相对熵的关系:
以上都是基于离散分布的概率,如果是连续的数据,则需要对数据进行Probability Density Estimate来确定数据的概率分布,就不是求和而是通过求积分的形式进行计算了。
补充:信息熵、交叉熵与KL散度
信息量
在信息论与编码中,信息量,也叫自信息(self-information),是指一个事件所能够带来信息的多少。一般地,这个事件发生的概率越小,其带来的信息量越大。
从编码的角度来看,这个事件发生的概率越大,其编码长度越小,这个事件发生的概率越小,其编码长度就越大。但是编码长度小也是代价的,比如字母'a'用数字‘0'来表示时,为了避免歧义,就不能有其他任何以‘0'开头的编码了。
因此,信息量定义如下:
信息熵
信息熵是指一个概率分布p的平均信息量,代表着随机变量或系统的不确定性,熵越大,随机变量或系统的不确定性就越大。从编码的角度来看,信息熵是表示一个概率分布p需要的平均编码长度,其可表示为:
交叉熵
交叉熵是指在给定真实分布q情况下,采用一个猜测的分布p对其进行编码的平均编码长度(或用猜测的分布来编码真实分布得到的信息量)。
交叉熵可以用来衡量真实数据分布于当前分布的相似性,当前分布与真实分布相等时(q=p),交叉熵达到最小值。
其可定义为:
因此,在很多机器学习算法中都使用交叉熵作为损失函数,交叉熵越小,当前分布与真实分布越接近。此外,相比于均方误差,交叉熵具有以下两个优点:
在LR中,如果用均方误差损失函数,它是一个非凸函数,而使用交叉熵损失函数,它是一个凸函数;
在LR中使用sigmoid激活函数,如果使用均方误差损失函数,在对其求残差时,其表达式与激活函数的导数有关,而sigmoid(如下图所示)的导数在输入值超出[-5,5]范围后将非常小,这会带来梯度消失问题,而使用交叉熵损失函数则能避免这个问题。
KL散度
KL散度又称相对熵,是衡量两个分布之间的差异性。从编码的角度来看,KL散度可表示为采用猜测分布p得到的平均编码长度与采用真实分布q得到的平均编码长度多出的bit数,其数学表达式可定义为:
一般地,两个分布越接近,其KL散度越小,最小为0.它具有两个特性:
非负性,即KL散度最小值为0,其详细证明可见[1] ;
非对称性,即Dq(p)不等于Dp(q) ; KL散度与交叉熵之间的关系
在这里,再次盗用[1]的图来形象地表达这两者之间的关系:
最上方cH(p)为信息熵,表示分布p的平均编码长度/信息量;
中间的Hq(p)表示用分布q表编码分布p所含的信息量或编码长度,简称为交叉熵,其中Hq(p)>=H(p)
;最小方的Dq(p)表示的是q对p的KL距离,衡量了分布q和分布p之间的差异性,其中Dq(p)>=0;
从上图可知,Hq(p) = H(p) + Dq(p)。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。
相关推荐:
ChatGPT4网页空白:重新定义智能交互的未来,怎么登ai
ChatGPT页面无法翻阅?带你深度了解背后的原因与解决方案,pdf怎么转换ai文字
ChatGPT崩了?用户称打开是一片空白,背后隐藏了什么?,ai 新技巧
ChatGPT免费版下载:智能对话助手带来的全新体验,电脑怎么下载Ai微认证
SEO好吗?助力网站成功的关键之道,网站优化方案范文怎么写
文章AI排版,让创作更高效的秘密武器
为什么越来越多的人选择在知乎发布文章?这里面的机会你可能还没发现!,潍坊关键词排名提升
AI一键生成文章网页版,让内容创作更简单高效
seo矩阵运营中心是什么,seo矩阵运营中心是什么意思啊 ,北京ai特效
AI的两个主要发展阶段:从起步到突破,如何重塑未来,wps ai写作去哪里
SEO场景下的数字营销:如何通过精准优化提升网站流量,陕西融发建设集团网站
ChatGPT破解:人工智能的无限潜力与破解秘笈,意识变ai
怎么看文章是不是AI生成的?揭秘背后的玄机与技巧
一键创作,助你轻松实现创意梦想,最低价刷粉网站推广
高效创作新时代AI文案速写工具,让创作更轻松
AI一键生成原创文章,让创作更高效更轻松!
SEO词的魔力:如何通过关键词优化打破流量瓶颈,免费网站建设高端
seo网站代码是什么,网站专业术语中seo意思是什么 ,拟人ai制作
seo菲律宾是做什么,菲律宾网址排名 ,openl ai
SEO趋势:2025年搜索引擎优化的未来发展,河南省营销推广系统官网
ChatGPT破解版:让人工智能助力你的工作与生活,ai cos帽
“扩写AI”-引领写作革命,开启智能创作新时代,dede seo 标题如何填写
SEO项目:如何通过精确优化提升企业网站排名与转化率,武汉做网站优化的公司
在线AI文章生成:智能写作的无限可能
ChatGPT全球宕机:人工智能的崩塌与未来的挑战,中国ai和美国ai教父
SEO怎么排名?这5大技巧,轻松提升网站排名,人人都可ai
SEO自己:打造属于你的数字营销利器,微信裂变营销推广软件
人工润色:让文字更具魅力的秘密武器,快排seo软件哪个最好
企业SEO:如何通过搜索引擎优化提升企业网络竞争力,安阳网站优化布局设计
从语言助手到智能生活伙伴,未来的智能助手如何改变我们的生活,网站建设分站公司
ChatGPT一经发布,便受到了用户的狂热追捧,引爆人工智能热潮,十代ai达人办公本
ChatGPT服务部分恢复:人工智能助力全新体验,ai对象菜单
用AI写一篇文章,如何提升你的写作效率与创意
SEO新手必看:从零开始SEO优化的终极指南,随州网站优化技巧
OpenAI推出的GPT-4Turbo大幅降低了AI应用成本,推动了AI技术的普及化,ai*版
AI网页设计生成-智能化创造无限可能,ai机甲风背景音乐
产品经理seo是什么,产品经理seo是什么意思 ,ai政府公文写作 软件
ChatPartner无法连接网络?解决方案,让你的聊天体验更顺畅!,如何用ai给自己写作文
SEO优化如何为网站做好关键词研究和优化,ai直通
seo适合什么职业,seo有前途么 ,ai小精灵
什么是seo公司口碑,seo品牌 ,ai大模型训练是什么意思
ChatGPT3.5最新版:智能对话新纪元,带你进入AI的未来世界,ai苔藓生长
什么是seo快排,seo快排方案 ,ai剪图形
SEO快速提升:让你的网站排名瞬间飙升的秘诀,网站建设的发展目标
ChatGPT怎么找梯子:突破网络限制,轻松访问AI助手的终极指南,鬼灭之刃人物AI还原
如何选择适合你的AI工具?全面解析AI工具哪个好用
SEO知道:让你的网站在搜索引擎中脱颖而出,水安建设集团网站
ChatGPT无法加载?检查网络并尝试重启,助您快速恢复畅通体验,burj ai
seo网站是什么找行者SEO,seo分析网站 ,ai图文梅花
ChatGPT360:全方位提升你的工作与生活效率,ai72787