博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
scikit-learn:通过Non-negative matrix factorization (NMF or NNMF)实现LSA(隐含语义分析)...
阅读量:7026 次
发布时间:2019-06-28

本文共 1090 字,大约阅读时间需要 3 分钟。

之前写过两篇文章。各自是

1)矩阵分解的综述:

2)关于的简介:

今天发现NMF也是一个非常好非常有用的模型,就简介一下。它也属于的一部分。

NMF是还有一种压缩方法,前提是如果数据矩阵是非负的。

在数据矩阵不包括负值的情况下。 NMF能够取代PCA及他的变形( can be plugged in instead of  or its variants, in the cases where the data matrix does not contain negative values.)。

他通过把X分解成W和H。并优化下式:

This norm is an obvious extension of the Euclidean norm to matrices. (Other optimization objectives have been suggested in the NMF literature, in particular Kullback-Leibler divergence, but these are not currently implemented.)

和PCA不同的是。NNMF通过增量式(通过叠加每个子成分而不做相减操作)的方式表示一个向量,这样的增量式模型能有效表示图像和文本。

NNMF实现了非负双神秘值分解( Nonnegative Double Singular Value Decomposition,NNDSVD)。NNDSVD基于两个SVD过程。一个SVD过程用来近似数据矩阵,还有一个SVD过程利用单位秩矩阵的代数性质来近似第一步产生的SVD因子的正值部分。NNDSVD的基本实现能非常好地用于稀疏矩阵分解。

对于非稀疏矩阵,能够使用变形NNDSVDa (in which all zeros are set equal to the mean of all elements of the data)和NNDSVDar (in which the zeros are set to random perturbations less than the mean of the data divided by 100)

这个样例非常不错哦:

http://scikit-learn.org/stable/auto_examples/applications/topics_extraction_with_nmf.html#example-applications-topics-extraction-with-nmf-py

你可能感兴趣的文章
【物联网】阿里云物联网应用托管
查看>>
Mockdown快速入门
查看>>
网易云课堂Java模拟面试笔记(1-10)
查看>>
react js vccode调试
查看>>
小米9.0系统机器最完美激活Xposed框架的步骤
查看>>
排序算法总结
查看>>
温故之.NET进程间通信——管道
查看>>
Vue.js搭配环境过程中遇到的坑
查看>>
hexo博客搭建
查看>>
常见Dom操作有哪些?
查看>>
学习TypeScript
查看>>
编写自定义 .NET Core 主机以从本机代码控制 .NET 运行时
查看>>
Java代码执行顺序
查看>>
674 Longest Continuous Increasing Subsequence
查看>>
html5,canvas实现自定义饼图
查看>>
什么是JPA?Java Persistence API简介
查看>>
SpringBoot2.1版本的个人应用开发框架 - 整合vue实现前后端分离
查看>>
Rxjava2源码分析之线程切换(subscribeOn、observeOn)
查看>>
SpringBoot整合Mybatis
查看>>
KNN分类器-Java实现
查看>>