-
潜在狄利克雷分布主题模型 LDA
LDA是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。文档到主题服从Dirichlet分布,主题到词服从多项式分布。
LDA是一种非监督机器学习技术,可以用来识别大规模文档集(document collection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bag of words)的方法,这种方法将每一篇文档视为一个词频向量,从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序,这简化了问题的复杂性,同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。
对于语料库中的每篇文档,LDA定义了如下生成过程(generative process):
1. 对每一篇文档,从主题分布中抽取一个主题;
2. 从上述被抽到的主题所对应的单词分布中抽取一个单词;
3. 重复上述过程直至遍历文档中的每一个单词。
- 2022-03-16 01:27:42下载
- 积分:1
-
15-Puzzle - GAME IN C
15拼图(也称为宝石拼图、老板拼图);
- 2022-01-23 11:07:07下载
- 积分:1
-
管道通信
int main(int argc, char **argv){ int pipefds[2],pipefds2[2]; pid_t pid; int i,j; char buffer[255]; if(pipe(pipefds) < 0) //第一个管道 { printf("error
"); } pid=fork(); if(pid
- 2022-12-15 02:55:04下载
- 积分:1
-
cpu-manager tool
cpu管理工具
- 2023-04-05 07:45:04下载
- 积分:1
-
简单linux网络程序
connect
int connect(int sockfd, struct sockaddr * serv_addr,int addrlen)
sockfd:socket返回的文件描述符.
serv_addr:储存了服务器端的连接信息.其中sin_add是服务端的地址
addrlen:serv_addr的长度
connect函数是客户端用来同服务端连接的.成功时返回0,sockfd是同服务端通讯的文件描述符 失败时返回-1.
- 2022-02-03 23:21:43下载
- 积分:1
-
NS2中添加mudp,mtcp代理的源码
这些源码是柯志亨老师书中书讲述的源码,在NS2中添加具有记录功能的mudp,mtcp
- 2022-02-05 09:14:18下载
- 积分:1
-
linux c 时戳追加方式日志记录
linux c 包含时戳 采用追加方式进行日志记录,可以快速移植到开发项目中。
- 2022-08-08 17:21:09下载
- 积分:1
-
qt 实现的文件管理器
用qt实现的文件管理器,可实现简单的文件浏览,目录查看等功能,功能比较基础,可以在上面做其他修改,使其功能更加完善,qt creator 编译。
- 2022-02-15 13:47:09下载
- 积分:1
-
表情识别代码,可做毕业设计
基于opencv的表情识别,opencv是一款开源的软件,大多应用于计算机视觉,机器视觉,很多视觉功能相对于matlab更完善,opencv即可也在vs下运行,又可以在linux配置,程序还有不足,希望后人完善谢谢
- 2023-04-05 05:45:04下载
- 积分:1
-
TI_DM3730 Linux下串口通信测试程序
TI_DM3730 Linux下串口通信测试程序,有兴趣搞DM3730的童鞋们可以下来研究一下,TI的出品非常值得学习
- 2022-02-05 01:11:22下载
- 积分:1