-
基于Hadoop的文本分类(1)-文本预处理&文本表示
资源描述一、环境环境:Ubuntu14、Hadoop2.6,Eclipse、NLPIR/ICTCLAS2015等;
二、算法简介:
1、此项目是基于Hadoop2.6进行MapReduce并行开发;
2、此项目是文本分类的文本预处理和文本表示部分,包括分词,去停用词,特征选择和文本表示等(分类算法采用的是随机森林算法,暂时未开放,读者可自行采用Mahout或Weka进行验证);
3、分词采用的是NLPIR/ICTCLAS2015;文本表示采用的是VSM模型,权重计算采用TFIDF进行文本表示;特征选择采用CHI算法(卡方统计);
4、关于并行分词环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4917665.html
5、关于Hadoop环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4901528.html和http://www.cnblogs.com/merru/p/4905118.html。
- 2022-03-01 12:43:10下载
- 积分:1
-
基于在线云保障食品安全
时下人们已成为热心研究人员对全球各地的几个类型食物食谱。他们登录到几个网站,以获取最喜爱的美食和样式。除了中国、 泰国和意大利,印度食品在其 cusines 中有广泛的品种。印度食品是太辣和油性为旅游来自西方国家,其中许多研究结束其营养价值。在这里,我们建议提供的各种各样的中印度已消费的食品营养价值的 web 应用程序。拟议的系统将提供原料蔬菜、 奶制品、 烹饪那些被消耗在这个国家的产品的营养价值。这一制度的目的是向意识到人民从过度消费的是不适合他们的荒地和心灵的食物食谱。
- 2022-02-01 14:45:01下载
- 积分:1
-
研究生DSP实验
本次实验主要目的是熟悉VISUALDSP++的开发环境。针对ADSP-TS201,利用几个用C、C++和汇编语言写成的简单例子来描述VISUAL DSP++编程环境和调试器(debugger)的主要特征和功能。对于运行在其它类型TS20x处理器的程序只需对其链接描述文件(.
- 2022-05-28 04:53:57下载
- 积分:1
-
cuda实现矩阵求逆
此程序包的矩阵求逆函数基于 CUDA 的实现包含对称的积极明确逆矩阵使用 GPU。用法,请参阅 testspd.cpp 中的示例。此外,一般块矩阵求逆通过高斯(pivotting) 没有消除。请参阅 testge.cpp 例如使用。注: GE 可能无法在单精度足够稳定。请参阅生成文件更改为双精度。
- 2022-07-16 13:09:40下载
- 积分:1
-
avr2323 my test c emulador
avr test fast pdp emulador kokoko dehght fh fg hd fgdf fdgdf bf bdtnjrtb bsdfb fvtbrtn fd dvrv vdr bdt f yngfnhgnrtn trnrtn rtntrn
- 2022-02-04 03:35:22下载
- 积分:1
-
应用于移动机器人路径规划的改进蚁群算法
基于改进蚁群算法的移动机器人路径规划,解决机器人路径选择的低效率问题,本算法对传统蚁群算法进行了改进,包括解的构造过程,信息素更新过程,基本思想是,蚂蚁在经过的路径上留下信息素,信息素一方面随着时间的积累,较优路径上的信息素越积越多,一方面还要挥发。为什么要引入信息素呢?也是从传统的奖励机制发展过来的。
- 2022-11-09 16:40:04下载
- 积分:1
-
同构DVS集群中基于自适应阈值的并行任务节能调度算法
资源描述目前,高能效的并行任务调度算法设计已经成为集群系统的研究热点.现有基于复制的节能调度算法主要利用阈值平衡系统的性能和能耗,但随机设置的阈值无法根据性能需求和环境参数等特征自动调节,导致调度算法存在一定的局限性.文中提出一种面向同构集群系统的两阶段节能调度算法ATES(Adaptive Threshold-based Energy-efficient Scheduling).首先,设计一种基于自适应阈值的任务复制策略,该策略能够自动计算最佳阈值,利用该阈值获取近似最优的任务分组.然后,将各分组任务调度到支持DVS的处理器上,并充分利用任务之间的空闲时间降低处理器电压.该算法将任务复制策略与电压调节技术有机结合,在调度过程中能够自动调整阈值,有效提高调度算法的能效.为了验证ATES算法的合理性,通过典型应用进行仿真实验,并与常见任务调度算法进行比较,结果表明ATES算法能够更好地实现性能和能耗之间的平衡.
- 2022-04-25 05:27:51下载
- 积分:1
-
mapreduce下矩阵相乘——内积方法
左矩阵A是m×s,右矩阵B是s×n,结果矩阵C是m×n。
- 2023-01-06 10:40:03下载
- 积分:1
-
并行分布实现矩阵乘法
资源描述
基于集群,测试后可用。
实现了并行分布式求解矩阵的幂。
基于消息传递的机制。主进程负责分配任务。各个子进程复杂计算。
通过分块,有效的解决了内存不足的问题。
- 2023-07-19 07:35:03下载
- 积分:1
-
任务调度
这是一份具有异构多核计算环境下的任务调度,计算异构环境下的最小makespan,适合研究并行计算的同学学习
- 2022-02-06 06:14:35下载
- 积分:1