-
spark apriori算法实现代码
应用背景
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
关键技术频繁项集挖掘采用spark实现的并行化挖掘算法。并行的apriori算法采用scala编写,并行的apriori采用java编写。里面会有较多函数使编程的内容。
- 2022-02-02 20:25:06下载
- 积分:1
-
基于Hadoop的文本分类(1)-文本预处理&文本表示
资源描述一、环境环境:Ubuntu14、Hadoop2.6,Eclipse、NLPIR/ICTCLAS2015等;
二、算法简介:
1、此项目是基于Hadoop2.6进行MapReduce并行开发;
2、此项目是文本分类的文本预处理和文本表示部分,包括分词,去停用词,特征选择和文本表示等(分类算法采用的是随机森林算法,暂时未开放,读者可自行采用Mahout或Weka进行验证);
3、分词采用的是NLPIR/ICTCLAS2015;文本表示采用的是VSM模型,权重计算采用TFIDF进行文本表示;特征选择采用CHI算法(卡方统计);
4、关于并行分词环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4917665.html
5、关于Hadoop环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4901528.html和http://www.cnblogs.com/merru/p/4905118.html。
- 2022-03-01 12:43:10下载
- 积分:1
-
示波器代码
示波器的源代码,效果不错的,dlo1w1dsc hhjhsdf sfdssd fsdhsdfhsdj eewrew erewrewr dsfefh dsdewh
- 2022-07-07 20:07:57下载
- 积分:1
-
cuda并行计算
资源描述VS_cuda并行计算 两基于vs实现的.cu代码 简单的实现矩阵相乘和反转。
- 2022-05-21 15:38:13下载
- 积分:1
-
串行和并行计算的比较
访问邻居 PC 零售商店提供了充足的证据,我们是在多核时代。厂商之间的关键区别今天是他们打包到单个芯片上的内核的数量。商品处理器的时钟频率已经达到了极限,然而,和很可能保持在以下 4 GHz 多年来。因此,加入内核是不增加计算能力的代名词。要充分利用提供的新的多核硬件的性能增强,相应地调整必须发生在软件基础设施 — — 转变为并行计算。
- 2022-08-13 04:18:03下载
- 积分:1
-
同构DVS集群中基于自适应阈值的并行任务节能调度算法
资源描述目前,高能效的并行任务调度算法设计已经成为集群系统的研究热点.现有基于复制的节能调度算法主要利用阈值平衡系统的性能和能耗,但随机设置的阈值无法根据性能需求和环境参数等特征自动调节,导致调度算法存在一定的局限性.文中提出一种面向同构集群系统的两阶段节能调度算法ATES(Adaptive Threshold-based Energy-efficient Scheduling).首先,设计一种基于自适应阈值的任务复制策略,该策略能够自动计算最佳阈值,利用该阈值获取近似最优的任务分组.然后,将各分组任务调度到支持DVS的处理器上,并充分利用任务之间的空闲时间降低处理器电压.该算法将任务复制策略与电压调节技术有机结合,在调度过程中能够自动调整阈值,有效提高调度算法的能效.为了验证ATES算法的合理性,通过典型应用进行仿真实验,并与常见任务调度算法进行比较,结果表明ATES算法能够更好地实现性能和能耗之间的平衡.
- 2022-04-25 05:27:51下载
- 积分:1
-
福克斯矩阵计算
狐狸的算法,一个简单的实现每个进程的一个元素。在一个充分实现 A、 B、 C、 T将矩阵。
- 2023-09-08 02:00:03下载
- 积分:1
-
数据结构实验
多种算法实现链表的排序,可以更具需要进行适当该表计算哦,是基础了,欢迎同在学习的伙伴一起努力哦~
数据结构实验
- 2022-11-12 13:15:04下载
- 积分:1
-
并行程序设计_三角函数并行化程序设计
1) 熟练掌握并行程序设计的基本方法;
2) 通过实验,了解并行程序设计的过程以及优越性;
3) 学会并行程序的算法分析;
4) 结合高等工程数学、分布式系统、云计算等相关课程知识解决简单的实际问题。
- 2022-03-01 04:29:27下载
- 积分:1
-
酒店管理系统
免费下载项目在线预订系统在 Php 中与我的 Sql.hear 在线酒店预订系统项目与完整的源代码。酒店管理系统项目用于维护每个客户的信息。每个客户有自己的个人资料。如果没有完美的软件然后它将非常艰巨的任务,要保持所有的记录完全没有出现任何错误。即使找到特定的记录,要需要很多时间。
- 2022-03-15 10:09:14下载
- 积分:1