-
QB模型 神经网络
说明: 从数据库获取车辆在一段时间内的所有行驶记录的相关数据,确定所需数据为GPS经纬度坐标和驾驶时长等,QB模型采用MDF的思想,其基本思想为:通过平均直接翻转距离函数定义两条轨迹之间的距离,两条轨迹需要具有相同的经纬度点数,具有相同点数的轨迹最大的优点是对轨迹距离成对计算,且相同轨迹之间具有更高的分辨率,对于轨迹聚类的结果有一定的优化。(Retrieved from the database cars all over a period of time, record the related data, determine the required data for the GPS latitude and longitude coordinates, and the driving time, QB model by adopting the idea of MDF, its basic idea is: flip directly by the average distance function definition of the distance between two trajectories, two tracks will have the same latitude and longitude points, and has the biggest advantages of the same points of trajectory track distance calculation in pairs, and has higher resolution, between the same trajectory for trajectory clustering results have certain optimization.)
- 2020-06-23 08:00:01下载
- 积分:1
-
MATLAB_SMOTE
SMOTE插值算法,补全数据的不平衡性。(SMOTE interpolation algorithm to complete the imbalance of data.)
- 2018-08-20 10:05:48下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
数据挖掘算法
包含很多知名算法实现,支持向量机,决策树,粗糙集,贝叶斯分类器等,适合学术研究,短评论意见挖掘,文本分类等。
- 2022-06-03 05:40:28下载
- 积分:1
-
k-means java实现 Iris四大数据集
通过优化的k-means算法 采用了密度和优化评测函数实现了对Iris等数据集的聚类。
- 2022-03-18 06:28:52下载
- 积分:1
-
ELM
一种神经网络算法:极限学习机(ELM),包括分类和回归,仿真验证无误,适合初学者练习(A data mining algorithm: limit learning machine (ELM), including classification and regression, simulation verification is unmistakable, suitable for beginners to practice)
- 2018-03-14 12:45:55下载
- 积分:1
-
煤炭价格多元时序预测
说明: 内附源数据、代码及word。代码包括:平稳性检验、协整检验、滞后阶数的确定、VAR 模型的拟合、脉冲响应分析、VAR 模型的预测(Stationarity test, co integration test, determination of lag order, VAR model fitting, impulse response analysis, VAR model prediction)
- 2021-03-30 19:09:09下载
- 积分:1
-
数据挖掘 Binning算法
说明: 数据挖掘中的binning算法,用于数据预处理(Binning algorithm in data mining for data preprocessing)
- 2019-01-07 09:04:15下载
- 积分:1
-
knn.py
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,kNN方法较其他方法更为适合。(Basic source application)
- 2018-10-30 16:50:13下载
- 积分:1
-
HMM-homework
说明: 隐马尔科夫实现,包含forward-hmm, Viterbi-hmm, Baum-Welch-hmm(Hidden Markov implementation, including forward-hmm, Viterbi-hmm, Baum-Welch-hmm)
- 2019-04-26 17:02:43下载
- 积分:1