2023-02-10 04:08来源:m.sf1369.com作者:宇宇
原始数据相关系数矩阵不正定是奇异的,说明你变量中存在共线性,也就是数据中的变量存在信息重叠。怎么处理的话你网上再找找吧
r = log(p);
R本来就是向量计算的语言,r和p都是数组。
时间序列(time series)是一系列有序的数据。通常是等时间间隔的采样数据。如果不是等间隔,则一般会标注每个数据点的时间刻度。
time series data mining 主要包括decompose(分析数据的各个成分,例如趋势,周期性),prediction(预测未来的值),classification(对有序数据序列的feature提取与分类),clustering(相似数列聚类)等。
这篇文章主要讨论prediction(forecast,预测)问题。 即已知历史的数据,如何准确预测未来的数据。
cancor()
cancor(x, y, xcenter = TRUE, ycenter = TRUE)
x,y为两组变量的数据矩阵;xcenter和ycenter是逻辑值,表示是否中心化,实际中一般采用默认值TRUE
注意分析前要对数据进行标准化
scale():对数据进行标准化和中心化
scale(x, center = TRUE, scale = TRUE)
x是矩阵,提供数据;若center为数字或与x等长的向量,中心化时用x减去center对应的数值; center=TRUE则减去x的平均值,默认为TRUE;scale为数字或与x等长的向量,则标准化用x除以scale,默认为TRUE,即除以标准差。