manthanein 发表于 2019-5-18 19:03:09

数据分组的问题

坐标平面上有若干个点,每个点代表一个数据,(x,y)就是输入值x和对应的输出值y。把这些点连起来就可以得到一张折线统计图。
将所有的点按x的取值范围不同分为若干段,使得每一段内的数据变化趋势和前后两段相比都存在显著性差异。
如何划分?

manthanein 发表于 2019-5-18 19:12:41

比如说x=1……120对应的120个y的值:
0
3
18
8
0
14
0
16
10
0
26
15
25
95
67
21
126
78
22
2
2
2
2
10
1
32
1
0
5
3
68
30
84
34
66
133
52
76
90
77
10
37
15
99
7
7
20
15
174
251
18
18
8
11
25
26
34
87
170
93
119
198
499
84
69
175
139
57
193
78
37
46
101
29
88
32
82
108
155
105
45
85
57
138
83
46
70
102
117
192
174
106
77
169
113
250
51
37
59
38
50
40
41
31
23
104
155
156
92
73
17
3
23
31
100
17
33
214
25
1

如何分能满足要求?

.·.·. 发表于 2019-5-19 12:51:20

change-point问题
这几年挺火的
具体怎么做……反正每一个人都有自己的方法
这个你还是看论文吧

kastin 发表于 2019-5-20 10:45:45

这个问题跟色谱峰分析中的峰检测问题有点类似,不过峰检测是必须匹配多个具有峰特征的数据序列,然后按照某些规则来划分,并将相应的特征数据返回,因此结果也存在一定的可变动性(主要是判别依据的变化),楼主的问题估计应该也是这样(正如3楼说的那样,不同的判别准则和阈值,可能结果不同,但都不算错)。
页: [1]
查看完整版本: 数据分组的问题