摘 要: | 时间序列数据的处理及挖掘一直是业界关注的热点,而海表温度也一直是人们观测、研究和预报的重要对象。本文主要考虑对一年的跨度进行切割,使得落在每个切割区间的海表温度数据满足最优的正态分布,以便对遥感数据的异常性作出检验。结合2003-2011年南海和东海海表温度数据集,本文引入Floyd算法,将寻求数据集最优分割问题转化为图论中网络中最短路求解问题,将不超过30天的点之间的距离设定为无穷大,以避免分割点过于密集的情况,并将频率与概率的距离定义的误差转化为线路权重,实现了动态全局最优分割。且正态分布下的3σ异常值检验法,实现了对异常值的识别。
|