python-根据时间戳将数据分为训练集和测试集

 时间:2024-11-04 19:13:57

1、首先需要指定编码方式为【utf8】格式,再导入处理数据的包-pandas

python-根据时间戳将数据分为训练集和测试集

2、然后利用pandas读取原始数据,【sep】参数表明原始数据每列数据之间的分隔方式,【names】参数表明给原始数据每一列取一个名字,若是你的数据列名本来就存在,这项可以舍去。

python-根据时间戳将数据分为训练集和测试集

3、利用sort_values函数对原数据进行排序,【by】参数表明根据哪一列进行排序,这里选择的是时间戳列。【ascending=False】表明按倒序排序。

python-根据时间戳将数据分为训练集和测试集

4、分别指定所需训练集和测试集的大小,这里取的是90%和10%。

python-根据时间戳将数据分为训练集和测试集

5、利用Dataframe的iloc函数,可取出日期最新的10%作为测试集

python-根据时间戳将数据分为训练集和测试集

6、将【ascending】参数设为True,将原始数据进行正序排列,表明时间从前往后排,取前90%作为训练集。

python-根据时间戳将数据分为训练集和测试集
  • MATLAB整数型、浮点数型和字符型数据之间的操作
  • WPS制作彩虹数据表
  • minitab的初级教程
  • 在线SPSS spssau-配对样本Wilcoxon检验操作步骤
  • windows命令提示符的tab补全
  • 热门搜索
    杭州西溪湿地旅游攻略 广州好玩的旅游景点 杭州旅游线路 旅游线路查询 丽江自由行旅游攻略 佛冈旅游 桃花岛旅游 祁连山旅游 暑假旅游好去处 丽江 旅游