项目

一般

简介

行为

Story #193

打开

S5-01-时序切分基座与特征标签对齐

Huarui Lin5 天 之前添加. 更新于 5 天 之前.

状态:
New
优先级:
Normal
指派给:
目标版本:
开始日期:
2026-05-18
计划完成日期:
2026-05-19 (截止日期到 32 天)
% 完成:

0%

预期时间:
16:00 小时

描述

读取按年 Parquet,执行 LEFT JOIN 产出未标准化的 train_dataset.parquet,实现 TimeSeriesSplit 索引划分。


① 产出 train_dataset.parquet,Schema 为长表且特征均为原始值;
② 实现严格的 TimeSeriesSplit(n_splits=5) 索引生成器,按时间排序切分,严禁打乱;
③ 单测验证各折的 Train/Val 时间范围无重叠且无未来穿越。


规约 5.1 (训练数据流);规约 5.2 (严禁随机 K-Fold)

行为

导出 Atom PDF