行为
Story #193
打开S5-01-时序切分基座与特征标签对齐
开始日期:
2026-05-18
计划完成日期:
2026-05-19 (截止日期到 32 天)
% 完成:
0%
预期时间:
16:00 小时
描述
读取按年 Parquet,执行 LEFT JOIN 产出未标准化的 train_dataset.parquet,实现 TimeSeriesSplit 索引划分。
① 产出 train_dataset.parquet,Schema 为长表且特征均为原始值;
② 实现严格的 TimeSeriesSplit(n_splits=5) 索引生成器,按时间排序切分,严禁打乱;
③ 单测验证各折的 Train/Val 时间范围无重叠且无未来穿越。
规约 5.1 (训练数据流);规约 5.2 (严禁随机 K-Fold)
行为