行为
Story #195
打开S4-02-样本平衡与落盘机制
开始日期:
2026-05-13
计划完成日期:
2026-05-13 (截止日期到 26 天)
% 完成:
0%
预期时间:
8:00 小时
描述
实现正负样本的等距抽样限制与长表 Parquet 写入。
① 正样本(label>0)单基金上限 50 条;
② 负样本(label=0)单基金上限 15 条(50 * 0.3);
③ 强制使用 np.linspace(0, len(samples)-1, N, dtype=int) 进行等距抽样;
④ 产出 labels.parquet,Schema 为长表:fund_id, net_value_date, segment_id, label (Int32);
⑤ 产出 data/metadata/labels_hash.json。
规约 3.3 (等距抽样/上限50/15);规约 7.4 (严禁Pivot宽表)
没有任何数据可供显示
行为