项目

一般

简介

行为

Story #195

打开

S4-02-样本平衡与落盘机制

Huarui Lin5 天 之前添加.

状态:
New
优先级:
Normal
指派给:
目标版本:
开始日期:
2026-05-13
计划完成日期:
2026-05-13 (截止日期到 26 天)
% 完成:

0%

预期时间:
8:00 小时

描述

实现正负样本的等距抽样限制与长表 Parquet 写入。


① 正样本(label>0)单基金上限 50 条;
② 负样本(label=0)单基金上限 15 条(50 * 0.3);
③ 强制使用 np.linspace(0, len(samples)-1, N, dtype=int) 进行等距抽样;
④ 产出 labels.parquet,Schema 为长表:fund_id, net_value_date, segment_id, label (Int32);
⑤ 产出 data/metadata/labels_hash.json。


规约 3.3 (等距抽样/上限50/15);规约 7.4 (严禁Pivot宽表)

没有任何数据可供显示

行为

导出 Atom PDF