项目

一般

简介

0001-风险日志 » 历史记录 » 版本 2

Huarui Lin, 2026-04-13 12:54

1 1 Huarui Lin
# 风险日志
2
3
---
4
| 编号 | 风险项 | 触发条件 | 影响 | 应对策略(规约级防御) |
5
|------|--------|---------|------|----------------------|
6
| R-1 | 内存溢出 (OOM) | 违反 FW-3 多年份并发 Arrow 转换 | 🔴 致命 | ① DuckDB 硬限 40GB;② CI 设 cgroup 限 50GB 压测;③ 代码 Review 重点检查按年循环 |
7
| R-2 | Optuna 在 CPU 下搜索不充分 | 36 核 CPU、大训练集 | 🟡 可控 | 1小时硬限截断取最优;`early_stopping_rounds=50`;单折搜索策略最大化试验次数 |
8
| R-3 | T-1 未来数据泄露 | 标准化未执行 `.shift(1)` | 🔴 致命 | ① 单测强制覆盖首日输出 NULL;② CI 加专项断言;③ 代码 Review 最高优检查项 |
9
| R-4 | 8 周紧凑致规约妥协 | 并行开发时省略 Type Hints / 单测 | 🟡 可控 | CI 强阻断红线,PR 触发 Error 则绝对禁止合并 |
10
| R-5 | fund_basic_info 多余字段污染 | data_loader 未丢弃 4 列非规约字段 | 🟢 可防 | ① `data_loader.py` 显式指定列投影 `SELECT fund_id, fund_name, fund_type, create_date`;② M2 审计日志输出实际列名 |
11
| R-6 | 白名单覆盖率异常低 | 实际数据中白名单类型基金占比过低 | 🟡 待观测 | Step 2 审计日志必须输出精确的白名单保留率;若 < 15%,PM 组织专项评审 |
12 2 Huarui Lin
| R-7 | 当前依赖清华公共 PyPI 源,存在供应链不可控及合规隐患。|企业级合规标准化|🟡 可控|短期可接受;长期企业级治理路线图必须纳入“自建内部 PyPI 服务(如 devpi)”评估。|