Research KPI / Baselines
실험이 ‘의미 있다’ 고 판단하는 기준. 모든 새 실험은 이 baseline 과 비교.
Primary baseline: v11 best
- Strategy:
ens_v51 × fixed_70_30_180 × V3-p3 - Metrics (OOS 2024-01-01~):
- Sharpe: 2.34
- Total return: +336%
- MDD: -11.8%
- Trades: 31
- Win rate: TBD (backport 시 채움)
Secondary baseline: v11 mean (p3)
- Mean OOS Sharpe: 1.81 (all strategies × p3)
- Mean MDD: -14.4%
성공 기준 (새 실험당)
🟢 Win 조건 (둘 중 하나)
- v11 best 대비 OOS Sharpe +0.15 이상 개선
- OOS Sharpe 유지 + MDD 20% 이상 축소
🟡 Acceptable
- v11 best 와 통계적 동등 (OOS Sharpe ±0.1)
- MDD 개선 or 다른 dimension 에서 edge (robustness, trade 수, drawdown duration)
🔴 Kill
- OOS Sharpe -0.3 이상 하락
- MDD -25% 이하로 악화
- Trade 수 10 미만 (통계적 의미 없음)
Cross-sectional 안정성 지표
- OOS Sharpe / in-sample Sharpe 비율 — 0.7 이상이면 robust
- Monthly hit rate — 60%+ 면 OK
- Drawdown duration (days) — 180 이하면 견딜 만
현재 수준 vs 목표
| Metric | 현재 (v11 best) | 2026 목표 | 2027 목표 |
|---|---|---|---|
| OOS Sharpe | 2.34 | 2.50 | 3.00 |
| MDD | -11.8% | -10% | -8% |
| Trades | 31 | 40+ | 50+ |
| Annual return (OOS) | ~70% | 80% | 100% |
| Live paper-trade performance | N/A | 유의미 확보 | IS/OOS 갭 < 30% |
숫자는 가이드라인. 시장 환경 따라 재조정.