FactorZen Daily Research Report

volume_return_corr_20d

日频因子研究报告 | 日期范围:2016-06-06 ~ 2026-06-06 | 真实评估区间:2016-06-22 ~ 2026-06-05
频率daily
股票池csi500
主回测策略TopN 多头 50
生成时间2026-06-07 16:15

volume_return_corr_20d

频率:daily | 股票池:csi500 | 生成时间:2026-06-07 16:15 | 日期范围:2016-06-06 ~ 2026-06-06 | 真实评估区间:2016-06-22 ~ 2026-06-05 | 主回测策略:TopN 多头 50(代码:topn_50)

回测和超额收益从首个可执行信号日开始统计;此前交易日仅用于因子预热,不纳入回测曲线和绩效指标。

最终研究决策
继续研究
评分 60.3/100
3 星 | 证据强度:中等
IC 均值-0.0157
信息比率-0.23
多空 Sharpe0.08
平均换手48.4%
当前结论建议动作:保留研究价值,优先补齐关键缺口后再决定是否进入候选池。
主要证据
  • 优势维度:稳定性、鲁棒性。
  • 有效样本 2416 期。
  • 已覆盖 4 个策略,其中 2 个多空策略。
关键缺口
  • 数据质量状态为需关注。
  • 缺少滚动样本外验证。
下一步
  • 延长样本区间或降低滚动验证窗口要求,补齐滚动样本外验证。
  • 先处理数据质量缺口,再提高结论置信度。

研究仪表盘

主策略
TopN 多头 50
代码:topn_50 | 方向:多头 TopN
策略覆盖
4 个
2 个多空策略
有效区间
2016-06-22 ~ 2026-06-05
样本期数
2416
数据质量
需关注
IC 标准差
0.0684
IC 胜率
41.3%
t 统计量
-11.51***
样本期数
2416

综合评估

评级: ★★★☆☆ (3/5)

评分卡总分:60.3/100 | 评级标签:研究观察(research)

维度得分读法 / 下一步
Alpha 强度17.3/30Alpha 证据中等;重点看 IC、IR、显著性和多空收益是否同向支持。
稳定性19.3/25稳定性较强;继续核对样本外、IC 衰减和跨持有期方向。
可交易性6.6/20交易落地偏弱;重点看执行成本和换手、成交约束、回撤压力。
鲁棒性12.1/15鲁棒性较强;重点看中性化、Pearson/Rank 一致性和行业/市值分层。
结构质量5.0/10结构质量中等;重点看分组单调性和信号持续性,决定组合构建方式。

主要优势:稳定性、鲁棒性

主要风险:可交易性得分偏低

IC 均值 -0.0157,因子具备一定的预测能力。

主策略组合年化收益 0.3%,收益表现偏弱,需结合回撤、换手和多空策略验证。

LLM 综合结论(weak/low):全样本IC均值-0.016,t统计量-11.5(p≈0),统计显著但经济意义弱。多周期IC均负且稳定,但IR仅-0.23。样本外IC略降(-0.014),回测多空年化收益仅0.3%,夏普0.08,最大回撤-10%。换手率48%,较高。

LLM 使用建议:因子预测能力弱,不建议单独使用。可考虑与其他量价因子结合,或作为风险因子进行中性化处理。需注意高换手带来的成本。

大模型研究解读

结论标签
偏弱(weak)
置信度
低(low)

因子直觉:20日收益与对数成交量的滚动相关系数,衡量量价背离程度。负IC表明高成交量伴随低收益,可能反映短期过度交易或流动性压力。

证据评价:全样本IC均值-0.016,t统计量-11.5(p≈0),统计显著但经济意义弱。多周期IC均负且稳定,但IR仅-0.23。样本外IC略降(-0.014),回测多空年化收益仅0.3%,夏普0.08,最大回撤-10%。换手率48%,较高。

风险提示
IC绝对值小,经济显著性不足
回测夏普极低,策略收益不稳定
换手率近50%,交易成本侵蚀收益
样本外IC衰减,泛化能力存疑

使用建议:因子预测能力弱,不建议单独使用。可考虑与其他量价因子结合,或作为风险因子进行中性化处理。需注意高换手带来的成本。

下一步研究动作
检查极端收益值对IC的影响
测试不同换手率下的净收益
探索因子在行业或市值分组内的表现
尝试非线性变换或合成因子

该解读由大模型基于本报告指标生成,不替代统计检验。

跨策略对比

本报告共运行 4 个策略; 其中 2 个为多空策略。 分页按钮会标明策略方向,策略页和对比表会标明收益口径。
跨策略选择摘要: 年化收益最高:TopN 多头 50(0.30%), Sharpe 最高:TopN 多头 50(0.08), 回撤控制最好:均值-方差优化多头(最大回撤 -3.38%)。 其中 0 个策略平均换手较高,3 个策略交易成本较高;优先比较净收益和执行约束后的表现。
策略策略方向收益口径关键参数年化收益年化波动Sharpe最大回撤平均换手交易成本成本模型
TopN 多头 50(主策略)代码:topn_50 多头 TopN 组合收益 TopN 数量=50 0.30% 3.55% 0.08 -9.97% 1.7% 7.58% 线性成本
五分位多空代码:quantile_ls_5 分位数组合多空 多空组合 分位组数=5 -2.81% 2.90% -0.97 -24.26% 5.4% 23.68% 线性成本
因子加权多空代码:factor_weighted_ls 因子加权多空 多空组合 仅多头=否;总敞口=2.0 -4.71% 3.87% -1.22 -37.44% 8.2% 35.81% 线性成本
均值-方差优化多头代码:optimizer_mv_long_only 优化组合 组合收益 优化器=均值-方差;风险厌恶=1.0;协方差回看天数=60;协方差估计=Ledoit-Wolf 收缩;TopN 数量=100;仅多头=是;总敞口=1.0;净敞口=1.0;单票权重上限=0.08 -0.27% 0.68% -0.39 -3.38% 0.4% 1.87% 线性成本

收益表现

TopN 多头 50

策略代码:topn_50 | 方向:多头 TopN | 收益口径:组合收益

主策略 多头 TopN
TopN 多头 50 净值曲线
收益质量摘要:收益为正,但风险调整后质量仍需复核。 Sharpe 偏低;回撤可控;换手较低;成本压力较高;成交约束需重点复核。
收益口径年化收益年化波动夏普比率最大回撤
组合收益 0.30% 3.55% 0.084 -9.97%

交易执行摘要

交易记录数
256116
受约束交易
236375
约束占比
92.3%
年化换手
439.8%
约束原因次数
成交容量限制232758
缺少价格数据3274
涨停限制239
跌停限制104

月度收益分析

按自然月聚合组合收益,便于观察收益是否集中在少数月份。

月度收益摘要:正收益月份 58/121; 最佳月份 2025-08(2.71%); 最弱月份 2026-03(-4.07%)。 月度收益分布相对分散,未显示明显单月依赖。
月度收益热力图

基准对比 - CSI500

基准相对结论:跑输基准。主动风险未转化为正超额,基准相对收益需要谨慎。 主动偏离较高,适合主动风险预算充足的组合。 超额回撤较深,需检查失效区间和止损口径。
年化超额收益
-5.29%
信息比率 (IR)
-0.29
跟踪误差
18.55%
超额最大回撤
-63.51%
基准对比图

预测能力

预测能力总览:Rank IC 方向为负,IC 稳定性中等,统计显著性较强。 IC 均值 -0.0157,IR -0.23,IC 胜率 41.3%。 Rank/Pearson 至少一项接近零,需检查信号是否主要由排序或极端值驱动。 下一步应优先检查样本外、分组单调性和交易成本后的保留程度。
IC 时序图

IC 分布

检查 IC 是否主要由少数极端日期贡献。

IC 分布图

Pearson IC vs Rank IC 对比

Rank IC(Spearman)对极端值更鲁棒;Pearson IC 对量纲敏感。两者差异大时需关注因子分布的尾部风险。

指标Rank IC(Spearman)Pearson IC
IC 均值-0.0157-0.0007
IC 标准差0.06840.0659
信息比率 (IR)-0.23-0.01
IC 胜率41.3%51.2%
t 统计量-11.51-0.51

结构检验

中性化 IC

行业/市值中性化后重新计算 Rank IC,用于判断信号是否主要来自风格或行业暴露。

中性化结论:中性化后保留率较高,方向保持一致。 中性化后保留率 99.9%。 行业/市值暴露不能单独解释该信号,仍需结合样本外和交易成本复核。
指标原始 Rank IC中性化 Rank IC
IC 均值-0.0157-0.0157
IC 标准差0.06840.0685
信息比率 (IR)-0.23-0.23
IC 胜率41.3%41.5%
t 统计量-11.51-11.49

多持有期一致性

跨持有期 IC —— 稳健因子在各持有期应保持方向一致。

持有期结论:20d 的反向信号强度最集中,IC -0.0177,IR -0.28,正向胜率 40.7%。 各持有期方向一致,但 IC 均为负,应按反向信号验证。 建议以 20d 作为优先验证的反向调仓周期,同时用长端结果监控衰减。
持有期IC 均值IC 标准差信息比率IC 胜率t 统计量p 值
1d -0.0157 0.0684 -0.23 41.3% -11.51*** 0.0000
5d -0.0167 0.0652 -0.26 41.0% -6.58*** 0.0000
10d -0.0172 0.0652 -0.26 40.8% -5.63*** 0.0000
20d -0.0177 0.0641 -0.28 40.7% -5.41*** 0.0000

交易可行性

本节观察调仓换手、成交约束和交易成本口径,用于判断因子收益是否可能被执行摩擦吞噬。

交易可行性摘要

换手、成本和成交约束按策略回测结果汇总;受约束交易越多,说明信号越容易受容量、涨跌停或停牌等执行条件影响。

执行结论:成交约束占比最高:五分位多空(94.3%)。当前执行风险较高,需先复核约束来源和可成交容量。优先复核成交容量限制,再检查调仓阈值、单票权重上限和成交量约束。
策略策略方向平均换手年化换手交易成本受约束交易约束占比主要约束
TopN 多头 50(主策略)代码:topn_50 多头 TopN 1.7% 439.8% 7.58% 236375 / 256116 92.3% 成交容量限制 232758 次;缺少价格数据 3274 次;涨停限制 239 次;跌停限制 104 次
五分位多空代码:quantile_ls_5 分位数组合多空 5.4% 1371.9% 23.68% 687855 / 729377 94.3% 成交容量限制 680765 次;缺少价格数据 6264 次;涨停限制 595 次;跌停限制 231 次
因子加权多空代码:factor_weighted_ls 因子加权多空 8.2% 2074.7% 35.81% 933218 / 997602 93.5% 成交容量限制 923429 次;缺少价格数据 8706 次;涨停限制 771 次;跌停限制 312 次
均值-方差优化多头代码:optimizer_mv_long_only 优化组合 0.4% 108.3% 1.87% 59428 / 167705 35.4% 成交容量限制 57257 次;缺少价格数据 1905 次;涨停限制 190 次;跌停限制 76 次
换手率图

稳健性验证

样本外稳健性

前 70% 历史观察期与后 30% 样本外验证期的 IC 分割。固定因子不会在观察期重新拟合参数;这里用于检查历史结论能否延续到后续区间。

样本外摘要: 历史观察期与样本外验证期 IC 方向一致,说明样本外方向有延续。 样本外验证期强度约为历史观察期的 83.4%。 样本外强度保留较好。
区间IC 均值
历史观察期(前 70%)-0.0165
样本外验证期(后 30%)-0.0138

事件研究

选取因子值 Top 分位的股票为事件,观察事件前后窗口的平均累计收益。阴影区域为 95% 置信区间。

事件研究摘要: 因子 Top 分位事件数 52626 个,事件后 20 期平均累计收益为 1.50%。 事件后累计收益接近 0,当前事件窗口未显示明确方向。 95% 置信区间半宽约 0.12%;半宽越大,事件结论越依赖样本数量和极端事件。
事件研究图

事件数量: 52626

风险归因

市值分层 IC

因子在不同市值段的预测能力 —— 大小盘 IC 差异大说明因子有规模敞口。

市值敞口摘要: IC 数值最高的市值段是大盘(IC=-0.0139),IC 数值最低的是小盘(IC=-0.0174)。 按反向因子理解,绝对 IC 最大的市值段是小盘(|IC|=0.0174)。 各市值段 IC 接近,当前样本未显示强烈规模敞口。
市值分组IC 均值
小盘 -0.0174
中盘 -0.0168
大盘 -0.0139

风格/行业归因

归因结论:Brinson 口径下整体贡献为正。 主要正贡献来自交互贡献。 行业层面最大正贡献来自 软件服务,最大拖累来自 小金属。
归因分析图

年化超额: 11.49%  |  配置: 4.70%  |  选股: 0.58%  |  交互: 6.21%

行业分层 IC

各行业内部因子预测能力 —— IC 值接近的行业说明因子并非行业敞口伪装。

行业一致性摘要: 行业间 IC 正负分化,因子可能依赖行业环境或行业暴露。 IC 数值最高的行业是 银行(IC=0.0186),IC 数值最低的是 饲料(IC=-0.0490)。 绝对 IC 最大的行业是 饲料(IC=-0.0490),代表行业分层中信号强度最集中的位置。 行业差异较明显,建议结合行业中性化 IC 判断是否为行业暴露贡献。

默认只展示前 6 行,展开后显示全部行业。

附录

报告由 FactorZen 自动生成。完整复现实验配置、质量检查和产物路径以对应 run 目录中的 manifest、quality 和 meta 文件为准。

阅读口径:预测能力优先看 IC 均值、IR、显著性和 IC 分布;收益表现看多策略净值、回撤和收益口径; 交易可行性看换手、成交约束和成本吞噬;稳健性看样本外验证期、事件研究和结构检验。 研究边界:本报告用于因子研究和策略筛选,不等同实盘组合建议;未生成模块会在附录列出状态和原因。

复现摘要

条目
因子volume_return_corr_20d
频率daily
股票池csi500
日期范围2016-06-06 ~ 2026-06-06
真实评估区间2016-06-22 ~ 2026-06-05
主回测策略TopN 多头 50代码:topn_50

数据质量摘要

状态:需关注。数据质量检查已生成,覆盖率、缺失值和错误会影响报告结论可信度。 警告:extreme fwd_ret_1d rows:1。
质量影响判断: 覆盖率最低的检查项是前向收益(100.0%)。 数据覆盖充分,当前质量结果对报告结论的约束较小。 缺失值合计 500 个,无限值合计 0 个。
检查项行数覆盖率有效值缺失值无限值读法
daily 1044327 - - - - 未提供覆盖率。
原始因子值 1039327 100.0% 1039327 0 0 覆盖充分。
清洗后因子值 1039327 100.0% 1039327 0 0 覆盖充分。
前向收益 1044327 100.0% 1043827 500 0 覆盖充分。
股票池 - 100.0% - - - 覆盖充分。

策略配置清单

中文策略名用于阅读和横向比较;策略代码用于复现配置、定位日志和回测产物。

策略策略代码实现类型策略方向收益口径关键参数成本模型权重上限再平衡阈值
TopN 多头 50(主策略) topn_50 TopN 多头 多头 TopN 组合收益 TopN 数量=50 线性成本 10.00% 每期调仓
五分位多空 quantile_ls_5 分位数组合多空 分位数组合多空 多空组合 分位组数=5 线性成本 10.00% 每期调仓
因子加权多空 factor_weighted_ls 因子加权 因子加权多空 多空组合 仅多头=否;总敞口=2.0 线性成本 5.00% 每期调仓
均值-方差优化多头 optimizer_mv_long_only 优化器组合 优化组合 组合收益 优化器=均值-方差;风险厌恶=1.0;协方差回看天数=60;协方差估计=Ledoit-Wolf 收缩;TopN 数量=100;仅多头=是;总敞口=1.0;净敞口=1.0;单票权重上限=0.08 线性成本 8.00% 每期调仓

指标口径说明

Rank IC每日截面因子排序与未来收益排序的 Spearman 相关系数,衡量选股方向是否稳定。
信息比率 (IR)IC 均值除以 IC 标准差;越高说明预测能力越稳定。
IC 胜率IC 大于 0 的期数占比,用于观察正向预测是否经常出现。
排名自相关相邻调仓期因子排序的相关性,用于估计信号持续性和潜在换手压力。
半衰期因子排序相关性衰减到一半所需的期数;越短说明信号需要更快交易响应。
夏普比率组合年化收益除以年化波动,未额外扣除无风险利率。
短样本年化样本期数少于 60 时,年化收益、Sharpe 和基准超额只适合做同区间横向比较,不代表长期可外推表现。
滚动样本外验证将历史数据拆成多组历史观察期和样本外验证期,用于检查策略参数离开原样本后是否仍然有效。
隔离期(embargo)历史观察期与样本外验证期之间预留的空档,用于防止标签重叠、调仓滞后或价格信息造成样本泄漏。
最大回撤回测净值从历史高点到后续低点的最大跌幅,数值越接近 0 越好。
平均换手每次调仓的组合权重变化幅度;换手越高,对交易成本和容量越敏感。
交易成本按报告中成本模型估算的累计成本,已计入策略收益曲线。
市值分层 IC按市值段分别计算 Rank IC,用于识别因子是否主要来自规模风格暴露。
行业分层 IC在各行业内部单独计算 Rank IC,用于判断信号是否只在少数行业有效或受到行业暴露驱动。
多空组合同时持有多头和空头的收益口径,用于评估因子纯选股价差。

模块状态

模块完整性总览: 已生成 4 项,需关注 2 项,未生成 1 项。 未生成模块不一定影响当前结论,但会限制对应维度的证据强度;优先补齐稳健性、归因和基准对比类模块。
模块状态说明读法 / 下一步
数据质量 需关注 数据质量检查已生成,覆盖率、缺失值和错误会影响报告结论可信度。 先处理质量警告,再提高结论置信度。
基准超额 已生成 展示策略相对基准的超额收益、IR、跟踪误差与超额回撤。 可作为当前报告证据。
组合归因(Brinson/Barra) 已生成 已生成 Brinson/Barra 归因图或归因摘要。 可作为当前报告证据。
样本外 IC 分割 已生成 已生成历史观察期与样本外验证期 IC 分割。 可作为当前报告证据。
滚动样本外 已关闭 配置已关闭,未运行滚动样本外验证。 结合说明检查该模块是否影响结论。
事件研究 已生成 事件数量: 52626。 可作为当前报告证据。
市场状态 IC 未启用或未生成 未传入市场状态 IC 结果,无法判断信号是否依赖上涨、下跌或波动环境。 若该维度影响结论,应补齐配置或输入数据后复跑。