优点	排名法	Z-Score
是否考虑幅度	❌ 只看顺序	✅ 看相对强度
是否适合加权	❌ 不适合	✅ 完美
是否适合建模	❌ 不适合	✅ 非常适合
是否对极端值敏感	❌ 不敏感	✅ 很敏感
是否适合行业中性处理	❌ 不方便	✅ 很好处理

🤔 排名法有优势吗？

当然有：

简单、稳健；
对异常值鲁棒性强；
适合在数据质量低、因子少的场景中快速筛选。

所以：如果你追求“快速、保守、易实现”，排名法可以用；但要做更专业、细腻的量化模型，Z-Score 是更优解。

是否需要我用你的数据帮你演示 Z-Score 和排名法的效果对比？你可以上传一组股票的 PE 和 PB 数据表（CSV 或 Excel）。

策略优化

太好了！你已经迈出了专业量化选股的重要一步：使用 Z-Score 策略来筛选低估股票。接下来我们可以对策略进一步优化，从数据处理、因子增强、权重设计和选股逻辑几个方面入手。

✅ 一、基本框架回顾：Z-Score 选股

目前你的基本策略是：

收集股票的 PE 和 PB；
对它们分别计算 Z-Score；
组合为综合得分，比如：

$$
\text{score} = -Z_{\text{PE}} - Z_{\text{PB}}
$$

按得分从高到低排序，选前 N 名。

这个策略已经不错，下面我们来逐步优化它。

🚀 二、策略优化建议

✅ 1. 加入更多估值相关因子（增强维度）

你当前只有 PE 和 PB，建议增加一些与价值相关但不重复的因子，例如：

因子	解释	建议方向
ROE	净资产收益率，盈利能力	+Z_ROE
股息率	分红收益率	+Z_股息率
净利润增长率	盈利增长预期，过滤“价值陷阱”	+Z_增长
营业现金流比率	利润质量指标	+Z_OCF比率

然后构建更全面的 Z-Score 组合打分，例如：

$$
\text{score} = -Z_{\text{PE}} - Z_{\text{PB}} + 0.8 \cdot Z_{\text{ROE}} + 0.5 \cdot Z_{\text{股息率}}
$$

❗权重可以手动设定，也可以通过历史回测 IC（信息系数）来确定。

✅ 2. 做行业中性处理（防止选股扎堆）

不同行业的 PE、PB 不可比，比如科技股 PE 高很正常，银行股低才合理；
建议在行业内部计算 Z-Score，然后横向比较；

做法：

对每个行业的 PE、PB 单独计算 Z；
然后在行业中选前 20%，再统一评估。

✅ 3. 设置过滤条件（提高策略质量）

设置一些基本的“风控 + 剔除垃圾股”的条件：

# 示例过滤逻辑
if stock.市值 < 20亿:
    continue
if stock.近三年净利润为负:
    continue
if stock.PE < 0 or stock.PB < 0:
    continue

可以进一步过滤掉壳股、问题公司。

✅ 4. 增加评分稳定性（分位数平滑）

Z-Score 对极值敏感，为防止异常波动，你可以使用 winsorize（尾部缩尾）或改用 分位数 Z-Score（Q-Score）：

0~20% → Z ≈ -1
20%~80% → Z ≈ 0
80%~100% → Z ≈ 1

这样更稳健。

✅ 5. 设置最终选股逻辑

比如：

综合 Z-Score 排名前 30 名；
加入行业分布控制：每个行业最多选 3 只；
每月调仓一次，避免频繁换股。

🧑‍💻 示例代码框架（Python）

import pandas as pd
from scipy.stats import zscore

# 假设 df 包含：PE, PB, ROE, DividendYield 等列
df = pd.read_csv("stock_data.csv")

# 去极值、空值
df = df[df["PE"] > 0]
df = df.dropna(subset=["PE", "PB", "ROE", "DividendYield"])

# 按行业归组计算 Z-Score（示例为不分行业）
for col in ["PE", "PB", "ROE", "DividendYield"]:
    df[f"Z_{col}"] = zscore(df[col])

# 构建打分：估值越低越好 → Z 越负越好
df["score"] = -df["Z_PE"] - df["Z_PB"] + 0.8 * df["Z_ROE"] + 0.5 * df["Z_DividendYield"]

# 排序选股
selected = df.sort_values(by="score", ascending=False).head(30)

✅ 总结：你的 Z-Score 策略可以这样升级

优化点	作用
增加盈利/质量因子	降低“价值陷阱”
行业中性处理	避免估值扎堆某些行业
加权组合 Z-Score	反映每个因子重要性
设置基本过滤条件	提升选股质量
使用分位或缩尾 Z	降低极端值干扰