zer0factor

简体中文 | English

面向 A 股本地数据的 AI 因子研究工作台。

我在公众号「极客投研笔记」记录这个项目的设计过程、踩坑记录和后续扩展。
如果你对 AI + 量化投研、本地股票数据系统、因子研究工作流感兴趣，欢迎关注。

zer0factor 负责把研报、投资逻辑、因子想法，整理成可以审核、可以运行、可以落盘的标准因子代码：

研报 / 想法 -> FactorSpec -> Python compute() -> Parquet 因子值

它和 zer0share 是配套关系：

zer0share：负责本地 A 股数据采集、同步和查询
zer0factor：负责因子规范、因子生成、因子计算和因子存储

项目还在早期阶段，更适合作为研究工作台使用，不是成熟的生产级因子平台。

核心能力

标准因子接口：FactorSpec + FactorFrame + compute()
zer0share 数据适配：把本地行情转成标准宽表面板
标准输出：trade_date, ts_code, value
因子存储：Parquet 分区文件 + DuckDB 注册表
因子注册表：用 config/factors.toml 管理待评估因子、标签和默认评估参数
因子评估：基于 Alphalens / Pyfolio 生成 IC、分组收益、换手、单调性和组合绩效指标
factor-research Codex skill：从研报提取、审核、生成和归档因子
已包含一轮动量研报示例和生成出的因子代码

目录结构

zer0factor/
├── zer0factor/
│   ├── config.py              # 配置读取
│   ├── storage.py             # Parquet + DuckDB 因子存储
│   ├── registry.py            # 因子注册表
│   ├── eval/                  # 因子评估、summary 和 report
│   └── factor/__init__.py     # 因子接口和 zer0share provider
├── docs/skills/factor-research/
├── workspaces/                # 每轮研究流程的产物
├── notebooks/
├── tests/
└── config/settings.example.toml

安装

git clone <your-repo-url>
cd zer0factor
uv sync

默认要求 zer0share 和本项目在同级目录：

work/
├── zer0factor/
└── zer0share/

对应配置在 pyproject.toml：

[tool.uv.sources]
zer0share = { path = "../zer0share" }

如果你的 zer0share 在别的位置，先改这个路径。

配置

cp config/settings.example.toml config/settings.toml

[zer0share]
data_dir = "../zer0share/data"

[paths]
factor_dir = "data/factors"
db_path    = "db/factor_meta.duckdb"
log_path   = "logs/factor.log"

[factor]
universe   = "all"
start_date = "20160101"
end_date   = ""

快速开始

跑核心测试：

uv run pytest tests/test_config.py tests/test_storage.py tests/test_factor_standard.py tests/test_factor_research_skill_scripts.py

查看因子库状态：

uv run python main.py --config config/settings.toml status

评估一个已落盘因子：

uv run python main.py evaluate-factor log_total_market_cap
uv run python main.py show-summary

检查核心代码和 skill：

uv run ruff check zer0factor/core/__init__.py docs/skills/factor-research tests/test_factor_standard.py tests/test_factor_research_skill_scripts.py

CLI

命令	说明
`uv run python main.py status`	查看当前存储里有哪些已计算因子
`uv run python main.py factor-list`	对比注册表和本地存储里的因子状态
`uv run python main.py factor-info <name>`	查看单个因子的注册信息和存储状态
`uv run python main.py compute-returns`	计算内置收益率因子并写入本地存储
`uv run python main.py compute-market-cap`	计算内置市值因子并写入本地存储
`uv run python main.py standardize-factor <name>`	对已存因子做截面去极值、填充和标准化
`uv run python main.py neutralize-factor <name>`	对已标准化因子做行业 / 市值中性化
`uv run python main.py evaluate-factor <name>`	评估单个已存因子
`uv run python main.py evaluate-factors <name...>`	评估多个已存因子
`uv run python main.py evaluate-batch --file config/evaluation_batch.toml`	按配置文件批量评估因子
`uv run python main.py show-summary`	查看最近一次评估的完整 summary，按指标转置展示
`uv run python main.py evaluate-summary`	生成 ranked summary 和 Markdown report

因子注册表

因子注册表默认路径是 config/factors.toml，用于维护哪些因子参与批量评估：

[[factors]]
name = "z_neu_daily_return"
category = "price"
source_type = "neutralized"
source_factor = "daily_return"
enabled = true
tags = ["momentum", "short-term"]

[factors.evaluate]
default = true
quantiles = 5
periods = [1, 5, 10]
return_type = "open_t1"

常用命令：

uv run python main.py factor-list --enabled
uv run python main.py factor-info z_neu_daily_return

因子评估

单因子评估：

uv run python main.py evaluate-factor log_total_market_cap \
  --start-date 20160101 \
  --periods 1,5,10 \
  --quantiles 10 \
  --return-type open_t1

批量评估：

uv run python main.py evaluate-batch --file config/evaluation_batch.toml

评估结果写入 data/evaluations/<run_id>/：

data/evaluations/<run_id>/
├── summary.csv
├── summary.parquet
└── factors/<factor_name>/
    ├── clean_factor_data.parquet
    ├── daily_ic.csv
    ├── quantile_returns.csv
    └── plots/

执行 evaluate-summary 后，会在同一个 run 目录下额外生成 ranked_summary.csv 和 report.md。

查看最近一次 summary：

uv run python main.py show-summary
uv run python main.py show-summary --period 1D
uv run python main.py show-summary --all

summary 默认保留方向化后的 adjusted_ICIR、adjusted_t-stat、directional_IC>0 % 和 long_short_spread；容易误读的原始方向指标，例如 ICIR、t-stat、raw_quantile_spread 已不再输出。show-summary --all 可查看少量保留的原始诊断列。

Summary 指标口径

指标组	字段示例	口径
基础信息	`factor_name`, `period`, `sample_count`, `factor_direction`	因子名、预测周期、有效样本量和自动识别方向
IC	`IC Mean`, `IC Std`, `adjusted_ICIR`, `adjusted_t-stat`, `directional_IC>0 %`	IC 保留原始均值符号；ICIR、t-stat、胜率按因子方向调整，便于不同方向因子横向比较
分组收益	`mean_return_q1`, `mean_return_qN`, `long_short_spread_bps`	q1/qN 是原始分组均值；多空 spread 按 long/short 方向计算
单调性	`monotonicity`, `monotonicity_q_mean`, `monotonicity_q_ir`, `monotonicity_q_gt_50_rate`	衡量分组收益是否随分组有稳定排序关系
换手	`turnover_daily_long`, `turnover_annual_rebalance_long`	日均单边换手和按调仓周期折算的年化换手
组合绩效	`long_`, `short_`, `long_exc_`, `short_exc_`, `ls_`, `full_`, `idx_exc_*`	使用 Alphalens `create_pyfolio_input` 生成组合收益，再用 Pyfolio 计算年化、回撤、Calmar 和 Sharpe

多日预测周期（如 5D、10D）会先把 Alphalens 生成的周期收益转成日化等价收益，再计算组合指标；Sharpe 会进一步按重叠窗口的自相关做自动调整，字段名保持为 *_sharpe。

标准因子长什么样

import pandas as pd

from zer0factor.core import Factor, FactorFrame, FactorSpec, to_factor_output


class Ret20_0(Factor):
    spec = FactorSpec(
        name="ret20_0",
        inputs=["close"],
        min_window=20,
        frequency="1d",
        adjust="hfq",
    )

    def compute(self, data: FactorFrame) -> pd.DataFrame:
        value = data.close / data.close.shift(20) - 1
        return to_factor_output(value, self.spec.name)

因子代码只应该访问 FactorFrame，不要自己读文件、查 DuckDB、或者直接调用 zer0share。

标准字段

zer0factor 字段	zer0share 来源	说明
`open`	`open`	provider 负责复权
`high`	`high`	provider 负责复权
`low`	`low`	provider 负责复权
`close`	`close`	provider 负责复权
`volume`	`vol`	统一改名，方便因子代码阅读
`amount`	`amount`	成交额
`return_`	`pct_chg` 或计算收益率	避开 Python 关键字 `return`

默认使用后复权：hfq。

因子存储

因子值按日期分区写入 Parquet：

data/factors/
└── ret20_0/
    ├── date=20240102/data.parquet
    └── date=20240103/data.parquet

db/
└── factor_meta.duckdb

因子结果必须是三列：

trade_date, ts_code, value

factor-research Skill

Codex skill 位置：

docs/skills/factor-research/

流程：

PDF 研报 / 研究想法
  -> 候选因子
  -> 人工审核
  -> FactorSpec
  -> 质量门检查
  -> Python 因子代码
  -> 执行检查
  -> 归档

初始化工作区：

python docs/skills/factor-research/scripts/init_factor_research_workspace.py \
  workspaces/my-factor-run \
  --target-factor-count 5 \
  --selection-mode top_representative

校验因子元数据：

python docs/skills/factor-research/scripts/validate_factors_json.py \
  workspaces/my-factor-run/factors.json

示例流程

workspaces/factor-research-guosen-momentum/ 里有一轮完整的动量研报示例：

factors.json
approved.json
code/*.py
results/execution_feedback.json
results/factor_library.json
feedback/round_feedback.md

生成出的因子：

ret20_0
ret240_20_remove_up_limit
rank_mom120_20
smooth240_1
overnight_mom20

当前限制

当前主要围绕本地 A 股数据和 zer0share。
FactorFrame 还没有暴露 ST、停牌、上市天数、精确涨停等字段。
公告日因子、指数超额因子、风格回归因子还需要扩展 provider。
API 还处在实验阶段。

贡献

欢迎提交 issue 和 PR。当前比较适合贡献的方向：

扩展 provider 字段契约
补充因子执行 CLI
增加 FactorSpec、FactorFrame、FactorStorage 的测试
增加不包含第三方版权材料的示例
改进文档

详见 CONTRIBUTING.md。

交流

公众号：极客投研笔记

如果你对本地股票数据系统、AI 量化投研或因子研究工作流感兴趣，可以关注公众号看后续更新。

免责声明

本项目仅用于研究和工程实验，不构成任何投资建议。仓库中的因子、示例和生成结果都需要自行验证后再使用。

License

MIT。详见 LICENSE。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

zer0factor

核心能力

目录结构

安装

配置

快速开始

CLI

因子注册表

因子评估

Summary 指标口径

标准因子长什么样

标准字段

因子存储

factor-research Skill

示例流程

当前限制

贡献

交流

免责声明

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 112 Commits
.claude		.claude
.vscode		.vscode
config		config
docs		docs
logs		logs
notebooks		notebooks
tests		tests
workspaces/factor-research-guosen-momentum		workspaces/factor-research-guosen-momentum
zer0factor		zer0factor
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.en.md		README.en.md
README.md		README.md
README.zh-CN.md		README.zh-CN.md
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Folders and files

Latest commit

History

Repository files navigation

zer0factor

核心能力

目录结构

安装

配置

快速开始

CLI

因子注册表

因子评估

Summary 指标口径

标准因子长什么样

标准字段

因子存储

factor-research Skill

示例流程

当前限制

贡献

交流

免责声明

License

About

Topics

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages