
评估大语言模型在八字和紫微斗数方面的推理能力,160道全球算命师大赛真题,支持 GPT/Claude/Gemini/DeepSeek 等主流模型
MingLi-Bench: 中文命理大模型评测基准 🔮📊
专门用于评估大语言模型在中国传统命理学——八字和紫微斗数方面能力的 Benchmark。
核心特点
- 📝 160道选择题 — 涵盖事业、健康、婚姻、子女、财运等十二个人生维度
- 📅 2022-2025年真题 — 题目来源于全球算命师大赛(香港风水命理协会主办)
- 🔮 双维度评测 — 同时支持八字和紫微斗数排盘推理
- 🧠 CoT + 排盘注入 —
--cot --astro模式隔离推理能力与排盘准确度
快速开始
git clone https://github.com/DestinyLinker/MingLi-Bench.git
cd MingLi-Bench
pip install -r requirements.txt
# 通过 OpenRouter 测任意模型
python -m mingli_bench.cli --model anthropic/claude-sonnet-4-6 --year 2025 --cot --astro
# 测 DeepSeek
python -m mingli_bench.cli --model deepseek/deepseek-r1 --year 2025 --cot --astro
支持的模型平台
- OpenRouter(一键测大多数模型)
- OpenAI / Anthropic / Google / DeepSeek / 豆包(原生调用)
数据说明
| 文件 | 说明 |
|---|---|
data/data.json | 160道标准化选择题,覆盖十二人生维度 |
data/fortune_api_results.json | 预计算的八字/紫微排盘数据(隔离排盘与推理) |
⭐ 761 Stars | Python | MIT License
暂无评论
