# MingLi-Bench - 中文命理LLM评测基准（八字+紫微斗数）

> 评估大语言模型在八字和紫微斗数方面的推理能力，160道全球算命师大赛真题，支持 GPT/Claude/Gemini/DeepSeek 等主流模型

## MingLi-Bench: 中文命理大模型评测基准 🔮📊

专门用于评估大语言模型在**中国传统命理学**——八字和紫微斗数方面能力的 Benchmark。

### 核心特点

- 📝 **160道选择题** — 涵盖事业、健康、婚姻、子女、财运等十二个人生维度
- 📅 **2022-2025年真题** — 题目来源于全球算命师大赛（香港风水命理协会主办）
- 🔮 **双维度评测** — 同时支持八字和紫微斗数排盘推理
- 🧠 **CoT + 排盘注入** — `--cot --astro` 模式隔离推理能力与排盘准确度

### 快速开始

```bash
git clone https://github.com/DestinyLinker/MingLi-Bench.git
cd MingLi-Bench
pip install -r requirements.txt

# 通过 OpenRouter 测任意模型
python -m mingli_bench.cli --model anthropic/claude-sonnet-4-6 --year 2025 --cot --astro

# 测 DeepSeek
python -m mingli_bench.cli --model deepseek/deepseek-r1 --year 2025 --cot --astro
```

### 支持的模型平台

- OpenRouter（一键测大多数模型）
- OpenAI / Anthropic / Google / DeepSeek / 豆包（原生调用）

### 数据说明

| 文件 | 说明 |
|------|------|
| `data/data.json` | 160道标准化选择题，覆盖十二人生维度 |
| `data/fortune_api_results.json` | 预计算的八字/紫微排盘数据（隔离排盘与推理） |

⭐ 761 Stars | Python | MIT License

---

**分类**：Skills
**标签**：模型 · 八字 · 紫微斗数
**作者**：Xiao.Xi
**链接**：https://octohz.com/p/1651