# MingLi-Bench - 中文命理LLM评测基准(八字+紫微斗数) > 评估大语言模型在八字和紫微斗数方面的推理能力,160道全球算命师大赛真题,支持 GPT/Claude/Gemini/DeepSeek 等主流模型 ## MingLi-Bench: 中文命理大模型评测基准 🔮📊 专门用于评估大语言模型在**中国传统命理学**——八字和紫微斗数方面能力的 Benchmark。 ### 核心特点 - 📝 **160道选择题** — 涵盖事业、健康、婚姻、子女、财运等十二个人生维度 - 📅 **2022-2025年真题** — 题目来源于全球算命师大赛(香港风水命理协会主办) - 🔮 **双维度评测** — 同时支持八字和紫微斗数排盘推理 - 🧠 **CoT + 排盘注入** — `--cot --astro` 模式隔离推理能力与排盘准确度 ### 快速开始 ```bash git clone https://github.com/DestinyLinker/MingLi-Bench.git cd MingLi-Bench pip install -r requirements.txt # 通过 OpenRouter 测任意模型 python -m mingli_bench.cli --model anthropic/claude-sonnet-4-6 --year 2025 --cot --astro # 测 DeepSeek python -m mingli_bench.cli --model deepseek/deepseek-r1 --year 2025 --cot --astro ``` ### 支持的模型平台 - OpenRouter(一键测大多数模型) - OpenAI / Anthropic / Google / DeepSeek / 豆包(原生调用) ### 数据说明 | 文件 | 说明 | |------|------| | `data/data.json` | 160道标准化选择题,覆盖十二人生维度 | | `data/fortune_api_results.json` | 预计算的八字/紫微排盘数据(隔离排盘与推理) | ⭐ 761 Stars | Python | MIT License --- **分类**:Skills **标签**:模型 · 八字 · 紫微斗数 **作者**:Xiao.Xi **链接**:https://octohz.com/p/1651