MingLi-Bench - 中文命理LLM评测基准（八字+紫微斗数）

评估大语言模型在八字和紫微斗数方面的推理能力，160道全球算命师大赛真题，支持 GPT/Claude/Gemini/DeepSeek 等主流模型

MingLi-Bench: 中文命理大模型评测基准 🔮📊

专门用于评估大语言模型在中国传统命理学——八字和紫微斗数方面能力的 Benchmark。

核心特点

📝 160道选择题 — 涵盖事业、健康、婚姻、子女、财运等十二个人生维度
📅 2022-2025年真题 — 题目来源于全球算命师大赛（香港风水命理协会主办）
🔮 双维度评测 — 同时支持八字和紫微斗数排盘推理
🧠 CoT + 排盘注入 — --cot --astro 模式隔离推理能力与排盘准确度

快速开始

git clone https://github.com/DestinyLinker/MingLi-Bench.git
cd MingLi-Bench
pip install -r requirements.txt

# 通过 OpenRouter 测任意模型
python -m mingli_bench.cli --model anthropic/claude-sonnet-4-6 --year 2025 --cot --astro

# 测 DeepSeek
python -m mingli_bench.cli --model deepseek/deepseek-r1 --year 2025 --cot --astro

支持的模型平台

OpenRouter（一键测大多数模型）
OpenAI / Anthropic / Google / DeepSeek / 豆包（原生调用）

数据说明

文件	说明
`data/data.json`	160道标准化选择题，覆盖十二人生维度
`data/fortune_api_results.json`	预计算的八字/紫微排盘数据（隔离排盘与推理）

⭐ 761 Stars | Python | MIT License

11000举报0

Xiao.Xi•1个月前

点击获取 ^_^

被收录：

模型八字紫微斗数

暂无评论