MingLi-Bench - 中文命理LLM评测基准(八字+紫微斗数)

MingLi-Bench - 中文命理LLM评测基准(八字+紫微斗数)


评估大语言模型在八字和紫微斗数方面的推理能力,160道全球算命师大赛真题,支持 GPT/Claude/Gemini/DeepSeek 等主流模型

MingLi-Bench: 中文命理大模型评测基准 🔮📊

专门用于评估大语言模型在中国传统命理学——八字和紫微斗数方面能力的 Benchmark。

核心特点

  • 📝 160道选择题 — 涵盖事业、健康、婚姻、子女、财运等十二个人生维度
  • 📅 2022-2025年真题 — 题目来源于全球算命师大赛(香港风水命理协会主办)
  • 🔮 双维度评测 — 同时支持八字和紫微斗数排盘推理
  • 🧠 CoT + 排盘注入--cot --astro 模式隔离推理能力与排盘准确度

快速开始

git clone https://github.com/DestinyLinker/MingLi-Bench.git
cd MingLi-Bench
pip install -r requirements.txt

# 通过 OpenRouter 测任意模型
python -m mingli_bench.cli --model anthropic/claude-sonnet-4-6 --year 2025 --cot --astro

# 测 DeepSeek
python -m mingli_bench.cli --model deepseek/deepseek-r1 --year 2025 --cot --astro

支持的模型平台

  • OpenRouter(一键测大多数模型)
  • OpenAI / Anthropic / Google / DeepSeek / 豆包(原生调用)

数据说明

文件说明
data/data.json160道标准化选择题,覆盖十二人生维度
data/fortune_api_results.json预计算的八字/紫微排盘数据(隔离排盘与推理)

⭐ 761 Stars | Python | MIT License

2900举报0Xiao.Xi6天前
点击获取 ^_^

暂无评论