
微软首个 Agentic SLM,7B 参数本地跑,看屏幕操作鼠标键盘自动执行任务
简介
Fara-7B 是微软发布的首个面向电脑使用的 Agentic 小语言模型(SLM)。仅 7B 参数,却能直接看屏幕截图、控制鼠标键盘,自动完成日常网络任务。
核心特性
- 仅 7B 参数 — 超紧凑体积,本地即可运行,无需 API Token
- Computer Use Agent (CUA) — 专为电脑自动化设计的代理模型
- 看屏幕 + 自动操作 — 分析屏幕截图,自主执行鼠标点击、拖拽、滚轮、键盘输入
- 竞争力强 — 在同尺寸模型中达到 SOTA,可与更大的 agentic 系统竞争
- 开箱即用 — 支持 vLLM 本地部署,也可通过 Azure Foundry 使用
能做什么
- 搜索信息并摘要结果
- 填写表格和管理账户
- 批量完成网页任务
- 收集资料整理成文档
- 全网购物比价
快速开始
# 1. 克隆仓库
git clone https://github.com/microsoft/fara.git
cd fara
# 2. 配置环境
python3 -m venv .venv
source .venv/bin/activate
pip install -e .
playwright install
# 3. 启动模型服务
vllm serve "microsoft/Fara-7B" --port 5000 --dtype auto
# 4. 发起任务
fara-cli --task "whats the weather in new york now"
技术栈
Python · vLLM · Playwright · Hugging Face
相关链接
暂无评论
