Fara-7B - 微软开源 7B 电脑自动化代理模型

Fara-7B - 微软开源 7B 电脑自动化代理模型


微软首个 Agentic SLM,7B 参数本地跑,看屏幕操作鼠标键盘自动执行任务

简介

Fara-7B 是微软发布的首个面向电脑使用的 Agentic 小语言模型(SLM)。仅 7B 参数,却能直接看屏幕截图、控制鼠标键盘,自动完成日常网络任务。

核心特性

  • 仅 7B 参数 — 超紧凑体积,本地即可运行,无需 API Token
  • Computer Use Agent (CUA) — 专为电脑自动化设计的代理模型
  • 看屏幕 + 自动操作 — 分析屏幕截图,自主执行鼠标点击、拖拽、滚轮、键盘输入
  • 竞争力强 — 在同尺寸模型中达到 SOTA,可与更大的 agentic 系统竞争
  • 开箱即用 — 支持 vLLM 本地部署,也可通过 Azure Foundry 使用

能做什么

  • 搜索信息并摘要结果
  • 填写表格和管理账户
  • 批量完成网页任务
  • 收集资料整理成文档
  • 全网购物比价

快速开始

# 1. 克隆仓库
git clone https://github.com/microsoft/fara.git
cd fara

# 2. 配置环境
python3 -m venv .venv
source .venv/bin/activate
pip install -e .
playwright install

# 3. 启动模型服务
vllm serve "microsoft/Fara-7B" --port 5000 --dtype auto

# 4. 发起任务
fara-cli --task "whats the weather in new york now"

技术栈

Python · vLLM · Playwright · Hugging Face

相关链接

700举报0Xiao.Xi17小时前
点击获取 ^_^

暂无评论