站内搜索模态」共 10 条结果
Lance — 3B 统一多模态模型
字节跳动开源的 3B 活跃参数原生统一多模态模型,支持图像/视频理解、生成与编辑。
38000Xiao.XiXiao.Xi28天前
点击获取 ^_^
MiniCPM-V 4.6 - 口袋级多模态大模型,手机端部署的超高效视觉语言模型
OpenBMB超轻量多模态模型,SigLIP2+Qwen3.5-0.8B,AI Index 13分,三端手机部署
48000Xiao.XiXiao.Xi27天前
点击获取 ^_^
Google Gemma 4 12B - 无编码器多模态大模型
Google DeepMind 开源多模态模型,11.95B参数支持文本+图像+音频,256K上下文,原生函数调用,Apache 2.0免费商用
63000Xiao.XiXiao.Xi21天前
点击获取 ^_^
Marqo Ecommerce Embeddings - 电商专用多模态嵌入模型
基于SigLIP微调的电商领域专用嵌入模型,vs通用SigLIP提升67%,vs Amazon Titan提升45%,支持文搜图/图搜图/商品去重
47000Xiao.XiXiao.Xi27天前
点击获取 ^_^
Omni-SimpleMem - LLM Agent 终身记忆系统
支持文本、图像、音频、视频的多模态终身记忆,LoCoMo SOTA
79000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
UI-TARS - 字节跳动 GUI 自动化智能体
字节跳动开源多模态智能体,桌面/浏览器/手机自动化操作,游戏任务 SOTA
54000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
Keye-VL — 8B 短视频理解大模型
快手开源 8B 多模态模型,专为短视频理解优化,Video-MME 73% 同级最强。
18000Xiao.XiXiao.Xi9天前
点击获取 ^_^
LobeChat
开源高性能聊天机器人框架,支持多模态对话、语音交互和可扩展插件,一键部署私有 ChatGPT。
49000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
Kimi 开源 K2.6:1万亿参数 MoE,长程编码与 Agent Swarm 能力行业领先
Moonshot AI 开源 Kimi K2.6,1万亿参数 MoE(激活32B),原生多模态。在 SWE-Bench Pro、长程编码、Agent Swarm 等关键指标上超越 Claude Opus 4.6 和 GPT-5.4。开源模型做到这个水平,闭源阵营的压力来了。
102000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
Open Notebook - 开源隐私优先的 Notebook LM 替代品
开源自托管的智能笔记研究工具,支持18+AI模型、多模态内容、多说话人播客生成,数据完全本地存储
35000Xiao.XiXiao.Xi22天前
点击获取 ^_^