登录
注册
搜索
Octo
Hz
让我们借助有惊人品味的你,找出世界上最酷的东西!
首页
导航
文档
资源库
论坛
站内搜索
「模态」共 10 条结果
搜索
源码
Lance — 3B 统一多模态模型
字节跳动开源的 3B 活跃参数原生统一多模态模型,支持图像/视频理解、生成与编辑。
38
0
0
0
Xiao.Xi
•
28天前
点击获取 ^_^
源码
MiniCPM-V 4.6 - 口袋级多模态大模型,手机端部署的超高效视觉语言模型
OpenBMB超轻量多模态模型,SigLIP2+Qwen3.5-0.8B,AI Index 13分,三端手机部署
48
0
0
0
Xiao.Xi
•
27天前
点击获取 ^_^
软件
Google Gemma 4 12B - 无编码器多模态大模型
Google DeepMind 开源多模态模型,11.95B参数支持文本+图像+音频,256K上下文,原生函数调用,Apache 2.0免费商用
63
0
0
0
Xiao.Xi
•
21天前
点击获取 ^_^
源码
Marqo Ecommerce Embeddings - 电商专用多模态嵌入模型
基于SigLIP微调的电商领域专用嵌入模型,vs通用SigLIP提升67%,vs Amazon Titan提升45%,支持文搜图/图搜图/商品去重
47
0
0
0
Xiao.Xi
•
27天前
点击获取 ^_^
源码
Omni-SimpleMem - LLM Agent 终身记忆系统
支持文本、图像、音频、视频的多模态终身记忆,LoCoMo SOTA
79
0
0
0
Xiao.Xi
•
2个月前
点击获取 ^_^
源码
UI-TARS - 字节跳动 GUI 自动化智能体
字节跳动开源多模态智能体,桌面/浏览器/手机自动化操作,游戏任务 SOTA
54
0
0
0
Xiao.Xi
•
2个月前
点击获取 ^_^
源码
Keye-VL — 8B 短视频理解大模型
快手开源 8B 多模态模型,专为短视频理解优化,Video-MME 73% 同级最强。
18
0
0
0
Xiao.Xi
•
9天前
点击获取 ^_^
源码
LobeChat
开源高性能聊天机器人框架,支持多模态对话、语音交互和可扩展插件,一键部署私有 ChatGPT。
49
0
0
0
Xiao.Xi
•
2个月前
点击获取 ^_^
新闻
Kimi 开源 K2.6:1万亿参数 MoE,长程编码与 Agent Swarm 能力行业领先
Moonshot AI 开源 Kimi K2.6,1万亿参数 MoE(激活32B),原生多模态。在 SWE-Bench Pro、长程编码、Agent Swarm 等关键指标上超越 Claude Opus 4.6 和 GPT-5.4。开源模型做到这个水平,闭源阵营的压力来了。
102
0
0
0
Xiao.Xi
•
2个月前
点击获取 ^_^
软件
Open Notebook - 开源隐私优先的 Notebook LM 替代品
开源自托管的智能笔记研究工具,支持18+AI模型、多模态内容、多说话人播客生成,数据完全本地存储
35
0
0
0
Xiao.Xi
•
22天前
点击获取 ^_^