中文EN
ResearchX Docs
中文

模型管理(Owner)

项目所有者如何配置可用模型

模型管理(Owner)

适用对象

仅工作区 admin 可访问和管理系统模型配置页面。 普通用户通过 /workspace/models 管理个人模型。

模型范围

ResearchX 现在将模型管理拆分为两个范围:

  • 系统 / 管理员模型:在 /workspace/admin/models 管理,主要用于项目管理员和全局默认配置
  • 个人模型:在 /workspace/models 管理,供已登录用户维护自己的模型列表

聊天中的模型选择器只会展示当前用户可访问的模型。当项目或会话请求某个模型时,系统会优先在调用者可访问的范围内解析。

基础配置项

  • 模型显示名
  • provider
  • model id
  • base url
  • API key(可选)

必填 标记的字段需要先填写完成才能保存或测试模型。表单会在对应字段下方显示校验提示,例如缺少模型 ID、Base URL 格式不正确、JSON 配置无法解析,或开启计费后价格字段为空。

Provider 模板

创建模型时可以从 provider 模板开始,系统会自动填入常见的调用协议、默认地址和示例模型 ID。

近期可用模板包括:

  • OpenAI:使用 OpenAI Chat Completions 兼容接口
  • OpenAI Responses:使用 OpenAI Responses API
  • OpenAI Codex (ChatGPT OAuth):使用 Codex/ChatGPT OAuth 登录
  • Custom OpenAI-Compatible:适配自定义 OpenAI 兼容服务
  • Anthropic
  • OpenRouter
  • Ollama
  • Groq
  • DeepSeek
  • Perplexity
  • Moonshot
  • Zhipu AI
  • SiliconFlow
  • Volcengine Ark
  • DashScope (OpenAI) / DashScope (Anthropic)
  • Mistral
  • NVIDIA NIM

使用建议:

  • 如果供应商在模板中已经存在,优先选择模板,再修改 model id 和密钥
  • 接入 OpenAI 新模型时,优先使用 OpenAI Responses;接入 Codex OAuth 时,使用 OpenAI Codex (ChatGPT OAuth)
  • 接入聚合平台时,优先从 OpenRouter 模板开始;接入 DeepSeek 官方接口时,优先从 DeepSeek 模板开始

OpenAI Codex OAuth 凭据

选择 OpenAI Codex (ChatGPT OAuth) 模板时,模型不使用普通内联 API key,而是使用 ResearchX 保存的 Codex OAuth 凭据。表单会显示 Codex OAuth 凭证 区域。

可用操作:

  • 登录 Codex:打开 Codex 授权链接,完成授权后保存凭据
  • 从本机 Codex 导入:导入当前服务器或本机已有的 Codex 登录状态
  • 刷新:刷新已保存的 Codex token
  • 清除:移除 ResearchX 保存的 Codex 凭据

使用建议:

  • 本地部署时,如果机器上已经登录过 Codex,可优先使用 从本机 Codex 导入
  • 远程部署时,点击 登录 Codex 后在浏览器完成授权,再把回调 URL 或 code 粘贴回表单
  • 凭据按模型管理范围保存:系统模型在管理员模型范围内使用,个人模型在个人模型范围内使用
  • 当凭据缺失或过期时,使用该模板的模型调用会失败,需要重新登录或刷新

上下文配置

上下文窗口大小

设置模型支持的最大上下文令牌数。留空使用默认值:

  • 所有模型提供商:200k tokens

使用非标准限制的提供商时,可自定义此值。

上下文压缩配置

  • 启用压缩:为此模型启用自动上下文压缩
  • 保留令牌数:为模型响应预留的令牌数(默认:16384)
  • 保持最近令牌数:保留不压缩的最近对话令牌数(默认:20000)
  • 预防性压缩阈值:主动触发压缩的使用比例(0-1)
    • 示例:0.8 表示当使用量超过上下文窗口 80% 时触发压缩
    • 留空使用默认值 0.9
    • 推荐值:0.8 - 0.9

配置建议

  • 对于上下文窗口较小的模型,建议启用压缩
  • 如果模型经常生成长回复,可增加保留令牌数
  • 用户频繁遇到上下文限制时,设置预防性阈值

高级配置

provider_spec(提供商规范)

provider_spec 用于声明模型的提供商信息和兼容性特征:

  • provider_type: 提供商类型(如 openaianthropicopenai-compatible 等)
  • transport.api: 实际调用协议,支持 openai-completionsopenai-responsesopenai-codex-responsesanthropic-messages
  • supports_developer_role: 是否支持 developer 角色消息(默认为 false,使用 system 兼容角色)
  • supports_streaming: 是否支持流式输出
  • supports_function_calling: 是否支持函数调用/工具调用

policy(调用策略)

policy 用于控制模型的调用行为和重试策略:

  • max_retries: 最大重试次数
  • timeout_ms: 请求超时时间(毫秒)
  • fallback_model: 降级模型 ID(当主模型不可用时自动切换)

capabilities(能力声明)

capabilities 用于声明模型支持的特定功能和特性:

  • vision: 是否支持图像输入
  • json_mode: 是否原生支持 JSON 输出模式
  • parallel_tool_calls: 是否支持并行工具调用
  • max_tokens: 单次响应最大 token 数

thinking(推理配置)

对于 provider_type: openai-compatible 的模型,可配置 thinking 字段以启用扩展推理/思考功能:

  • thinking: 推理配置对象,会直接注入到 API 请求中,用来开启模型的扩展推理/深度思考能力(如智谱、通义千问等支持扩展推理的模型)
  • thinking_format: 推理格式,支持 openaizaiqwen 等不同供应商的格式

说明:

  • 仅对 openai-compatible 提供商类型生效
  • 配置后会在每次流式/非流式请求中自动注入思考参数
  • 会话标题生成时默认禁用推理,以减少不必要的 token 消耗

使用流程

  1. 在项目设置菜单进入 Model Management
  2. 创建或编辑模型配置
  3. 回到聊天页选择模型并发送消息

默认模型选择行为

  • 项目会记住你上次选择的模型
  • 若没有历史选择或历史模型已不可用,自动选择当前模型列表第一项

计费配置

模型编辑表单底部包含计费设置区域,可独立为每个模型开启按 Token 使用量计费。配置包括输入价格、输出价格(每千 Token 的微元单价)、最低收费和计费货币。开启计费后,用户调用该模型时会自动从其钱包扣费。

详见 模型计费与钱包