模型管理(Owner)
项目所有者如何配置可用模型
模型管理(Owner)
适用对象
仅工作区 admin 可访问和管理系统模型配置页面。
普通用户通过 /workspace/models 管理个人模型。
模型范围
ResearchX 现在将模型管理拆分为两个范围:
- 系统 / 管理员模型:在
/workspace/admin/models管理,主要用于项目管理员和全局默认配置 - 个人模型:在
/workspace/models管理,供已登录用户维护自己的模型列表
聊天中的模型选择器只会展示当前用户可访问的模型。当项目或会话请求某个模型时,系统会优先在调用者可访问的范围内解析。
基础配置项
- 模型显示名
- provider
- model id
- base url
- API key(可选)
带 必填 标记的字段需要先填写完成才能保存或测试模型。表单会在对应字段下方显示校验提示,例如缺少模型 ID、Base URL 格式不正确、JSON 配置无法解析,或开启计费后价格字段为空。
Provider 模板
创建模型时可以从 provider 模板开始,系统会自动填入常见的调用协议、默认地址和示例模型 ID。
近期可用模板包括:
OpenAI:使用 OpenAI Chat Completions 兼容接口OpenAI Responses:使用 OpenAI Responses APIOpenAI Codex (ChatGPT OAuth):使用 Codex/ChatGPT OAuth 登录Custom OpenAI-Compatible:适配自定义 OpenAI 兼容服务AnthropicOpenRouterOllamaGroqDeepSeekPerplexityMoonshotZhipu AISiliconFlowVolcengine ArkDashScope (OpenAI)/DashScope (Anthropic)MistralNVIDIA NIM
使用建议:
- 如果供应商在模板中已经存在,优先选择模板,再修改
model id和密钥 - 接入 OpenAI 新模型时,优先使用
OpenAI Responses;接入 Codex OAuth 时,使用OpenAI Codex (ChatGPT OAuth) - 接入聚合平台时,优先从
OpenRouter模板开始;接入 DeepSeek 官方接口时,优先从DeepSeek模板开始
OpenAI Codex OAuth 凭据
选择 OpenAI Codex (ChatGPT OAuth) 模板时,模型不使用普通内联 API key,而是使用 ResearchX 保存的 Codex OAuth 凭据。表单会显示 Codex OAuth 凭证 区域。
可用操作:
登录 Codex:打开 Codex 授权链接,完成授权后保存凭据从本机 Codex 导入:导入当前服务器或本机已有的 Codex 登录状态刷新:刷新已保存的 Codex token清除:移除 ResearchX 保存的 Codex 凭据
使用建议:
- 本地部署时,如果机器上已经登录过 Codex,可优先使用
从本机 Codex 导入 - 远程部署时,点击
登录 Codex后在浏览器完成授权,再把回调 URL 或 code 粘贴回表单 - 凭据按模型管理范围保存:系统模型在管理员模型范围内使用,个人模型在个人模型范围内使用
- 当凭据缺失或过期时,使用该模板的模型调用会失败,需要重新登录或刷新
上下文配置
上下文窗口大小
设置模型支持的最大上下文令牌数。留空使用默认值:
- 所有模型提供商:200k tokens
使用非标准限制的提供商时,可自定义此值。
上下文压缩配置
- 启用压缩:为此模型启用自动上下文压缩
- 保留令牌数:为模型响应预留的令牌数(默认:16384)
- 保持最近令牌数:保留不压缩的最近对话令牌数(默认:20000)
- 预防性压缩阈值:主动触发压缩的使用比例(0-1)
- 示例:
0.8表示当使用量超过上下文窗口 80% 时触发压缩 - 留空使用默认值
0.9 - 推荐值:
0.8-0.9
- 示例:
配置建议
- 对于上下文窗口较小的模型,建议启用压缩
- 如果模型经常生成长回复,可增加保留令牌数
- 用户频繁遇到上下文限制时,设置预防性阈值
高级配置
provider_spec(提供商规范)
provider_spec 用于声明模型的提供商信息和兼容性特征:
- provider_type: 提供商类型(如
openai、anthropic、openai-compatible等) - transport.api: 实际调用协议,支持
openai-completions、openai-responses、openai-codex-responses和anthropic-messages - supports_developer_role: 是否支持
developer角色消息(默认为false,使用system兼容角色) - supports_streaming: 是否支持流式输出
- supports_function_calling: 是否支持函数调用/工具调用
policy(调用策略)
policy 用于控制模型的调用行为和重试策略:
- max_retries: 最大重试次数
- timeout_ms: 请求超时时间(毫秒)
- fallback_model: 降级模型 ID(当主模型不可用时自动切换)
capabilities(能力声明)
capabilities 用于声明模型支持的特定功能和特性:
- vision: 是否支持图像输入
- json_mode: 是否原生支持 JSON 输出模式
- parallel_tool_calls: 是否支持并行工具调用
- max_tokens: 单次响应最大 token 数
thinking(推理配置)
对于 provider_type: openai-compatible 的模型,可配置 thinking 字段以启用扩展推理/思考功能:
- thinking: 推理配置对象,会直接注入到 API 请求中,用来开启模型的扩展推理/深度思考能力(如智谱、通义千问等支持扩展推理的模型)
- thinking_format: 推理格式,支持
openai、zai、qwen等不同供应商的格式
说明:
- 仅对
openai-compatible提供商类型生效 - 配置后会在每次流式/非流式请求中自动注入思考参数
- 会话标题生成时默认禁用推理,以减少不必要的 token 消耗
使用流程
- 在项目设置菜单进入 Model Management
- 创建或编辑模型配置
- 回到聊天页选择模型并发送消息
默认模型选择行为
- 项目会记住你上次选择的模型
- 若没有历史选择或历史模型已不可用,自动选择当前模型列表第一项
计费配置
模型编辑表单底部包含计费设置区域,可独立为每个模型开启按 Token 使用量计费。配置包括输入价格、输出价格(每千 Token 的微元单价)、最低收费和计费货币。开启计费后,用户调用该模型时会自动从其钱包扣费。
详见 模型计费与钱包。