diff --git a/config.yaml b/config.yaml index f2e149d8..e336999e 100644 --- a/config.yaml +++ b/config.yaml @@ -116,6 +116,22 @@ knowledge: top_k: 5 # 检索返回的Top-K结果数量 similarity_threshold: 0.7 # 相似度阈值(0-1),低于此值的结果将被过滤 hybrid_weight: 0.7 # 混合检索权重(0-1),向量检索的权重,1.0表示纯向量检索,0.0表示纯关键词检索 + # ============================================ + # 索引配置(用于解决 API 限制问题) + # ============================================ + indexing: + # 分块配置 + chunk_size: 512 # 每个块的最大 token 数(默认 512),长文本会被分割成多个块 + chunk_overlap: 50 # 块之间的重叠 token 数(默认 50),保持上下文连贯性 + max_chunks_per_item: 0 # 单个知识项的最大块数量(0 表示不限制),防止单个文件消耗过多 API 配额 + # 速率限制配置(解决 429 错误) + max_rpm: 0 # 每分钟最大请求数(默认 0 表示不限制),如 OpenAI 默认 200 RPM + rate_limit_delay_ms: 300 # 请求间隔毫秒数(默认 300),用于避免 API 速率限制,设为 0 不限制 + # 建议值:200 次/分钟≈300ms, 100 次/分钟≈600ms + + # 重试配置 + max_retries: 3 # 最大重试次数(默认 3),遇到速率限制或服务器错误时自动重试 + retry_delay_ms: 1000 # 重试间隔毫秒数(默认 1000),每次重试会递增延迟 # ============================================ # 机器人配置(企业微信、钉钉、飞书)