Retriever

`retriever_init`

签名

def retriever_init(
    model_name_or_path: str,
    backend_configs: Dict[str, Any],
    batch_size: int,
    corpus_path: str,
    index_path: Optional[str] = None,
    faiss_use_gpu: bool = False,
    gpu_ids: Optional[object] = None,
    is_multimodal: bool = False,
    backend: str = "infinity",
) -> None

功能

初始化检索后端与语料索引

`retriever_embed`

签名

async def retriever_embed(
    embedding_path: Optional[str] = None,
    overwrite: bool = False,
    is_multimodal: bool = False,
) -> None

功能

编码语料向量并保存到 *.npy：

`retriever_index`

签名

def retriever_index(
    embedding_path: str,
    index_path: Optional[str] = None,
    overwrite: bool = False,
    index_chunk_size: int = 50000,
) -> None

功能

使用 FAISS 为向量嵌入构建倒排

`bm25_index`

签名

def bm25_index(
    index_path: Optional[str] = None,
    overwrite: bool = False,
) -> None

功能

建立 BM25 索引，保存停用词与词表。

`retriever_search`

签名

async def retriever_search(
    query_list: List[str],
    top_k: int = 5,
    query_instruction: str = "",
) -> Dict[str, List[List[str]]]

功能

基于 FAISS 向量索引 的标准语义检索：infinity / sentence_transformers / openai。

输出格式（JSON）

{"ret_psg": [["passage 1", "passage 2"], ["..." ]]}

`retriever_search_colbert_maxsim`

签名

async def retriever_search_colbert_maxsim(
    query_list: List[str],
    embedding_path: str,
    top_k: int = 5,
    query_instruction: str = "",
) -> Dict[str, List[List[str]]]

功能

适配 ColBERT/ColPali 多向量检索（仅 infinity 后端）。
读取 embedding_path（形状 (N, Kd, D) 或 dtype=object 的变长多向量），通过 MaxSim 聚合打分，返回 top-k。

输出格式（JSON）

{"ret_psg": [["passage 1", "passage 2"], ["..." ]]}

`bm25_search`

签名

async def bm25_search(
    query_list: List[str],
    top_k: int = 5,
) -> Dict[str, List[List[str]]]

功能

使用 BM25 倒排检索，返回每个查询的 top-k 文本列表。

输出格式（JSON）

{"ret_psg": [["passage 1", "passage 2"], ["..." ]]}

`retriever_exa_search`

签名

async def retriever_exa_search(
    query_list: List[str],
    top_k: Optional[int] | None = 5,
    retrieve_thread_num: Optional[int] | None = 1,
) -> Dict[str, List[List[str]]]

功能

调用 Exa Web 检索（需要 EXA_API_KEY）。

输出格式（JSON）

{"ret_psg": [["snippet 1", "snippet 2"], ["..." ]]}

`retriever_tavily_search`

签名

async def retriever_tavily_search(
    query_list: List[str],
    top_k: Optional[int] | None = 5,
    retrieve_thread_num: Optional[int] | None = 1,
) -> Dict[str, List[List[str]]]

功能

调用 Tavily Web 检索（需要 TAVILY_API_KEY）。

输出格式（JSON）

{"ret_psg": [["snippet 1", "snippet 2"], ["..." ]]}

`retriever_zhipuai_search`

签名

async def retriever_zhipuai_search(
    query_list: List[str],
    top_k: Optional[int] | None = 5,
    retrieve_thread_num: Optional[int] | None = 1,
) -> Dict[str, List[List[str]]]

功能

调用 智谱AI web_search（需要 ZHIPUAI_API_KEY）。

输出格式（JSON）

{"ret_psg": [["snippet 1", "snippet 2"], ["..." ]]}

参数配置

https://mintcdn.com/ultrarag/T7GffHzZitf6TThi/images/yaml.svg?fit=max&auto=format&n=T7GffHzZitf6TThi&q=85&s=69b41e79144bc908039c2ee3abbb1c3b

servers/retriever/parameter.yaml

model_name_or_path: openbmb/MiniCPM-Embedding-Light
corpus_path: data/corpus_example.jsonl
embedding_path: embedding/embedding.npy
index_path: index/index.index

backend: sentence_transformers # options: infinity, sentence_transformers, openai, bm25
backend_configs:
  infinity:
    bettertransformer: false
    pooling_method: auto
    device: cuda
    model_warmup: false
    trust_remote_code: true
  sentence_transformers:
    device: cuda
    trust_remote_code: true
    sentence_transformers_encode:
      normalize_embeddings: false
      encode_chunk_size: 10000
      q_prompt_name: query
      psg_prompt_name: document
      psg_task: null
      q_task: null
  openai:
    model_name: text-embedding-3-small
    base_url: "https://api.openai.com/v1"
    api_key: ""
  bm25:
    lang: en

batch_size: 16
top_k: 5
gpu_ids: "0,1"
query_instruction: ""
is_multimodal: false
faiss_use_gpu: True
overwrite: false
index_chunk_size: 50000
retrieve_thread_num: 1

参数说明：

参数	类型	说明
`model_name_or_path`	str	检索模型路径或名称（如 HuggingFace 模型 ID）
`corpus_path`	str	输入语料 JSONL 文件路径
`embedding_path`	str	向量文件保存路径（`.npy`）
`index_path`	str	FAISS/BM25 索引保存路径（`.index`）
`backend`	str	选择检索后端：`infinity`、`sentence_transformers`、`openai`、`bm25`
`backend_configs`	dict	各后端的参数配置（见下）
`batch_size`	int	向量生成或检索的批大小
`top_k`	int	返回的候选段落数量
`gpu_ids`	str	指定可见 GPU 设备，如 `"0,1"`
`query_instruction`	str	查询前缀（instruction-tuning 模型使用）
`is_multimodal`	bool	是否启用多模态嵌入（如图像）
`faiss_use_gpu`	bool	是否使用 GPU 加速 FAISS 检索
`overwrite`	bool	若已存在嵌入或索引文件是否覆盖
`index_chunk_size`	int	构建索引时每批加入向量数
`retrieve_thread_num`	int	外部 Web 检索（Exa/Tavily/Zhipu）并发线程数

backend_configs 子项：

后端	参数	说明
infinity	`bettertransformer`	是否启用高效推理优化
	`pooling_method`	池化方式（如 `auto`, `mean`）
	`device`	运行设备（`cuda` 或 `cpu`）
	`model_warmup`	是否预加载模型到显存
	`trust_remote_code`	是否信任远程代码（适用于自定义模型）
sentence_transformers	`device`	设备（`cuda` 或 `cpu`）
	`trust_remote_code`	是否允许自定义模型代码
	`sentence_transformers_encode`	嵌入时的高级参数（如下）
openai	`model_name`	OpenAI 模型名称（如 `text-embedding-3-small`）
	`base_url`	API 基地址
	`api_key`	OpenAI API 密钥
bm25	`lang`	语言（决定停用词与分词器）

sentence_transformers_encode 参数：

参数	类型	说明
`normalize_embeddings`	bool	是否归一化向量
`encode_chunk_size`	int	编码块大小（避免显存溢出）
`q_prompt_name`	str	查询模板名
`psg_prompt_name`	str	段落模板名
`q_task` / `psg_task`	str/null	任务标签（如需要 prompt 适配）

RAG Servers

CLI

`retriever_init`

`retriever_embed`

`retriever_index`

`bm25_index`

`retriever_search`

`retriever_search_colbert_maxsim`

`bm25_search`

`retriever_exa_search`

`retriever_tavily_search`

`retriever_zhipuai_search`

参数配置

RAG Servers

CLI

​retriever_init

​retriever_embed

​retriever_index

​bm25_index

​retriever_search

​retriever_search_colbert_maxsim

​bm25_search

​retriever_exa_search

​retriever_tavily_search

​retriever_zhipuai_search

​参数配置

`retriever_init`

`retriever_embed`

`retriever_index`

`bm25_index`

`retriever_search`

`retriever_search_colbert_maxsim`

`bm25_search`

`retriever_exa_search`

`retriever_tavily_search`

`retriever_zhipuai_search`

参数配置