简体中文
examples/
corpus_index.yaml
# MCP Server servers: retriever: servers/retriever # MCP Client Pipeline pipeline: - retriever.retriever_init - retriever.retriever_embed - retriever.retriever_index
ultrarag build examples/corpus_index.yaml
retriever: corpus_path: data/sample_hotpotqa_corpus_5.jsonl # 输入语料路径(JSONL 格式) retriever_path: openbmb/MiniCPM-Embedding-Light # 检索模型名称或路径 embedding_path: embedding/embedding.npy # 保存嵌入向量的路径 index_path: index/index.index # 保存索引文件的路径 faiss_use_gpu: true # 是否启用 GPU 加速 index_chunk_size: 50000 # 构建索引时的分块大小 cuda_devices: 0,1 # 使用的 GPU 设备编号 overwrite: false # 是否覆盖已存在的文件 infinity_kwargs: # 嵌入引擎相关配置 batch_size: 1024 bettertransformer: false device: cuda pooling_method: auto
ultrarag run examples/corpus_index.yaml
nohup ultrarag run examples/corpus_index.yaml > log.txt 2>&1 &
此页面对您有帮助吗?