查询改写和查询增强是两种提升检索效果的技术,目标是在不改变用户意图的前提下,使检索器收到的查询更全面或明确,从而找到更多相关信息。
- 查询改写通常指将原始查询转换成语义等价但更明晰的形式。上一节谈到的对话查询改写是一个典型场景。在一般情况下,查询改写也适用于澄清歧义或补全信息。例如,用户输入简短查询“Python 内存”,我们可以自动改写为“Python 内存管理机制是什么?”以便检索器获取更相关的技术文章,而不是与动物蟒蛇相关的内容。改写可以利用规则(比如替换同义表达)或深度学习模型。现代大模型擅长根据上下文对问题重述,Few-shot 提示可以引导GPT-4类模型将用户查询扩展成一个自包含的问题。Microsoft的研究将查询改写视为