先评估，后编码：评估、重排器与缓存实用指南

闪电演讲

17:20 - 17:30

分会场 C(317 教室)

Saksham Aggarwal PYOR 首席工程师

Saksham Aggarwal 是一位创始人兼工程师，他专注于开发能自动化处理工程重复性工作的人工智能代理，初期从 SDK 集成入手，助力产品团队提升工作效率。
他曾是 PYOR 公司的首席工程师，该公司是一家由城堡岛资本支持的金融数据初创企业，萨克沙姆在那里负责构建了用于链上分析的企业级数据终端。此外，他还推动了 Flint 公司（现更名为 LogX）的业务增长，并助力 Conquest——印度规模最大的学生运营初创企业加速器——实现了规模扩张。
Saksham 热衷于研究网络代理检索系统、可编程提示词、评估系统、网络应用、交互设计以及用于模型训练的合成数据。

详情

许多检索增强生成（RAG）和代码搜索流程依赖于临时检查，在大规模部署时会出现故障。

本次演讲将介绍一种“评估优先”的开发工作流，该工作流已应用于一个基于 Python、PostgreSQL（pgvector）和 OpenAI 重排器构建的生产级代码搜索引擎。在优化前引入自动化评估套件后，平均查询延迟从20分钟降至30秒，实现了40倍的速度提升，相关性也提高了约30%。内容将涵盖：

构建特定任务的评估数据集和指标
混合（ lexical + 近似最近邻）检索
用于提升精度的交叉编码器重排
保持索引新鲜度和查询速度的语义缓存策略

本次会议将包含基准测试结果、现场演示，以及一个采用 MIT 许可证的参考实现——参会者可克隆该实现并进行扩展。