静态信息检索
给定 query 后返回论文列表,主要优化召回、排序和摘要呈现。系统输出通常停留在“找到什么论文”。
Agentic Scientific Knowledge Acquisition
从静态文献检索走向自主证据获取,贯通科学知识接口、学术检索 Skill、知识获取智能体、过程评测与真实用户服务。
Core Thesis
Scientific Knowledge Acquisition Stack 不是更大的论文搜索框,而是面向 Science Agent 和 Autonomous Research Agent 的知识获取基础设施。
Agentic AI 时代,科研智能体面对的核心挑战不只是生成答案,而是在复杂科学信息空间中主动获取、验证、组织和利用知识。科学文献、实验数据、代码资源、图表证据和领域知识持续增长,静态数据库、关键词检索和一次性 RAG 很难支撑真实科研过程中的多轮证据获取。
因此,Scientific Knowledge Acquisition 应从静态数据访问接口,推进为面向科研智能体的 Agentic Scientific Knowledge Acquisition Interface。它需要理解任务目标,识别知识缺口,规划检索路径,并在多轮交互中完成证据筛选、跨文档推理和结论修正。
Positioning
传统系统通常回答“找到什么论文”,而科研智能体需要围绕任务状态规划知识获取过程,产出可验证证据链、结构化 claim、方法边界、实验依据和可复用记忆。
给定 query 后返回论文列表,主要优化召回、排序和摘要呈现。系统输出通常停留在“找到什么论文”。
给定任务状态后规划知识获取过程,产出可验证证据链、结构化 claim、方法边界、实验依据和可复用记忆。
System Stack
从 Lewen API 到 Academic Search、PaperScout、PaperArena,再到学术乐问用户系统,形成可调用、可评测、可迭代的科研知识获取闭环。
从底层科学数据到用户侧研究辅助,形成可调用、可评测、可迭代的科研知识获取闭环。
Data Layer
Lewen API 把分散的科学信息资源转化为可组合、可追踪、可扩展的数据接口,是后续 Skill 调用、智能体规划和证据评测的基础。
围绕论文、元数据、引用关系、开放全文、图表证据和多模态材料提供统一接口。
为上层 Academic Search、PaperScout 和 PaperArena 提供可引用、可验证、可复用的科学证据来源。
Skill Layer
Academic Search 封装多源学术检索、Query 扩展、元数据补全、开放获取判断、引用追踪、结果筛选等能力,作为 Agent Runtime 可调用的学术检索 Skill。
Agent Layer
PaperScout 围绕科研任务自主规划检索路径,调用 Academic Search 等技能,完成证据获取、筛选、组织和知识综合,把学术论文搜索转化为多轮序列决策过程。
围绕科研任务识别知识缺口,规划检索路径,决定调用哪些学术检索、引用追踪和证据工具。
调用 Academic Search 等技能完成多源检索、Query 扩展、元数据补全、开放获取判断和引用追踪。
判断哪些论文值得深入阅读,检查引用链路、实验结论、适用边界和证据可信度。
把候选结果整理为可交付证据链,并返回上层 Agent 可直接使用的结构化知识。
Evaluation Layer
PaperArena 不只检查最后答案是否正确,还诊断智能体是否能正确选择技能、读取跨论文证据、处理多模态材料,并在证据不足时修正推理过程。
评估智能体是否能在 Academic Search、引用追踪、图表解析、代码执行和数据库查询之间做出合理选择。
诊断智能体能否整合多篇论文中的方法、实验、局限性和引用关系,形成一致结论。
检查答案是否有可追踪证据支撑,引用是否准确,关键 claim 是否来自可信来源。
把过程指标转化为训练信号,为 Agentic RL 提供可观测、可优化的科研任务环境。
Application Layer
学术乐问把底层数据、Academic Search 技能、PaperScout 智能体和 PaperArena 评测能力连接到真实科研使用场景中。
用户用自然语言提出研究问题,系统返回带证据来源、引用链路和可追踪依据的回答。
围绕复杂主题执行多轮检索、相关工作发现、文献筛选、证据追踪和研究脉络整理。
为选题分析、方法比较、实验方案设计、相关工作梳理和科研写作提供证据支撑。
通过用户查询、点击、追问和采纳行为反哺检索策略、智能体规划和评测任务构造。
Resources
以下项目共同构成当前 Agentic Scientific Knowledge Acquisition Stack,可分别服务开发者、智能体、评测环境和真实科研用户。
| 模块 | 定位 | 链接 |
|---|---|---|
| Lewen-API | 数据支撑层:科学文献、元数据、引用关系、开放全文和多模态证据访问底座。 | GitHub · Docs |
| Academic Search | Skill 技能层:封装多源学术检索、Query 扩展、元数据补全、开放获取判断、引用追踪和结果筛选。 | GitHub |
| PaperScout | 智能体层:围绕科研任务自主规划检索路径,调用 Academic Search 等技能完成知识获取。 | Project · Paper |
| PaperArena | 评测层:评估工具链规划、多步推理、多模态理解、跨论文整合、数据库交互和过程级决策能力。 | Paper · Code |
| 学术乐问 | 用户应用层:面向科研用户的自然语言学术问答、深度检索、文献调研、证据追踪和研究辅助系统。 | 学术乐问 |
| 学术鲁班 | 面向科研场景的 Skills 管理、分发与共建平台,支撑科研能力单元的生态化扩展。 | luban.bdaa.pro |