自主科学知识获取关键技术研究

Core Thesis

科研 Agent 的瓶颈正在转向知识获取

Scientific Knowledge Acquisition Stack 不是更大的论文搜索框，而是面向 Science Agent 和 Autonomous Research Agent 的知识获取基础设施。

TL;DR: Lewen API 提供数据底座，Academic Search 提供可调用技能，PaperScout 负责自主知识获取，PaperArena 负责过程评测与能力诊断，学术乐问面向真实用户提供学术知识问答与深度研究服务。

Agentic AI 时代，科研智能体面对的核心挑战不只是生成答案，而是在复杂科学信息空间中主动获取、验证、组织和利用知识。科学文献、实验数据、代码资源、图表证据和领域知识持续增长，静态数据库、关键词检索和一次性 RAG 很难支撑真实科研过程中的多轮证据获取。

因此，Scientific Knowledge Acquisition 应从静态数据访问接口，推进为面向科研智能体的 Agentic Scientific Knowledge Acquisition Interface。它需要理解任务目标，识别知识缺口，规划检索路径，并在多轮交互中完成证据筛选、跨文档推理和结论修正。

科学知识获取不再是 Agent 工作流中的一个检索步骤， 而是一个可规划、可交互、可验证、可评估和可优化的智能行为过程。

Data

Lewen API · 科学数据支撑层

Skill

Academic Search · Agent Runtime 技能层

Agent

PaperScout · 自主知识获取层

Arena

PaperArena · 过程评测与诊断

User

学术乐问 · 真实用户应用层

Positioning

从静态检索到 Agentic Knowledge Acquisition

传统系统通常回答“找到什么论文”，而科研智能体需要围绕任务状态规划知识获取过程，产出可验证证据链、结构化 claim、方法边界、实验依据和可复用记忆。

Before

静态信息检索

给定 query 后返回论文列表，主要优化召回、排序和摘要呈现。系统输出通常停留在“找到什么论文”。

Now

主动知识获取

给定任务状态后规划知识获取过程，产出可验证证据链、结构化 claim、方法边界、实验依据和可复用记忆。

System Stack

五层 Stack：数据、技能、智能体、评测、应用

从 Lewen API 到 Academic Search、PaperScout、PaperArena，再到学术乐问用户系统，形成可调用、可评测、可迭代的科研知识获取闭环。

Layer 5

学术乐问 面向科研用户的前端系统，支持学术问答、深度检索、文献调研、证据追踪和研究辅助。

Layer 4

PaperArena 评估智能体在工具链规划、多步推理、多模态理解、跨论文整合、数据库交互和过程级决策中的能力。

Layer 3

PaperScout 围绕科研任务自主规划检索路径，调用 Academic Search 等技能，完成证据获取、筛选、组织和知识综合。

Layer 2

Academic Search 封装多源学术检索、Query 扩展、元数据补全、开放获取判断、引用追踪、结果筛选等能力。

Layer 1

Lewen API 提供科学文献、元数据、引用关系、开放全文、多模态证据等底层数据访问能力。

从底层科学数据到用户侧研究辅助，形成可调用、可评测、可迭代的科研知识获取闭环。

Data Layer

Lewen API：数据支撑层

Lewen API 把分散的科学信息资源转化为可组合、可追踪、可扩展的数据接口，是后续 Skill 调用、智能体规划和证据评测的基础。

Data

科学数据访问

围绕论文、元数据、引用关系、开放全文、图表证据和多模态材料提供统一接口。

Evidence

可追踪证据对象

为上层 Academic Search、PaperScout 和 PaperArena 提供可引用、可验证、可复用的科学证据来源。

Lewen API Docs GitHub 学术乐问

Skill Layer

Academic Search：Skill 技能层

Academic Search 封装多源学术检索、Query 扩展、元数据补全、开放获取判断、引用追踪、结果筛选等能力，作为 Agent Runtime 可调用的学术检索 Skill。

1

Search and Expand 执行多源学术检索、查询改写、Query 扩展和相关论文发现，提升复杂研究问题的召回覆盖。
2

Complete and Filter 补全标题、作者、摘要、venue、年份、DOI、开放获取状态等元数据，并对结果进行去重和筛选。
3

Trace and Ground 沿引用、被引、相关工作和开放全文路径追踪证据来源，为后续知识综合提供可验证依据。

Academic Search GitHub

Agent Layer

PaperScout：自主交互驱动的文献检索智能体

PaperScout 围绕科研任务自主规划检索路径，调用 Academic Search 等技能，完成证据获取、筛选、组织和知识综合，把学术论文搜索转化为多轮序列决策过程。

Plan

规划知识缺口

围绕科研任务识别知识缺口，规划检索路径，决定调用哪些学术检索、引用追踪和证据工具。

Call Skills

调用检索技能

调用 Academic Search 等技能完成多源检索、Query 扩展、元数据补全、开放获取判断和引用追踪。

Verify

验证证据可信度

判断哪些论文值得深入阅读，检查引用链路、实验结论、适用边界和证据可信度。

Synthesize

综合结构化知识

把候选结果整理为可交付证据链，并返回上层 Agent 可直接使用的结构化知识。

查看 PaperScout 相关论文

Evaluation Layer

PaperArena：过程评测与能力诊断

PaperArena 不只检查最后答案是否正确，还诊断智能体是否能正确选择技能、读取跨论文证据、处理多模态材料，并在证据不足时修正推理过程。

Tool Planning

评估智能体是否能在 Academic Search、引用追踪、图表解析、代码执行和数据库查询之间做出合理选择。

Cross-paper Reasoning

诊断智能体能否整合多篇论文中的方法、实验、局限性和引用关系，形成一致结论。

Evidence Grounding

检查答案是否有可追踪证据支撑，引用是否准确，关键 claim 是否来自可信来源。

Process Feedback

把过程指标转化为训练信号，为 Agentic RL 提供可观测、可优化的科研任务环境。

PaperArena Paper PaperArena Code

Application Layer

学术乐问：用户应用层

学术乐问把底层数据、Academic Search 技能、PaperScout 智能体和 PaperArena 评测能力连接到真实科研使用场景中。

QA

学术知识问答

用户用自然语言提出研究问题，系统返回带证据来源、引用链路和可追踪依据的回答。

Search

深度检索与文献调研

围绕复杂主题执行多轮检索、相关工作发现、文献筛选、证据追踪和研究脉络整理。

Assist

研究辅助

为选题分析、方法比较、实验方案设计、相关工作梳理和科研写作提供证据支撑。

Feedback

真实用户反馈

通过用户查询、点击、追问和采纳行为反哺检索策略、智能体规划和评测任务构造。

进入学术乐问

Resources

模块	定位	链接
Lewen-API	数据支撑层：科学文献、元数据、引用关系、开放全文和多模态证据访问底座。	GitHub · Docs
Academic Search	Skill 技能层：封装多源学术检索、Query 扩展、元数据补全、开放获取判断、引用追踪和结果筛选。	GitHub
PaperScout	智能体层：围绕科研任务自主规划检索路径，调用 Academic Search 等技能完成知识获取。	Project · Paper
PaperArena	评测层：评估工具链规划、多步推理、多模态理解、跨论文整合、数据库交互和过程级决策能力。	Paper · Code
学术乐问	用户应用层：面向科研用户的自然语言学术问答、深度检索、文献调研、证据追踪和研究辅助系统。	学术乐问
学术鲁班	面向科研场景的 Skills 管理、分发与共建平台，支撑科研能力单元的生态化扩展。	luban.bdaa.pro