6/9 - 林鹏蓁的个人网站

如好阅读好一篇论文：

1.研究问题是什么，RQ是什么，核心claim是什么
2.证据是什么（实验，理论，统计）
3.结果公平吗（baseline，数据处理，超参）
4.结果会不会不稳
5.未来的工作是什么

如何练手：
复现一篇论文 -> 找到不稳定的点 -> 做一个小但清楚的改进 -> 写成技术报告

如何做好一个实验：

1.研究问题是什么，RQ是什么
2.input output 是什么，pipeline是什么
3.baseline是什么，baseline公平吗？和他比
4.success matrix 是什么（什么被定义为成功，什么条件被定义为失败（指标A满足则为成功，指标B满足则为失败）
5.scope是什么（把哪些东西包括进了实验，哪些没有）

什么是gap

“可以用这个模板写 gap：

Although existing studies have shown A, little is known about B, especially under C. This gap matters because D. Therefore, this study investigates E.

中文就是：

尽管已有研究证明了 A，但对于 B 的理解仍然不足，尤其是在 C 场景下。这个缺口很重要，因为 D。因此，本文研究 E。

例如：

尽管已有研究证明 RAG 可以提升问答准确率，但对于中文长文档场景下引用可靠性的理解仍然不足，尤其是在检索结果包含噪声时。这个缺口很重要，因为真实应用中用户不仅需要正确答案，还需要可验证的证据来源。因此，本文研究检索噪声如何影响中文 RAG 系统的答案准确率与引用可靠性。