如好阅读好一篇论文:
1.研究问题是什么,RQ是什么,核心claim是什么
2.证据是什么 (实验,理论,统计)
3.结果公平吗 (baseline,数据处理,超参)
4.结果会不会不稳
5.未来的工作是什么
如何练手:
复现一篇论文 -> 找到不稳定的点 -> 做一个小但清楚的改进 -> 写成技术报告
如何做好一个实验:
1.研究问题是什么,RQ是什么
2.input output 是什么,pipeline是什么
3.baseline是什么,baseline公平吗?和他比
4.success matrix 是什么 (什么被定义为成功,什么条件被定义为失败(指标A满足则为成功,指标B满足则为失败)
5.scope是什么(把哪些东西包括进了实验,哪些没有)
什么是gap
“可以用这个模板写 gap:
Although existing studies have shown A, little is known about B, especially under C. This gap matters because D. Therefore, this study investigates E.
中文就是:
尽管已有研究证明了 A,但对于 B 的理解仍然不足,尤其是在 C 场景下。这个缺口很重要,因为 D。因此,本文研究 E。
例如:
尽管已有研究证明 RAG 可以提升问答准确率,但对于中文长文档场景下引用可靠性的理解仍然不足,尤其是在检索结果包含噪声时。这个缺口很重要,因为真实应用中用户不仅需要正确答案,还需要可验证的证据来源。因此,本文研究检索噪声如何影响中文 RAG 系统的答案准确率与引用可靠性。