258 lines
9.3 KiB
Markdown
258 lines
9.3 KiB
Markdown
# QQcites
|
||
|
||
QQcites 是用于论文写作阶段“按句子/段落/性能表查找参考文献”的 Codex skill。它的核心目标不是泛泛搜索文献,而是优先使用用户本地的 Zotero、Obsidian 文献笔记和 QQnote 生成内容,为具体 manuscript claim 找到可防守、可追溯、尽量不重复的引用。
|
||
|
||
## 适用场景
|
||
|
||
- 给论文中的一句话、一个段落或一个 claim 推荐参考文献。
|
||
- 用户明确要求“需要综述”时,只推荐综述或优先推荐综述。
|
||
- 用户要求“不要重复”时,按 DOI、Zotero key、题名和第一作者年份排查重复。
|
||
- 为性能对比表筛选文献,例如光驱动器、湿度驱动器、传感器、TENG、光热效率等。
|
||
- 从本地 PDF 原文中提取参数,并判断该文献是否适合进入主表。
|
||
- 在本地文献不足时,再补充网页或数据库检索,并标注为库外或 web-sourced。
|
||
|
||
## 核心原则
|
||
|
||
1. 本地优先
|
||
先查 QQnote/Obsidian/Zotero,再考虑网页检索。强本地证据不应被弱网页结果替代。
|
||
|
||
2. 证据优先
|
||
文献必须真正支持当前句子或表格参数,不能只因为标题关键词相似就推荐。
|
||
|
||
3. 不重复优先
|
||
推荐前检查当前 manuscript citation ledger 或从对话中推断已用文献。已用文献除非不可替代,否则降级或排除。
|
||
|
||
4. 综述按需
|
||
只有用户明确说“需要综述”“综述优先”等,才强制综述;具体实验、性能、机制参数通常优先原始研究。
|
||
|
||
5. 参数可追溯
|
||
性能参数必须记录来源层级,例如 main text、figure caption、supporting information、graph digitization、abstract only 或 calculated。
|
||
|
||
## 基本文献推荐流程
|
||
|
||
1. 拆分 claim
|
||
将用户输入拆成一个个可引用的 claim,提取材料、机制、方法、应用、性能指标和边界条件。
|
||
|
||
2. 检查重复
|
||
读取 manuscript-specific ledger;没有 ledger 时,至少根据当前对话中已使用的 DOI、Zotero key、题名和作者年份排重。
|
||
|
||
3. 本地检索
|
||
优先搜索 Obsidian 文献笔记和 Zotero 元数据,必要时读取本地 PDF 原文。
|
||
|
||
4. 语义筛选
|
||
判断候选文献是 direct、partial、background、weak、contradictory,还是 metadata-only candidate。
|
||
|
||
5. 排序输出
|
||
按相关度、证据强度、文献类型、是否重复、元数据完整性排序。
|
||
|
||
6. 记录 ledger
|
||
输出后应能追加到 used-reference log 或 performance-table ledger。
|
||
|
||
## 新增能力:向 Nature 系列 skill 对齐
|
||
|
||
这次补充后,QQcites 增加了几个更适合长文本和原文参数追踪的规则。
|
||
|
||
### 1. 稳定分段编号
|
||
|
||
当用户输入长段落或多句话时,应先拆成稳定片段:
|
||
|
||
```text
|
||
S001, S002, S003 ...
|
||
```
|
||
|
||
每个片段应记录 claim type,例如:
|
||
|
||
- background
|
||
- review-context
|
||
- mechanism
|
||
- material-property
|
||
- method
|
||
- characterization
|
||
- performance
|
||
- application
|
||
- limitation
|
||
|
||
这样后续可以明确知道“哪一句对应哪篇文献”,也方便检查重复引用。
|
||
|
||
### 2. 更规范的支持等级
|
||
|
||
推荐文献时使用更细的支持等级:
|
||
|
||
| 等级 | 含义 |
|
||
|---|---|
|
||
| strong support | 直接支持该句或该参数。 |
|
||
| partial support | 只支持其中一部分,需要拆句或降调。 |
|
||
| background support | 适合作为背景综述,不适合支撑具体实验结论。 |
|
||
| contradictory/limiting | 与原句冲突或限制原句范围。 |
|
||
| metadata-only candidate | 只看了题名/元数据,还没有查摘要或原文,不能直接引用。 |
|
||
| weak | 关键词相似但支持很弱。 |
|
||
| unrelated | 不相关,排除。 |
|
||
|
||
### 3. Evidence note 模板
|
||
|
||
重要引用应尽量按下面结构记录:
|
||
|
||
```text
|
||
Segment: S001
|
||
Claim: 原始句子或 claim
|
||
Candidate: 作者/年份/题名/期刊/DOI/Zotero key
|
||
Support grade: strong / partial / background / contradictory / metadata-only / weak
|
||
Evidence basis: local note / Zotero metadata / abstract / main text p.X / figure caption / SI / publisher page
|
||
Reasoning: 为什么支持或不支持
|
||
Caveat: 是否重复、是否图读数、是否角度型、是否总功率等
|
||
Citation wording: 建议插入位置或建议改写
|
||
```
|
||
|
||
### 4. 来源分级
|
||
|
||
QQcites 的检索源按可靠性分层:
|
||
|
||
| 层级 | 来源 | 用法 |
|
||
|---|---|---|
|
||
| T0 | 本地 Zotero、Obsidian、QQnote、PDF | 默认优先,最符合用户论文上下文。 |
|
||
| T1 | DOI/CrossRef、publisher page、PubMed | 用于元数据验证和官方页面核查。 |
|
||
| T2 | Semantic Scholar、arXiv/bioRxiv/medRxiv | 扩展发现和引用网络。 |
|
||
| T3 | Google Scholar、普通网页、CNKI/万方手动结果 | 最后兜底,必须标注风险。 |
|
||
|
||
### 5. 引用验证模式
|
||
|
||
当用户不是“找文献”,而是“检查参考文献列表”时,应进入 verification 模式:
|
||
|
||
| 状态 | 含义 |
|
||
|---|---|
|
||
| verified | DOI 或官方元数据核对正确。 |
|
||
| duplicate | 同一文献重复出现。 |
|
||
| mismatch | 题名、期刊、年份、作者或 DOI 不一致。 |
|
||
| not_found | 没有可靠匹配。 |
|
||
| suspicious | 疑似乱码、页码异常、期刊不匹配等。 |
|
||
| manual_needed | 信息太少,需要人工确认。 |
|
||
|
||
### 6. Source map
|
||
|
||
查原文参数时,应记录 source map,而不是只写“主文提到”。
|
||
|
||
最少记录:
|
||
|
||
- 参数 ID,例如 `P001`
|
||
- 题名、DOI、Zotero key
|
||
- 参数名和值
|
||
- 单位
|
||
- 来源等级
|
||
- 页码、图号、表号或 SI 位置
|
||
- 原文短摘录
|
||
- 换算公式和假设
|
||
- 风险说明
|
||
|
||
### 7. 长文本批处理
|
||
|
||
如果输入超过 10 个可引用片段,应批处理:
|
||
|
||
- 1-10 段:正常处理。
|
||
- 11-25 段:每批约 10 段,最后合并去重。
|
||
- 26 段以上:按 manuscript section 拆分,再合并 DOI 去重。
|
||
|
||
### 8. 文献导出
|
||
|
||
如果用户要求导出,应支持准备:
|
||
|
||
- RIS
|
||
- BibTeX
|
||
- ENW
|
||
|
||
只导出已验证元数据;缺失字段留空并标注 metadata incomplete,不编造 DOI、卷期页码。
|
||
|
||
## 性能对比表方法论
|
||
|
||
性能表不能只按关键词找文献。先定义硬性纳入标准,再筛选主表文献。
|
||
|
||
常见纳入标准:
|
||
|
||
- 材料体系是否匹配,例如 MOF 基、BC 基、MXene 基等。
|
||
- 刺激类型是否匹配,例如光驱动、湿度驱动、电驱动、TENG 等。
|
||
- 是否为原始研究,而不是综述。
|
||
- 是否报告目标参数,例如曲率、光强、响应时间、温升、光热效率。
|
||
- 单位是否能统一。
|
||
- 是否在本地 Zotero/Obsidian 中存在。
|
||
|
||
默认分层:
|
||
|
||
| 分层 | 含义 |
|
||
|---|---|
|
||
| main-table usable | 可进主表。原始研究,材料/刺激匹配,直接给目标参数或可可靠换算。 |
|
||
| supplemental comparison | 可做补充对照。相关但报告的是角度、速度、位移、应用演示等不同指标。 |
|
||
| not recommended | 不建议使用。综述、非目标材料、非目标刺激、无性能参数或只做背景支持。 |
|
||
|
||
## 参数来源等级
|
||
|
||
每个性能参数都应标注来源:
|
||
|
||
| 来源等级 | 用法 |
|
||
|---|---|
|
||
| main text | 正文直接给出数值。 |
|
||
| figure caption | 图注给出数值。 |
|
||
| supporting information | SI 或 Supplementary Note/Table/Figure 中给出。 |
|
||
| graph digitization | 已经从图中读数。 |
|
||
| needs digitization | 只能在图中看到趋势,尚未读数。 |
|
||
| abstract only | 仅摘要中出现。 |
|
||
| calculated | 根据原文参数换算或计算。 |
|
||
|
||
如果值来自图读数,必须标注 `graph digitization`。如果还没有读数,只能标注 `needs digitization`,不能当成原文直接报道值。
|
||
|
||
## 单位统一规则
|
||
|
||
- 曲率统一为 `cm^-1`。
|
||
- `1 mm^-1 = 10 cm^-1`。
|
||
- 光强统一为 `mW cm^-2`。
|
||
- `1 W cm^-2 = 1000 mW cm^-2`。
|
||
- 如果原文只给总功率,例如 `125 mW`,但没有照射面积,应写 `total power, not normalized`,不能直接换算成 `mW cm^-2`。
|
||
- 最高温度、温升和光热转换效率不是同一个指标,应分别记录为 `Tmax`、`Delta T` 和 `photothermal conversion efficiency`。
|
||
|
||
角度转曲率只在有效长度明确时使用:
|
||
|
||
```text
|
||
kappa = theta(rad) / L(cm)
|
||
```
|
||
|
||
如果缺少有效长度或几何不适合换算,应写 `not convertible from main text`。
|
||
|
||
## 推荐输出格式
|
||
|
||
句子引用推荐:
|
||
|
||
| Rank | Citation candidate | Type | Strength | Why it fits | Suggested use |
|
||
|---:|---|---|---|---|---|
|
||
| 1 | Title. Journal, Year. DOI: ... | review/primary | direct/background | ... | Cite after clause ... |
|
||
|
||
性能表推荐:
|
||
|
||
| 文献 | 材料体系 | 刺激与强度 | 响应时间 | 最大性能 | 关键备注 |
|
||
|---|---|---:|---:|---:|---|
|
||
| Journal volume (year) pages | MOF/system | 300 mW cm^-2 | 10 s | 1.20 cm^-1 | main text; local Zotero |
|
||
|
||
不可比文献应单独列出:
|
||
|
||
| 文献 | 原因 |
|
||
|---|---|
|
||
| Title, Year | angle-only; effective length missing |
|
||
| Title, Year | figure only; needs digitization |
|
||
|
||
## 与 Nature 系列 skill 的差异
|
||
|
||
QQcites 更偏向用户本地文献库和材料科学论文写作;Nature 系列 skill 更偏向 Nature/CNS 范围、在线结构化检索、引用导出和全文 source map。
|
||
|
||
QQcites 已吸收的关键方法包括:
|
||
|
||
- 分段 claim 检索。
|
||
- 支持等级判断。
|
||
- DOI/Zotero key/title/author 去重。
|
||
- 本地 PDF 原文参数抽取。
|
||
- 性能表纳入/排除标准。
|
||
- 图读数和单位换算风险标注。
|
||
|
||
后续可继续增强:
|
||
|
||
- 稳定 claim ID,例如 `S001`、`S002`。
|
||
- RIS/BibTeX/ENW 导出。
|
||
- citation verification 模式。
|
||
- 图表 source map,记录页码、图号、表号和参数来源。
|