QQcites-skill/README.md

# QQcites

QQcites 是用于论文写作阶段“按句子/段落/性能表查找参考文献”的 Codex skill。它的核心目标不是泛泛搜索文献，而是优先使用用户本地的 Zotero、Obsidian 文献笔记和 QQnote 生成内容，为具体 manuscript claim 找到可防守、可追溯、尽量不重复的引用。

## 适用场景

- 给论文中的一句话、一个段落或一个 claim 推荐参考文献。
- 用户明确要求“需要综述”时，只推荐综述或优先推荐综述。
- 用户要求“不要重复”时，按 DOI、Zotero key、题名和第一作者年份排查重复。
- 为性能对比表筛选文献，例如光驱动器、湿度驱动器、传感器、TENG、光热效率等。
- 从本地 PDF 原文中提取参数，并判断该文献是否适合进入主表。
- 在本地文献不足时，再补充网页或数据库检索，并标注为库外或 web-sourced。

## 核心原则

1. 本地优先
   先查 QQnote/Obsidian/Zotero，再考虑网页检索。强本地证据不应被弱网页结果替代。

2. 证据优先
   文献必须真正支持当前句子或表格参数，不能只因为标题关键词相似就推荐。

3. 不重复优先
   推荐前检查当前 manuscript citation ledger 或从对话中推断已用文献。已用文献除非不可替代，否则降级或排除。

4. 综述按需
   只有用户明确说“需要综述”“综述优先”等，才强制综述；具体实验、性能、机制参数通常优先原始研究。

5. 参数可追溯
   性能参数必须记录来源层级，例如 main text、figure caption、supporting information、graph digitization、abstract only 或 calculated。

## 基本文献推荐流程

1. 拆分 claim
   将用户输入拆成一个个可引用的 claim，提取材料、机制、方法、应用、性能指标和边界条件。

2. 检查重复
   读取 manuscript-specific ledger；没有 ledger 时，至少根据当前对话中已使用的 DOI、Zotero key、题名和作者年份排重。

3. 本地检索
   优先搜索 Obsidian 文献笔记和 Zotero 元数据，必要时读取本地 PDF 原文。

4. 语义筛选
   判断候选文献是 direct、partial、background、weak、contradictory，还是 metadata-only candidate。

5. 排序输出
   按相关度、证据强度、文献类型、是否重复、元数据完整性排序。

6. 记录 ledger
   输出后应能追加到 used-reference log 或 performance-table ledger。

## 新增能力：向 Nature 系列 skill 对齐

这次补充后，QQcites 增加了几个更适合长文本和原文参数追踪的规则。

### 1. 稳定分段编号

当用户输入长段落或多句话时，应先拆成稳定片段：

```text
S001, S002, S003 ...
```

每个片段应记录 claim type，例如：

- background
- review-context
- mechanism
- material-property
- method
- characterization
- performance
- application
- limitation

这样后续可以明确知道“哪一句对应哪篇文献”，也方便检查重复引用。

### 2. 更规范的支持等级

推荐文献时使用更细的支持等级：

| 等级 | 含义 |
|---|---|
| strong support | 直接支持该句或该参数。 |
| partial support | 只支持其中一部分，需要拆句或降调。 |
| background support | 适合作为背景综述，不适合支撑具体实验结论。 |
| contradictory/limiting | 与原句冲突或限制原句范围。 |
| metadata-only candidate | 只看了题名/元数据，还没有查摘要或原文，不能直接引用。 |
| weak | 关键词相似但支持很弱。 |
| unrelated | 不相关，排除。 |

### 3. Evidence note 模板

重要引用应尽量按下面结构记录：

```text
Segment: S001
Claim: 原始句子或 claim
Candidate: 作者/年份/题名/期刊/DOI/Zotero key
Support grade: strong / partial / background / contradictory / metadata-only / weak
Evidence basis: local note / Zotero metadata / abstract / main text p.X / figure caption / SI / publisher page
Reasoning: 为什么支持或不支持
Caveat: 是否重复、是否图读数、是否角度型、是否总功率等
Citation wording: 建议插入位置或建议改写
```

### 4. 来源分级

QQcites 的检索源按可靠性分层：

| 层级 | 来源 | 用法 |
|---|---|---|
| T0 | 本地 Zotero、Obsidian、QQnote、PDF | 默认优先，最符合用户论文上下文。 |
| T1 | DOI/CrossRef、publisher page、PubMed | 用于元数据验证和官方页面核查。 |
| T2 | Semantic Scholar、arXiv/bioRxiv/medRxiv | 扩展发现和引用网络。 |
| T3 | Google Scholar、普通网页、CNKI/万方手动结果 | 最后兜底，必须标注风险。 |

### 5. 引用验证模式

当用户不是“找文献”，而是“检查参考文献列表”时，应进入 verification 模式：

| 状态 | 含义 |
|---|---|
| verified | DOI 或官方元数据核对正确。 |
| duplicate | 同一文献重复出现。 |
| mismatch | 题名、期刊、年份、作者或 DOI 不一致。 |
| not_found | 没有可靠匹配。 |
| suspicious | 疑似乱码、页码异常、期刊不匹配等。 |
| manual_needed | 信息太少，需要人工确认。 |

### 6. Source map

查原文参数时，应记录 source map，而不是只写“主文提到”。

最少记录：

- 参数 ID，例如 `P001`
- 题名、DOI、Zotero key
- 参数名和值
- 单位
- 来源等级
- 页码、图号、表号或 SI 位置
- 原文短摘录
- 换算公式和假设
- 风险说明

### 7. 长文本批处理

如果输入超过 10 个可引用片段，应批处理：

- 1-10 段：正常处理。
- 11-25 段：每批约 10 段，最后合并去重。
- 26 段以上：按 manuscript section 拆分，再合并 DOI 去重。

### 8. 文献导出

如果用户要求导出，应支持准备：

- RIS
- BibTeX
- ENW

只导出已验证元数据；缺失字段留空并标注 metadata incomplete，不编造 DOI、卷期页码。

## 性能对比表方法论

性能表不能只按关键词找文献。先定义硬性纳入标准，再筛选主表文献。

常见纳入标准：

- 材料体系是否匹配，例如 MOF 基、BC 基、MXene 基等。
- 刺激类型是否匹配，例如光驱动、湿度驱动、电驱动、TENG 等。
- 是否为原始研究，而不是综述。
- 是否报告目标参数，例如曲率、光强、响应时间、温升、光热效率。
- 单位是否能统一。
- 是否在本地 Zotero/Obsidian 中存在。

默认分层：

| 分层 | 含义 |
|---|---|
| main-table usable | 可进主表。原始研究，材料/刺激匹配，直接给目标参数或可可靠换算。 |
| supplemental comparison | 可做补充对照。相关但报告的是角度、速度、位移、应用演示等不同指标。 |
| not recommended | 不建议使用。综述、非目标材料、非目标刺激、无性能参数或只做背景支持。 |

## 参数来源等级

每个性能参数都应标注来源：

| 来源等级 | 用法 |
|---|---|
| main text | 正文直接给出数值。 |
| figure caption | 图注给出数值。 |
| supporting information | SI 或 Supplementary Note/Table/Figure 中给出。 |
| graph digitization | 已经从图中读数。 |
| needs digitization | 只能在图中看到趋势，尚未读数。 |
| abstract only | 仅摘要中出现。 |
| calculated | 根据原文参数换算或计算。 |

如果值来自图读数，必须标注 `graph digitization`。如果还没有读数，只能标注 `needs digitization`，不能当成原文直接报道值。

## 单位统一规则

- 曲率统一为 `cm^-1`。
- `1 mm^-1 = 10 cm^-1`。
- 光强统一为 `mW cm^-2`。
- `1 W cm^-2 = 1000 mW cm^-2`。
- 如果原文只给总功率，例如 `125 mW`，但没有照射面积，应写 `total power, not normalized`，不能直接换算成 `mW cm^-2`。
- 最高温度、温升和光热转换效率不是同一个指标，应分别记录为 `Tmax`、`Delta T` 和 `photothermal conversion efficiency`。

角度转曲率只在有效长度明确时使用：

```text
kappa = theta(rad) / L(cm)
```

如果缺少有效长度或几何不适合换算，应写 `not convertible from main text`。

## 推荐输出格式

句子引用推荐：

| Rank | Citation candidate | Type | Strength | Why it fits | Suggested use |
|---:|---|---|---|---|---|
| 1 | Title. Journal, Year. DOI: ... | review/primary | direct/background | ... | Cite after clause ... |

性能表推荐：

| 文献 | 材料体系 | 刺激与强度 | 响应时间 | 最大性能 | 关键备注 |
|---|---|---:|---:|---:|---|
| Journal volume (year) pages | MOF/system | 300 mW cm^-2 | 10 s | 1.20 cm^-1 | main text; local Zotero |

不可比文献应单独列出：

| 文献 | 原因 |
|---|---|
| Title, Year | angle-only; effective length missing |
| Title, Year | figure only; needs digitization |

## 与 Nature 系列 skill 的差异

QQcites 更偏向用户本地文献库和材料科学论文写作；Nature 系列 skill 更偏向 Nature/CNS 范围、在线结构化检索、引用导出和全文 source map。

QQcites 已吸收的关键方法包括：

- 分段 claim 检索。
- 支持等级判断。
- DOI/Zotero key/title/author 去重。
- 本地 PDF 原文参数抽取。
- 性能表纳入/排除标准。
- 图读数和单位换算风险标注。

后续可继续增强：

- 稳定 claim ID，例如 `S001`、`S002`。
- RIS/BibTeX/ENW 导出。
- citation verification 模式。
- 图表 source map，记录页码、图号、表号和参数来源。