QQcites-skill/README.md

258 lines
9.3 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# QQcites
QQcites 是用于论文写作阶段“按句子/段落/性能表查找参考文献”的 Codex skill。它的核心目标不是泛泛搜索文献而是优先使用用户本地的 Zotero、Obsidian 文献笔记和 QQnote 生成内容,为具体 manuscript claim 找到可防守、可追溯、尽量不重复的引用。
## 适用场景
- 给论文中的一句话、一个段落或一个 claim 推荐参考文献。
- 用户明确要求“需要综述”时,只推荐综述或优先推荐综述。
- 用户要求“不要重复”时,按 DOI、Zotero key、题名和第一作者年份排查重复。
- 为性能对比表筛选文献例如光驱动器、湿度驱动器、传感器、TENG、光热效率等。
- 从本地 PDF 原文中提取参数,并判断该文献是否适合进入主表。
- 在本地文献不足时,再补充网页或数据库检索,并标注为库外或 web-sourced。
## 核心原则
1. 本地优先
先查 QQnote/Obsidian/Zotero再考虑网页检索。强本地证据不应被弱网页结果替代。
2. 证据优先
文献必须真正支持当前句子或表格参数,不能只因为标题关键词相似就推荐。
3. 不重复优先
推荐前检查当前 manuscript citation ledger 或从对话中推断已用文献。已用文献除非不可替代,否则降级或排除。
4. 综述按需
只有用户明确说“需要综述”“综述优先”等,才强制综述;具体实验、性能、机制参数通常优先原始研究。
5. 参数可追溯
性能参数必须记录来源层级,例如 main text、figure caption、supporting information、graph digitization、abstract only 或 calculated。
## 基本文献推荐流程
1. 拆分 claim
将用户输入拆成一个个可引用的 claim提取材料、机制、方法、应用、性能指标和边界条件。
2. 检查重复
读取 manuscript-specific ledger没有 ledger 时,至少根据当前对话中已使用的 DOI、Zotero key、题名和作者年份排重。
3. 本地检索
优先搜索 Obsidian 文献笔记和 Zotero 元数据,必要时读取本地 PDF 原文。
4. 语义筛选
判断候选文献是 direct、partial、background、weak、contradictory还是 metadata-only candidate。
5. 排序输出
按相关度、证据强度、文献类型、是否重复、元数据完整性排序。
6. 记录 ledger
输出后应能追加到 used-reference log 或 performance-table ledger。
## 新增能力:向 Nature 系列 skill 对齐
这次补充后QQcites 增加了几个更适合长文本和原文参数追踪的规则。
### 1. 稳定分段编号
当用户输入长段落或多句话时,应先拆成稳定片段:
```text
S001, S002, S003 ...
```
每个片段应记录 claim type例如
- background
- review-context
- mechanism
- material-property
- method
- characterization
- performance
- application
- limitation
这样后续可以明确知道“哪一句对应哪篇文献”,也方便检查重复引用。
### 2. 更规范的支持等级
推荐文献时使用更细的支持等级:
| 等级 | 含义 |
|---|---|
| strong support | 直接支持该句或该参数。 |
| partial support | 只支持其中一部分,需要拆句或降调。 |
| background support | 适合作为背景综述,不适合支撑具体实验结论。 |
| contradictory/limiting | 与原句冲突或限制原句范围。 |
| metadata-only candidate | 只看了题名/元数据,还没有查摘要或原文,不能直接引用。 |
| weak | 关键词相似但支持很弱。 |
| unrelated | 不相关,排除。 |
### 3. Evidence note 模板
重要引用应尽量按下面结构记录:
```text
Segment: S001
Claim: 原始句子或 claim
Candidate: 作者/年份/题名/期刊/DOI/Zotero key
Support grade: strong / partial / background / contradictory / metadata-only / weak
Evidence basis: local note / Zotero metadata / abstract / main text p.X / figure caption / SI / publisher page
Reasoning: 为什么支持或不支持
Caveat: 是否重复、是否图读数、是否角度型、是否总功率等
Citation wording: 建议插入位置或建议改写
```
### 4. 来源分级
QQcites 的检索源按可靠性分层:
| 层级 | 来源 | 用法 |
|---|---|---|
| T0 | 本地 Zotero、Obsidian、QQnote、PDF | 默认优先,最符合用户论文上下文。 |
| T1 | DOI/CrossRef、publisher page、PubMed | 用于元数据验证和官方页面核查。 |
| T2 | Semantic Scholar、arXiv/bioRxiv/medRxiv | 扩展发现和引用网络。 |
| T3 | Google Scholar、普通网页、CNKI/万方手动结果 | 最后兜底,必须标注风险。 |
### 5. 引用验证模式
当用户不是“找文献”,而是“检查参考文献列表”时,应进入 verification 模式:
| 状态 | 含义 |
|---|---|
| verified | DOI 或官方元数据核对正确。 |
| duplicate | 同一文献重复出现。 |
| mismatch | 题名、期刊、年份、作者或 DOI 不一致。 |
| not_found | 没有可靠匹配。 |
| suspicious | 疑似乱码、页码异常、期刊不匹配等。 |
| manual_needed | 信息太少,需要人工确认。 |
### 6. Source map
查原文参数时,应记录 source map而不是只写“主文提到”。
最少记录:
- 参数 ID例如 `P001`
- 题名、DOI、Zotero key
- 参数名和值
- 单位
- 来源等级
- 页码、图号、表号或 SI 位置
- 原文短摘录
- 换算公式和假设
- 风险说明
### 7. 长文本批处理
如果输入超过 10 个可引用片段,应批处理:
- 1-10 段:正常处理。
- 11-25 段:每批约 10 段,最后合并去重。
- 26 段以上:按 manuscript section 拆分,再合并 DOI 去重。
### 8. 文献导出
如果用户要求导出,应支持准备:
- RIS
- BibTeX
- ENW
只导出已验证元数据;缺失字段留空并标注 metadata incomplete不编造 DOI、卷期页码。
## 性能对比表方法论
性能表不能只按关键词找文献。先定义硬性纳入标准,再筛选主表文献。
常见纳入标准:
- 材料体系是否匹配,例如 MOF 基、BC 基、MXene 基等。
- 刺激类型是否匹配例如光驱动、湿度驱动、电驱动、TENG 等。
- 是否为原始研究,而不是综述。
- 是否报告目标参数,例如曲率、光强、响应时间、温升、光热效率。
- 单位是否能统一。
- 是否在本地 Zotero/Obsidian 中存在。
默认分层:
| 分层 | 含义 |
|---|---|
| main-table usable | 可进主表。原始研究,材料/刺激匹配,直接给目标参数或可可靠换算。 |
| supplemental comparison | 可做补充对照。相关但报告的是角度、速度、位移、应用演示等不同指标。 |
| not recommended | 不建议使用。综述、非目标材料、非目标刺激、无性能参数或只做背景支持。 |
## 参数来源等级
每个性能参数都应标注来源:
| 来源等级 | 用法 |
|---|---|
| main text | 正文直接给出数值。 |
| figure caption | 图注给出数值。 |
| supporting information | SI 或 Supplementary Note/Table/Figure 中给出。 |
| graph digitization | 已经从图中读数。 |
| needs digitization | 只能在图中看到趋势,尚未读数。 |
| abstract only | 仅摘要中出现。 |
| calculated | 根据原文参数换算或计算。 |
如果值来自图读数,必须标注 `graph digitization`。如果还没有读数,只能标注 `needs digitization`,不能当成原文直接报道值。
## 单位统一规则
- 曲率统一为 `cm^-1`
- `1 mm^-1 = 10 cm^-1`
- 光强统一为 `mW cm^-2`
- `1 W cm^-2 = 1000 mW cm^-2`
- 如果原文只给总功率,例如 `125 mW`,但没有照射面积,应写 `total power, not normalized`,不能直接换算成 `mW cm^-2`
- 最高温度、温升和光热转换效率不是同一个指标,应分别记录为 `Tmax`、`Delta T` 和 `photothermal conversion efficiency`
角度转曲率只在有效长度明确时使用:
```text
kappa = theta(rad) / L(cm)
```
如果缺少有效长度或几何不适合换算,应写 `not convertible from main text`
## 推荐输出格式
句子引用推荐:
| Rank | Citation candidate | Type | Strength | Why it fits | Suggested use |
|---:|---|---|---|---|---|
| 1 | Title. Journal, Year. DOI: ... | review/primary | direct/background | ... | Cite after clause ... |
性能表推荐:
| 文献 | 材料体系 | 刺激与强度 | 响应时间 | 最大性能 | 关键备注 |
|---|---|---:|---:|---:|---|
| Journal volume (year) pages | MOF/system | 300 mW cm^-2 | 10 s | 1.20 cm^-1 | main text; local Zotero |
不可比文献应单独列出:
| 文献 | 原因 |
|---|---|
| Title, Year | angle-only; effective length missing |
| Title, Year | figure only; needs digitization |
## 与 Nature 系列 skill 的差异
QQcites 更偏向用户本地文献库和材料科学论文写作Nature 系列 skill 更偏向 Nature/CNS 范围、在线结构化检索、引用导出和全文 source map。
QQcites 已吸收的关键方法包括:
- 分段 claim 检索。
- 支持等级判断。
- DOI/Zotero key/title/author 去重。
- 本地 PDF 原文参数抽取。
- 性能表纳入/排除标准。
- 图读数和单位换算风险标注。
后续可继续增强:
- 稳定 claim ID例如 `S001`、`S002`。
- RIS/BibTeX/ENW 导出。
- citation verification 模式。
- 图表 source map记录页码、图号、表号和参数来源。