前言(本文内容由AI生成)
这篇文章记录一次使用 AI 智能体协助完成论文 camera-ready 版本筹备的完整过程。任务目标不是简单地让智能体“给建议”,而是让它直接参与本地文件处理:读取提交要求、整理 LaTeX 工程、修复编译问题、生成 PDF 和源码压缩包、检查 Springer 表格、根据 reviewer comments 规划并修改论文,最后输出一组可审阅、可追溯的辅助文档。
本次工作的原始目录位于:
1 | D:\研究生\科研\论文\camera-ready |
在 WSL 环境中的路径为:
1 | /mnt/d/研究生/科研/论文/camera-ready |
最终形成了两个主要版本:
v1/:整理后的第一版 camera-ready LaTeX、PDF 和源码 zip;v2/:基于 reviewer comments 修改后的版本,以及实际改动记录、段落级前后对比、未完全处理项报告等辅助材料。
使用的 Skill
本次主要使用的智能体 Skill 是:
1 | latex-camera-ready-packaging |
这个 Skill 的作用是指导智能体完成 LaTeX camera-ready / Springer LNCS / EasyChair 相关工作,包括:
- 检查提交要求和源码包;
- 在安全目录中解压和整理 LaTeX 工程;
- 识别主
.tex文件、图片、BibTeX、class/style 依赖; - 编译并修复阻塞性 LaTeX/BibTeX 错误;
- 验证 PDF 页数、参考文献起始页、A4/Letter 页面大小;
- 清理不应上传的模板文件和构建产物;
- 生成最终 PDF 和 source zip;
- 检查 Springer copyright form;
- 基于 reviewer comments 生成修改计划;
- 实际修改 v2 论文,并记录 actual changes、before/after、remaining gaps。
它不是某一次任务临时生成的总结文档,而是一个可复用的工作流规范。智能体会根据这个 Skill 中的步骤执行具体操作。
整体工作流概览
这次 camera-ready 准备过程可以拆成 8 个阶段:
1 | 1. 读取 camera-ready 要求 |
下面按阶段记录每一步的输入、处理方式和产出。
阶段一:读取 camera-ready 要求
首先,智能体读取了目录中的 camera-ready.md,确认 camera-ready 阶段需要提交的材料。
主要确认项包括:
- LaTeX source 或 RTF 源文件;
- final PDF;
- reviewer comments;
- Springer copyright form;
- EasyChair 上传材料。
这一阶段的价值在于先确认“最终要交什么”,避免后续只生成 PDF,却遗漏源码压缩包或版权表格。
阶段二:整理和验证 v1 LaTeX/PDF/zip
用户提供的原始 LaTeX 包中,主文件仍使用模板式命名,例如 samplepaper.tex。智能体首先将源码解压到工作目录,再识别真正用于编译的主文件、图片、BibTeX 文件和 LNCS 模板依赖。
处理内容包括:
- 解压原始 LaTeX zip;
- 识别主文件
samplepaper.tex; - 检查依赖文件:
llncs.cls;splncs04.bst;references.bib;- 论文中实际使用的 figures;
- 安装缺失的 LaTeX 编译依赖;
- 修复
references.bib中重复 BibTeX entry; - 将主文件改名为
main.tex; - 删除模板说明文件、未使用图片和构建产物;
- 生成 v1 PDF;
- 生成 v1 LaTeX source zip;
- 从干净目录重新编译验证。
这一阶段的主要输出为:
1 | v1/latex/ |
验证结果显示:
1 | Pages: 18 |
也就是说,PDF 总页数为 18 页,参考文献从第 17 页开始,正文部分控制在 16 页以内,符合 “16 pages excluding bibliography” 的限制。
阶段三:拆分 LaTeX 章节
为了便于后续根据 reviewer comments 逐章修改,智能体将原本集中在一个主文件中的论文内容拆分成多个章节文件。
处理后的结构大致为:
1 | v1/latex/main.tex |
这样做的好处是后续修改更可控。比如 reviewer 提到 Running Example、Formal Definitions 或 Algorithm 的问题时,可以直接定位到对应章节文件,而不是在一个很长的 main.tex 中反复查找。
拆分后,智能体重新编译 PDF 并刷新 zip,避免因为结构调整导致最终上传包和 PDF 不一致。
阶段四:Springer copyright form 处理
除论文源码和 PDF 外,camera-ready 还涉及 Springer copyright form。智能体对用户提供或下载的表格进行了检查。
检查内容包括:
- 文件是否可以正常打开;
.docx和.pdf是否匹配;- PDF 页数是否正常;
- 签名区域是否存在明显问题;
Volume Editor(s)、会议名称等字段是否需要进一步确认。
这一步没有简单地把文件当作“已完成”,而是提醒了不确定字段。例如:Program Co-Chairs 不一定等同于 Volume Editors,因此相关字段最好以会议方或 Springer 通知为准。
阶段五:分析 reviewer comments 并生成修改计划
当用户提供 Review.md 后,智能体没有直接修改论文,而是先读取 reviewer comments 和当前 LaTeX 章节,生成了一个修改计划:
1 | v2/review_action_plan.md |
这个计划按照 reviewer comments 逐条分析,包含:
- reviewer 提出的具体问题;
- 当前论文中对应的位置;
- 可以在不新增实验的前提下进行的修改;
- 哪些内容不能凭空补充;
- 哪些要求只能写入 limitation、threats to validity 或 future work。
本次用户明确要求“不进行额外实验分析”,因此智能体在计划中遵守了一个重要原则:
不虚构实验结果,不编造 success rate、validity rate,也不声称完成了没有实际运行的多模型或 SOTA 对比实验。
这个原则对学术论文修改非常关键。对于 reviewer 希望看到但当前无法新增实验支持的内容,正确处理方式是澄清方法、补充威胁、说明局限,而不是制造不存在的数据。
阶段六:基于 review_action_plan.md 实际修改 v2
在生成修改计划后,智能体复制 v1 LaTeX 工程作为 v2 工作区:
1 | v2/latex/ |
然后按照修改计划逐章编辑。
Running Example
在 Running Example 中,主要补充和修正了:
- Triplex outputs 在 oracle checking / fault detection 中的作用;
- A1–A4 是 LLM 生成后经过检查和 normalization 的 actions;
- RM-003、RM-004 的 scenario coverage;
- 若干标点和空格问题,例如
.This、.Specifically这类排版错误。
Formal Definitions
在 Formal Definitions 中,补充了多个符号定义:
Σ;σ;σ_S;ρ;I_T;- STL 中的
Goperator。
同时还增加了 Triplex A3 formal action tuple 示例,并解释 scenario occurrence 是否允许 gap。当前实现采用 contiguous intervals,因此文中也进行了相应说明。
Framework / Algorithms
Framework 章节是本次修改的重点之一。智能体补充了:
- LLM output schema 检查;
- signal 检查;
- STL parser 检查;
- regeneration / normalization 机制;
x1, x2, x3是测试生成阶段的搜索变量;- Algorithm 1 的重复行和模糊表达修正;
- Algorithm 3 的 candidate generation、input bounds、candidate pool、maximum iterations 和 termination condition。
此外,还增加了 Compatible / compatibility check 的解释,用来回应 reviewer 对随机组合 scenario 是否可能 meaningless 的担忧。
Experimental Evaluation
实验章节中主要完成了:
- 修复
DeepSeek [7]这类 citation 格式问题; - 修复 citation after period 问题;
- 修复 Table 2 caption;
- 补充 RQ3 fault seeding protocol;
- 解释 NN 模型中 FRR 较低以及 baseline 为 0 的原因;
- 扩展 Threats to Validity。
Threats 中特别补充了以下限制:
- 未系统比较多个 LLM;
- action extraction completeness 没有形式化保证;
- STL constraint generation success rate 未系统报告;
- scenario validity rate 未系统报告;
- 未覆盖所有 SOTA Simulink testing 方法;
- ordered action sequences 对复杂 branching / concurrent requirements 的表达能力有限。
这些内容不是“补实验”,而是把方法边界说清楚。
Related Work
Related Work 部分扩展了与以下方向的对比:
- Simulink testing;
- requirement-based testing;
- scenario-based testing;
- LLM-based testing。
同时也明确说明,本文没有声称已经全面比较所有 SOTA 方法,而是强调本文方法与 random-search、constraint-solving、falsification、direct LLM test generation 的区别。
Conclusion and Future Work
Conclusion 中补充了 future work,包括:
- 多 LLM 对比;
- action completeness;
- scenario validity;
- branching / concurrent scenario graphs;
- 更广泛地比较 Simulink falsification 和 model-based testing 方法。
这些内容用于回应 reviewer 的合理担忧,同时避免把未完成的实验写成已有结果。
Compatible Check 的处理方式
Reviewer 对 scenario enhancement 中的随机组合提出了疑问:如果只是随机拼接 scenario,是否可能生成 meaningless scenario?
为回应这一点,v2 中将 Compatible check 写成一个轻量的 validity / compatibility 过滤机制。其核心作用是在接受一个候选 scenario 之前,检查它是否满足基本语义和工程约束。
可以理解为:
1 | 不是所有随机组合都会被接受; |
检查内容包括:
- shared input/output configuration 是否一致;
- temporal feasibility 是否满足
T_sim; - 是否保留 requirement traceability;
- state-mode transition 是否合理;
- constraint 是否在 input bounds 下可满足。
这类补充不需要新增实验数据,但可以让方法描述更严谨。
阶段七:编译、验证并打包 v2
由于 v2 新增了不少 reviewer response 内容,初次编译后正文页数超出了 16 页限制。因此智能体进行了保守压缩:
- 压缩 algorithm 环境占用;
- 缩短 Related Work 部分重复表达;
- 调整
main.tex中部分 spacing; - 保留实质性 reviewer clarifications,不用删除关键修改来硬凑页数。
最终 v2 编译验证结果为:
1 | Pages: 19 |
这表示:
- PDF 总页数 19;
- Conclusion 在第 16 页;
- References 从第 17 页开始;
- 正文仍满足 16 页限制;
- source zip 解压到干净目录后可以重新编译成功。
v2 的主要输出包括:
1 | v2/latex/ |
阶段八:生成审阅辅助文档
为了让修改过程可追溯,智能体额外生成了多份 Markdown 文档。
实际改动记录
1 | v2/actual_changes_v2.md |
这份文档记录实际已经完成的修改,而不是只停留在计划层面。
段落级前后对比
1 | v2/paragraph_before_after_v2.md |
这份文档按 LaTeX 文件分类,列出 v1 修改前段落和 v2 修改后段落,包含 27 个 change blocks,适合用于写 response letter 或人工复查。
未完全落实项报告
1 | v2/remaining_review_gaps_v2.md |
这份文档区分了:
- 已经通过文字说明或方法澄清处理的问题;
- 只能作为 limitation / future work 的问题;
- 如果有时间可以继续增强的呈现问题。
其中未完全落实的主要是需要额外实验或统计的数据类要求,例如:
- 多 LLM 对比;
- 更多 SOTA Simulink / model-based testing 方法对比;
- STL constraint generation success rate;
- scenario enhancement validity rate。
工作流总结
1 | v2/agent_workflow_and_skills.md |
这就是本文整理依据的原始总结文档,记录了本次智能体的工作阶段、对应 Skill、关键约束和输出文件索引。
关键工程约束
这次任务中有几个值得记录的工程细节。
中文路径问题
论文工作目录包含中文路径:
1 | /mnt/d/研究生/科研/论文/camera-ready |
部分终端工具不允许直接将包含中文字符的路径作为 workdir,因此编译验证时采用了复制到 /tmp/... 的方式。例如:
1 | /tmp/camera_ready_v2_build |
这样既避免路径问题,也能顺便完成 clean rebuild 验证。
不新增实验
用户明确要求不进行额外实验分析。因此,对于 reviewer 提出的多模型比较、success rate、validity rate 等要求,智能体没有虚构数据,而是通过以下方式处理:
- 方法说明;
- threat to validity;
- limitation;
- future work。
这保证了论文修改的学术诚信。
页数限制
Springer LNCS / TASE camera-ready 要求正文 16 页以内,不含 bibliography。v2 增补 reviewer response 后一度超页,因此需要重新压缩。
最终采用的策略是优先压缩排版和重复表达,而不是删掉关键 reviewer response。
最终产物索引
本次任务的主要产物如下。
v1 产物
1 | v1/latex/ |
v2 产物
1 | v2/review_action_plan.md |
总结
这次工作展示了一种比较实用的 AI 智能体协作方式:不是只让模型回答“应该怎么做”,而是让它在明确约束下直接操作文件、编译验证、生成产物,并把每一步记录下来。
在论文 camera-ready 场景中,这种方式尤其适合处理以下任务:
- LaTeX 源码清理;
- PDF 和 source zip 打包;
- 页数和引用检查;
- reviewer comments 修改规划;
- 多版本 LaTeX 维护;
- before/after 修改记录;
- remaining gaps 分析。
不过,智能体也不能替代作者的学术判断。比如 Springer 表格中的不确定字段、reviewer 要求的新实验、论文结论的边界,都需要作者最终确认。比较理想的模式是:让智能体负责繁琐、可验证、可重复的工程化工作,让作者负责内容取舍、学术判断和最终提交确认。