详细佐证文档

论文题目：基于QCM气敏传感器的小麦霉变检测技术及其装备研究
作者 / 导师：侯宇鑫 / 汤修映教授
学位类型：工学博士（机械制造及其自动化）
培养单位：中国农业大学工学院
评审日期：2026-05-23
用途：本文件为内部完整版，供答辩委员会、答辩秘书、行政人员及申诉回查使用。每条意见展开完整论据、原文逐字摘录（带印刷页码）、数据物理隔离对比、必要的公式推导、权威文献出处、以及对作者可能反驳的预案与回应。页码标注规则：印刷页为论文页脚标号，物理页 = 印刷页 + 11。

意见 1（详证）：第 6 章高指标建立在伪重复样本上，无法证明装置真能检测霉变

1.1 完整论据

第 6 章是全文唯一产出高指标的章节（分类总体准确率 99.1%、回归 R²=0.97、RPD=5.59），全文核心结论（实现小麦霉变定量检测、可取代理化检测、储藏现场靶向精量识别）的全部定量证据都在这一章。但这些指标建立在一套从样本设计到建模评估都会让指标系统性虚高的流程上，四个子问题环环相扣：

伪重复加数据泄露（严重度最高）；
特征优选时发生信息泄露（严重度高）；
在测试集上做模型与特征集选择（严重度中）；
7 个离散真值当连续回归处理、且全程无傻瓜基线对比（严重度高）。

四点叠加，使分类 99.1%、回归 R²=0.97 只能证明模型“认出了实验室这一批小麦的 7 个时间点”，证明不了它真的学到了“霉变程度与气味的定量关系”。

1.2 原文逐字摘录（带印刷页 / 物理页）

E1 — 样本构成（§6.1.1，印 84 / 物 95）

“本研究在试验过程中选择的小麦品种为‘郑麦 136’,购自河南省新乡市延津县‘帝益’麦业有限公司,收获于当年的五月上旬……试验依据小麦储藏在恒温恒湿箱中的不同时长(0 d、1 d、3 d、5 d、7 d、9 d 和 11 d)来制备不同梯度的小麦样本……每个梯度 16 个平行样本,共计 112 个样本。”

E2 — 特征优选（§6.2.2，印 99–100 / 物 110–111）

相关分析：“对目标变量与从QCM传感器原始频率响应曲线中提取的各个特征参数进行相关性分析,如果目标变量与各个特征参数的相关性越高,说明特征参数越重要,需要保留……将与目标变量相关性最低的特征参数 T_res 剔除……”

F 检验：“用 F 值来衡量各个特征参数与目标变量的关联程度,若 F 值越大,说明该特征参数越重要。”

E3 — 分类划分协议（§6.2.3，印 103 / 物 114）

“本研究使用的样品数量为 7 个梯度共计 112 个小麦样本,其属于小规模数据集,为了避免数据划分不合理导致的过拟合问题,故采用五折交叉验证法来评估模型的性能和泛化能力。”

E4 — 回归划分协议（§6.2.4，印 108 / 物 119）

“对 112 个小麦样本进行随机划分,训练集、验证集和测试集的划分比例为 70%、15% 和 15%……对于 PLSR、RFR 和 SVR……对 112 个小麦样本进行随机划分,训练集和测试集的划分比例为 75% 和 25%。”

E5 — 在测试集上挑最优特征集（§6.2.4，印 111 / 物 122，以随机森林为例）

“基于特征排列重要性分析后特征参数集的 RFR 模型测试集的决定系数 R² 最高、均方根误差 RMSE 最小,其值分别为 0.97、0.1491……综上所述,基于特征排列重要性分析后特征参数集的 RFR 模型展现出更优的预测性能……RPD 值为 5.59。”

E6 — 作者把离散真值误解释为“重叠”（§6.2.4，印 111 / 物 122）

“图 6-18 中看起来样本数较少的原因是样本点之间较为集中存在重叠现象,即相互遮挡导致的,样本数仍是 112 个。”

E7 — 核心结论措辞（§7.1(5)、§7.2(3)，印 116 / 物 127）

“……实现了小麦霉变的定量检测,这将取代传统繁琐的四大霉菌毒素以及菌落总数的理化检测,实现在储藏现场小麦霉变的靶向精量识别。”

E8 — 作者自述的 RPD 判据（§6.1.6，印 96 / 物 107；式 6-41）

“当 RPD < 2.0 时,该模型被认为不适用于实际应用;当 2.0 ≤ RPD < 2.5 时……当 RPD ≥ 3.0 时,该模型被认为具有出色的预测性能。”

E9 — 作者诚实自承泛化性局限（§7.3(2)，印 117 / 物 128）

本研究在实验室条件下对同一品种小麦“郑麦 136”进行检测，后续需验证不同品种、地理、年份的适用性。（转述，原文为展望第 2 条）

1.3 数据划分协议真相表（数据物理隔离）

任务	模型	划分方式	比例（样本数）	有无独立测试集	指标报在	原文页
分类	DT/NB/SVM/KNN	五折交叉验证	5 折轮流	无	五折 CV	印 103
回归	ANN	随机划分	70/15/15（78/17/17）	有验证+测试	测试集	印 108
回归	PLSR/RFR/SVR	随机划分	75/25（84/28）	仅测试	测试集	印 108

三套划分协议并存且全部是随机划分，没有任何一套按时间或批次或平行样分组——近重复样必然跨训练/测试两边。任何一行都没有傻瓜基线对照列。

回归四模型最优指标汇总（数据物理隔离）

模型	最优特征集	训练 R²/RMSE	测试 R²/RMSE	RPD
ANN	F 检验集	0.97 / 0.1949	0.96 / 0.1786	5.03
PLSR	聚类集	0.92 / 0.2302	0.94 / 0.1948	4.15
RFR	F 检验集	0.99 / 0.0963	0.97 / 0.1491	5.59（全局最优）
SVR	相关分析集	0.97 / 0.1457	0.94 / 0.1841	4.28

1.4 为什么伪重复会让 R² 与 RPD 虚高（机理推导）

设回归目标变量（菌落总数对数值）只有 7 个离散档 y₁ < y₂ < … < y₇，且随霉变天数近乎单调递增。R² 的定义为：

R² = 1 − SS_res / SS_tot

其中 SS_tot = Σ(yᵢ − ȳ)²（目标变量总平方和），SS_res = Σ(yᵢ − ŷᵢ)²（残差平方和）。

关键在于 SS_tot 的结构：当真值聚成 7 个相距较远的离散档时，SS_tot 几乎全部来自“档与档之间的台阶”，而档内方差极小（同一档的 16 个平行样真值几乎相同）。这意味着：

一个零参数的傻瓜模型（例如“按霉变天数线性外推”或“预测每档的均值”），只要能把样本大致归到正确的档，就能解释掉绝大部分 SS_tot，从而使 SS_res 很小、R² 接近 1。
因此 R²=0.97 在这种离散单调结构下是平凡可达的，它无法区分“模型真学到了霉变与气味的连续定量关系”和“模型只是认出了样本属于 7 个档中的哪一个”。

RPD 同理。RPD 的定义为：

RPD = SD / RMSE

其中 SD 为真值标准差，RMSE 为预测均方根误差。

当真值跨度大（本文 7 档跨约 2.4 个 lg CFU/g 单位）时，分子 SD 被结构性抬高，RPD 随之偏大。Bellon-Maurel 等（2010）正是据此批评“RPD 神话”——RPD 依赖样本总方差，方差大时 RPD 虚高，单看 RPD 会高估模型质量。所以 RPD=5.59 看似远超作者自定的“出色”阈值（≥3.0，见 E8），但在离散单调目标上不能作为模型有效的证据。

伪重复进一步放大上述效应：把 16 个近重复样随机划分到训练/测试两边后，测试集每个样本在训练集都有十几个“孪生兄弟”，模型只要记住 7 个档的特征中心即可在测试时完成匹配。此时 SS_res 被压到极低，R² 与 RPD 双双虚高，但这反映的是“记住了 7 个簇心”，不是“学到了定量关系”。

1.5 权威文献佐证（带出处）

P1 — 伪重复的经典定义与危害

Hurlbert, S. H. (1984). Pseudoreplication and the design of ecological field experiments. Ecological Monographs, 54(2), 187–211. doi:10.2307/1942661.
可引内容：伪重复定义为“用推断统计检验处理效应时，要么处理未被重复（尽管样本可能被重复），要么各重复在统计上不独立”。Hurlbert 审查 1960 年以来 176 项实验研究，发现 27%（在用了推断统计的研究中占 48%）存在伪重复。核心危害：把“对同一实验单元的多次测量”当作独立样本，会人为夸大有效样本量、压低误差项，使统计推断偏乐观。
对这篇论文的适用：本文 112 个样本中真正独立的实验单元只有 7 个霉变天数（甚至 1 个品种 1 个批次）；每梯度 16 个平行样是对同一实验单元的重复测量，属典型伪重复。

P2 — 特征选择偏倚导致乐观偏差

Ambroise, C., & McLachlan, G. J. (2002). Selection bias in gene extraction on the basis of microarray gene-expression data. PNAS, 99(10), 6562–6566. doi:10.1073/pnas.102102699.
可引内容：该文证明，当测试误差或留一交叉验证误差在计算时未对选择偏倚做校正——要么因为规则在用于特征选择的样本上被测试，要么因为交叉验证不在选择过程的外部进行——会产生显著的乐观偏倚。
对这篇论文的适用：本文相关分析、F 检验均用“特征与目标变量的相关/F 值”在全集上排序剔除（E2），特征选择在划分之前、在交叉验证之外进行，正是该文指出的选择偏倚来源；在测试集上挑最优特征集（子问题③）则是“在用于选择的数据上测试”的另一形态。

P3 — 错误的交叉验证方式

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning (2nd ed.), §7.10.2 “The Wrong and Right Way to Do Cross-validation”. Springer.
可引内容：对多步建模流程，交叉验证必须施加于整个建模步骤序列；样本必须在任何选择/过滤步骤之前就被“留出”。在变量已被选定之后再留出样本，不能正确模拟“把分类器应用于完全独立测试集”的过程，因为这些预测变量“已经见过”被留出的样本。
对这篇论文的适用：本文特征筛选在交叉验证之外、全集上完成，违反“特征选择必须放进交叉验证每一折内部”的要求；正确补救是嵌套交叉验证（外层留出估性能、内层做特征选择与调参）。

P4 — 傻瓜基线对单调/平稳目标的必要性

Hewamalage, H., Ackermann, K., & Bergmeir, C. (2023). Forecast evaluation for data scientists: common pitfalls and best practices. Data Mining and Knowledge Discovery, 37, 788–832.
可引内容：评估必须对照简单基线（persistence / 均值），否则复杂模型相对差基线显得“惊艳”实则提升甚微。回归中“总体均值”通过 R² 充当隐含基线（量化模型相对“只预测均值”多解释了多少方差）。
对这篇论文的适用：本文目标仅 7 个离散档且近单调递增，必须显式引入均值基线、persistence 基线（用相邻档真值）、按霉变天数线性回归基线，对照看模型相对基线的真实增益；论文四模型只互比、无任何基线。

P5 — 交叉验证不能补救伪重复

Roberts, D. R., et al. (2017). Cross-validation strategies for data with temporal, spatial, hierarchical, or phylogenetic structure. Ecography, 40, 913–929；scikit-learn 文档 GroupKFold。
可引内容：标准 K 折交叉验证假设样本独立同分布；当存在分组/相关（重复测量、同一传感器多次测量、层次数据）时该假设被违反，导致折间数据泄露、高估准确率。GroupKFold 通过保证同组样本绝不跨折来避免泄露。
对这篇论文的适用：本文用五折交叉验证“避免过拟合”（E3），但交叉验证本身救不了伪重复——同梯度 16 个近重复样若不按梯度分组，必然跨折。正确做法是按“霉变天数/平行样组”做 GroupKFold（留一梯度法）。

P6 — RPD 阈值来源与“RPD 神话”批评

Williams, P. C. (2001/2014). Near-Infrared Technology in the Agricultural and Food Industries（RPD 阈值体系经典来源）；Bellon-Maurel, V., et al. (2010). Critical review of chemometric indicators commonly used for assessing the quality of the prediction of soil attributes by NIR spectroscopy. TrAC Trends in Analytical Chemistry, 29(9), 1073–1081.
可引内容：RPD 常用阈值（>2.0 最低可用、2.0–2.5 可定量、2.5–3.0 良好、>3.0 出色）与本文 E8 自述一致；但 Bellon-Maurel 等指出 RPD 对样本集方差敏感，方差大时 RPD 虚高，建议改用 RPIQ。
对这篇论文的适用：RPD=5.59 看似远超“出色”阈值，但本文真值离散单调、总方差几乎全来自档间台阶，RPD 分子被结构性抬高，此处不能作为模型有效的证据。

1.6 辩护律师视角（反驳预案与回应）

辩护 1：“我用了五折交叉验证、留了独立测试集，泛化性是验证过的。”

回应：交叉验证救不了伪重复。五折交叉验证的前提是样本独立同分布，但本文每梯度 16 个平行样来自同一品种、同一批、同一加速处理，是近重复样本，不独立。随机五折必然把同一梯度的近重复样切到不同折，测试折里每个样本在训练折都有十几个“孪生兄弟”，折间泄露、准确率高估（P5）。要真正验证泛化性，必须按梯度分组做 GroupKFold，或用不同品种/批次的外部样本测试。回归更糟——连五折都没有，直接随机 75/25 划分，等于开卷考试。

辩护 2：“R²=0.97、RPD=5.59 是客观算出来的，数字摆在这里，很高。”

回应：高 R² 在“7 个离散单调真值”上没有意义（见 1.4 推导）。一个零参数平凡模型就能解释掉绝大部分档间台阶方差、轻松拿到高 R²，所以 0.97 无法区分“真学到了”和“只是认出了 7 个档”。RPD 同理被真值跨度结构性抬高（P6）。不设傻瓜基线，这两个数字证明不了任何东西（P4）。作者甚至把散点的离散簇误当成“重叠遮挡”（E6），说明对“只有 7 个真值”这一事实都没意识到。

辩护 3：“16 个平行样增加了样本量，让模型训练更充分、结果更可信。”

回应：平行样是伪重复，不是独立样本，它非但没增加有效样本量，反而制造了数据泄露。统计上的有效样本量是独立实验单元数（这里是 7 个霉变天数），不是 112（P1）。真要增加有效样本量，得加品种、加批次、加产地，而不是对同一批样品重复测 16 次。

辩护 4：“特征筛选只是降维，提高效率，不影响公正性。”

回应：本文特征筛选不是无监督降维，而是用了“特征与目标变量（答案）的相关性/F 值”来排序剔除（E2），且在划分之前、交叉验证之外做。这把测试集的标签信息提前漏进了特征选择，是 Ambroise & McLachlan 2002（PNAS）证明会产生显著乐观偏倚的选择偏倚，也是 Hastie ESL 明令禁止的“错误的交叉验证方式”（P2、P3）。

辩护 5：“这是同行常规做法，很多电子鼻/QCM 论文都这么划分。”

回应：领域里确有论文这么做，但“很多人这么做”不等于方法正确——Hurlbert 1984 当年统计的伪重复发生率就接近一半（P1），普遍不等于正确。对一篇博士学位论文而言，恰恰应高于“随大流”的标准；何况本文核心卖点是“实现储藏现场定量检测、取代理化检测”（E7），这种强应用主张必须有外部验证支撑。

1.7 严重度与定性

严重度：必须修改、高（全文最严重的方法学问题）。这是方法学/实验设计层面的问题，不是数据造假指控。措辞应落在“现有验证设计无法支撑该强度的结论，需补做更严格的验证”，而非“结论错误”。结论本身未必为假，但论文提供的实验与建模设计无法证明它——结论强度显著高于证据强度。作者在 §7.3 已诚实自承泛化性未验证（E9），可在意见中正面引用以示公允。

意见 2（详证）：第 2 章正文两组百分数在表 2-2 / 图 2-6 中查无对应

2.1 完整论据

§2.2.4 正文给出了两种物质含量随霉变变化的具体百分数（4-甲基-2-戊酮“从 9.75% 增加到 21.27%”、3-辛酮“从 4.81% 最终增加到 7.12%”），共 4 个数字（9.75 / 21.27 / 4.81 / 7.12）。把这 4 个数字与正文紧跟着引用的表 2-2（全表 28 种物质 × 7 个梯度约 130 个数据格）和图 2-6 的数据标签逐一比对，全部查无对应。已核实表头、图纵轴、正文叙述三处口径完全相同（均为“相对百分含量（%）”），排除了“口径不同导致数字不同但都真实”的可能。

2.2 原文逐字摘录（§2.2.4，印 25 / 物 36，一字不差）

“……4-甲基-2-戊酮的含量在霉变处理时间 1 d 和 3 d 之间产生一个较大的变化,从 9.75% 增加到 21.27%,此后的储藏时间里其含量均维持在 20%～25% 高含量区间内……3-辛酮这一挥发性化合物出现在小麦霉变处理时间的第 7 天,且含量呈现增长趋势,从 4.81% 最终增加到 7.12%……”

2.3 数据物理隔离对比

4-甲基-2-戊酮

正文（印 25）说：1 d → 3 d 从 9.75% 增加到 21.27%

表 2-2 实测（印 22–23，酮类该行 7 个梯度）：3.67 / 7.90 / 19.33 / 20.28 / 11.52 / 15.93 / 22.56

图 2-6 黄柱数据标签（印 21）：3.67 / 7.79（图内标签拥挤，表为 7.90）/ 19.33 / 20.28 / 11.52 / 15.93 / 22.56

结论：9.75 与 21.27 在表与图中均不存在。表中 1 d 实为 7.90、3 d 实为 19.33。

3-辛酮

正文（印 25）说：第 7 天出现，从 4.81% 增加到 7.12%

表 2-2 实测（印 22–23）：未检出 / 未检出 / 未检出 / 未检出 / 2.76 / 1.5 / 6.73

图 2-6：3-辛酮未进入图 2-6（图 2-6 只画 4 个主要成分）

结论：4.81 与 7.12 在表中均不存在。表中 7 d 实为 2.76、11 d 实为 6.73。

趋势方向也对不上

正文说 4-甲基-2-戊酮“此后维持在 20%～25%”

实测 5/7/9/11 d = 20.28 / 11.52 / 15.93 / 22.56——其中 7 d（11.52）、9 d（15.93）明显跌出 20% 下限

正文说 3-辛酮“从 4.81 单调增到 7.12”

实测 7/9/11 d = 2.76 / 1.5 / 6.73——先升、再降、再升，非单调增

2.4 口径同源的核实证据

表 2-2 表头数值列总表头为“相对百分含量（%）”；图 2-6 纵轴标注“相对百分含量（%）”，刻度 0–25；§2.2.4 正文叙述用“含量……%”。三处口径完全相同。进一步证明：图 2-6 中 4-甲基-2-戊酮黄柱的数据标签（3.67 / 7.79 / 19.33 / 20.28 / 11.52 / 15.93 / 22.56）与表 2-2 该物质数值几乎逐点重合（仅 1 d 处因图内标签拥挤读作 7.79、表为 7.90，属 0.1 级别排版误差），证明图与表是同一套数据的两种呈现，不存在“峰面积 vs 相对含量”两套口径错位。因此本条不能降级为“口径未标注致混淆”。

2.5 辩护律师视角（反驳预案与回应）

反驳 A：“正文引用的是某两个特定时间点的值，不是表里的梯度值。”

回应：正文已明确把数字绑定到具体梯度——“1 d 和 3 d 之间……从 9.75% 增加到 21.27%”即 1 d=9.75、3 d=21.27；“第 7 天出现……从 4.81% 增加到 7.12%”即 7 d=4.81、终点=7.12。这些正是表 2-2 已有的梯度点，但表里这些点的实测值是 7.90 / 19.33 / 2.76 / 6.73，与正文四值全部不符。表 2-2 就是全部 7 个时间点的完整数据，没有第 8 个时间点可供引用。反驳不成立。

反驳 B：“图和表口径不同（峰面积 vs 相对含量），所以数字不同但都真实。”

回应：已逐字核对，表 2-2 表头、图 2-6 纵轴、正文叙述三处口径完全相同，均为“相对百分含量（%）”，且图 2-6 黄柱标签与表 2-2 数值几乎逐点重合，证明是同一套数据。反驳不成立。

反驳 C：“9.75、21.27 可能是某个未列入表 2-2 的细分组分或重复样均值。”

回应：表 2-2 是 GC-MS 解析的最终结果表，4-甲基-2-戊酮、3-辛酮各只占一行，无细分组分；论文全章未提供任何重复样的逐次原始值或第二套均值表。正文数字若来自“另一套均值”，则该套数据全文未披露，仍构成“正文数据无图表支撑”。反驳不成立。

反驳 D：“这是笔误——把别的物质或别的梯度的数字写错了。”

回应：这是最宽容的解释，但仍无法把四个数字“对回”任何真实来源——9.75 / 21.27 / 4.81 / 7.12 在全表任何物质任何梯度都找不到，不是“抄错行/抄错列”那种能定位到源头的笔误（例如把 19.33 误写成 21.27 尚可理解，但 9.75 在全表无任何近邻值可对应）。即便假设为笔误，作者也必须重新核对原始数据并改正。此反驳可作为作者最低限度的台阶，但不改变“必须修改”的处置。

2.6 严重度与定性

严重度：必须修改、高。定性为“正文数值在所引图表中查无对应（数据来源不明 / 正文数据与图表不一致）”，非“口径混淆”（口径已核实同源）。禁用“编造/造假/伪造数据”等定性词。理由：第 2 章是全文标志物选择的地基，本章数据若有“正文写的数图表里找不到”的情况，会直接动摇读者对整章 GC-MS 解析结果与后续相关分析的信任。3-辛酮第 11 天实测 6.73 与正文 7.12 接近，更像记录或誊写环节出了问题。

意见 3（详证）：被选为“早期检测”标志物的分子恰在早期检不出

3.1 完整论据

论文核心目标是“小麦霉变早期检测”，但选定的唯一标志物 1-辛烯-3-醇在最早两个时间点（0 d、1 d）完全未检出、3 d 才首次出现且仅 3.21%（全程最低）。标志物的地基有三处裂缝：① 早期检不出与早期检测目标方向相反（最硬）；② 仅凭一个最高相关系数定唯一标志物，未做唯一性/特异性论证；③ 菌落总数口径自相矛盾（自承不能判定霉变程度，却作唯一对照）。标志物是全文研究链起点，地基松则后续 MIP 靶向合成、双模型预测的机理正当性全部失支点。

3.2 原文逐字摘录（带印刷页 / 物理页）

研究目标 = 早期检测（§1.3.1，印 10 / 物 21）

“本研究旨在基于 QCM 传感器开发嗅觉检测装置用于小麦霉变早期的快速无损与精准定量检测。”

§1.3.2(5)（印 11 / 物 22）

“……实现小麦霉变的快速、无损与精准的早期检测,更好地指导防霉减损工作,为粮食安全提供有力的保障。”

1-辛烯-3-醇逐梯度实测（表 2-2，印 22–23 / 物 33–34）——见 3.3 隔离块。

作者自述（§2.2.4，印 25 / 物 36）

“1-辛烯-3-醇的含量在第 3 d 后随着储藏时间的增加而有规律地增加……”

选唯一标志物的理由（§2.2.4，印 25 / 物 36）

“对不同霉变时间小麦的挥发性化合物含量与菌落总数进行相关性分析,相关系数的计算选择皮尔逊相关系数……1-辛烯-3-醇展现出了与菌落总数的最大相关系数,其值为 0.95,这一结果验证了选择 1-辛烯-3-醇为小麦霉变过程中挥发性标志物的合理性……”

菌落总数口径（§2.2.3，印 23 / 物 34）

“根据国标 GB 4789.2-2022 检测出小麦样品的菌落数并不等于霉菌数,不能直接用于判定小麦的霉变程度,仅用于卫生污染水平参考。因此,本研究将菌落总数作为表征霉变小麦污染水平的理化指标……”

3.3 数据物理隔离：1-辛烯-3-醇逐时间点实测

储藏时间 0 d 1 d 3 d 5 d 7 d 9 d 11 d

1-辛烯-3-醇相对含量(%) 未检出 未检出 3.21 5.15 5.48 8.93 17.33

早期（0 d、1 d）：完全未检出

首次检出：3 d，仅 3.21%（全程最低）

终点：11 d 达 17.33%，是 3 d 的 5.4 倍

形态分级（§2.2.1）：初期变质阶段为 3～5 d；0/1 d 为新鲜小麦

一句话：在本文这套加速霉变实验的实测数据里，它 0 d、1 d 未检出、3 d 才出现，早期缺席、越到后期越强，恰好把灵敏度给了最不需要的后期，与本文设定的早期检测目标错配。

储藏时间	0 d	1 d	3 d	5 d	7 d	9 d	11 d
1-辛烯-3-醇相对含量(%)	未检出	未检出	3.21	5.15	5.48	8.93	17.33

3.4 时间线讲法（矛盾点透）

论文两处明写终极目标是“早期检测”（§1.3.1 印 10、§1.3.2(5) 印 11），且明写传感器是“根据标志物”用分子印迹制备的靶向器件。可作为唯一标志物兼 MIP 模板分子的 1-辛烯-3-醇，在最早的 0 d、1 d 实测为未检出（表 2-2 印 22），3 d 才首现且仅 3.21%。开头说要做早期检测 → 选的标志物却在早期是空的 → 结尾仍把“早期精准检测”当成已实现的成果（§7.1/§7.2 印 116）——目标与手段方向相反。

3.5 权威文献佐证（带出处）

支持作者的一面

1-辛烯-3-醇是 Aspergillus（曲霉）、Fusarium（镰刀菌）、Penicillium（青霉）等真菌的主要霉菌挥发性有机物之一，常作真菌生长指示物。出处：Börjesson 等，“Fungal Volatiles as Indicators of Food and Feeds Spoilage”，PubMed PMID 10441446 / ScienceDirect S1087184599911398。
意义：作者选它作“霉变标志物”在文献上站得住，引严松、林颢（2019）也不算错。

反对“把它当早期标志物”的一面

早期预警 VOC 标志物的核心判据是“在可见霉变之前、霉菌代谢早期即可检出”。Frontiers in Microbiology (2025) 原文：“mold colonies release VOCs during early metabolic stages, a phenomenon that precedes visible mycelial growth or sporulation by a considerable temporal margin”。该研究筛出的早期预警标志物（2-methyl-1-butanol、2-propanone、1-penten-3-ol 等）在最早霉变阶段就出现 1.3～1.5 倍升高；筛选准则为 VIP > 1 且 P < 0.05。值得注意：该研究的早期预警标志物并未选 1-octen-3-ol。出处：Frontiers in Microbiology (2025) 10.3389/fmicb.2025.1595849；PMC12307484。
意义：“是真菌标志物”不自动等于“是合格的早期预警标志物”，后者要看它在早期是否足够早、足够强地出现。

标志物筛选应多指标综合（支持症状②）

VOC 标志物领域公认：高相关不等于因果、不等于特异性；单纯相关不足以确立标志物，需进一步做特异性、可重复性与机理验证。出处：Janfaza / Hanna 等，“Current Challenges in Volatile Organic Compounds Analysis as Potential Biomarkers of Cancer”，PMC4437398。
意义：领域做法是多指标综合（相关性 + 特异性 + 早期可检出 + 单调稳定 + 标准品确证），论文只做了单变量皮尔逊最高值这一步。

3.6 辩护律师视角（反驳预案与回应）

反驳 A：“1-辛烯-3-醇是国际公认标志物，文献都这么用，选它没错。”

回应：承认 1-辛烯-3-醇是公认真菌标志物。但“是公认标志物”回答的是“它能不能表征霉变”，回答不了“它能不能用于早期检测”。领域规范明确早期预警标志物的判据是“在可见污染之前可检出”，而本文实测它在 0/1 d 检不出、3 d 才 3.21%——在自己的数据里它就不是早期信号。文献光环洗不掉表 2-2 里那两个“未检出”。

反驳 B：“0.95 是 28 种里最高的相关系数，最高的当然最该选。”

回应：最高相关只证明“在所有候选里它与菌落总数的线性同步性最好”，证明不了“它唯一”“它因果”“它特异”。多种 VOCs 随霉变时间齐涨，都会与同样随时间上升的菌落总数高相关，高相关在这里很大程度是“共同被时间驱动”的假象。论文未给其它 VOCs 的相关系数（图 2-10 不可辨认），读者无从判断 0.95 与次高值差多少。而且最高相关与早期可检出可能正相反——一个后期才陡升的物质恰恰容易拿到高时间相关系数，却正因“后期才起来”而不适合早期检测。

反驳 C（作者最强反驳）：“0 d、1 d 是新鲜小麦本来就没霉变，测不到很正常，不能算缺陷。”

回应：部分承认——0/1 d 确是新鲜小麦，无真菌代谢、检不出真菌 VOC 在生物学上说得通，这一点不宜定性为“数据异常”。但这恰恰反证了“用它做早期检测”的逻辑漏洞：早期检测的价值正是在“霉变刚启动、肉眼还看不出”时报警，而论文自己把最早的霉变阶段定在 3～5 d，1-辛烯-3-醇在 3 d 才首现且仅 3.21%（全程最低）。结论不是“0/1 d 测不到是数据错误”，而是“选一个早期信号最弱的物质作早期检测的唯一靶分子，是标志物选择与研究目标的方向性错配”。越承认它早期没有，越说明它不该被指派做早期检测的主力。

反驳 D：“我用菌落总数做对照是粮食领域常规，CFU 和霉变就是正相关。”

回应：承认菌落总数作霉变污染代理在粮食卫生领域有惯例，本条不宜上纲到“方法错误”。但问题不在“能不能用菌落总数”，而在“论文自己先声明它不能判定霉变程度，转头又拿它当判定标志物合理性的唯一标尺”——这是论文内部口径的自相矛盾。作者只需补一句“虽菌落总数不等于霉菌数，但作为污染水平代理与霉变进程正相关，故作对照”把逻辑补圆即可，但现稿没补。

3.7 严重度与定性（三症状区分）

症状	定性	处置	严重度
① 早期检不出	标志物选择与早期检测目标方向性错配（地基级逻辑断裂）	必须修改	高
② 仅凭最高相关定唯一	标志物唯一性论证不充分（相关≠因果≠特异）	必须补充论证	高
③ 菌落总数口径矛盾	前后表述冲突（口径矛盾）	建议修改	中

措辞红线：症状①用“冲突/错配”不用“不足”，但不写成数据造假（0/1 d 检不出有生物学解释）；症状②用“论证不充分”，不写成“标志物选错了”（1-辛烯-3-醇作霉变标志物本身站得住）；症状③用“前后表述冲突”，不写成“方法错误”。

意见 4（详证）：创新点（2）“突破特异识别”夸大，实测仅官能团级选择性

4.1 完整论据

创新点（2）宣称“突破了 QCM 气敏传感器无法特异性识别目标气体（选择性差）……的局限性”，把“特异性识别”当成已做到的成果宣讲。但第 4 章实测显示，传感器只能认出“含羟基的醇类”这一大类（对 1-壬醇、苯乙醇的响应反而高于含量更高的酯、酮干扰物），并没有认出“1-辛烯-3-醇这一个分子”；正因单传感器分不清同类分子，第 6 章才要再上 12 维特征 + 机器学习做模式识别。三处口径对不上：第 4 章实测（只到官能团级）→ 第 6 章实做（靠多特征机器学习补）→ 第 7 章宣称（已突破无法特异识别）。

定性为“宣称口径夸大/措辞与实做不符”，不是技术错误——技术路线（粗选择性传感器 + 多特征 + 机器学习）本身是电子鼻/气敏阵列领域的标准合理做法。

4.2 原文逐字摘录（带印刷页 / 物理页）

创新点（2）（§7.2，印 116 / 物 127）

“（2）合成了分子印迹聚合物（MIP）、金属有机框架（ZIF-8）和疏水 SiO₂ 等新型功能材料……突破了 QCM 气敏传感器无法特异性识别目标气体（选择性差）与高湿度检测条件下信号漂移失真（湿度敏感）的局限性。”

作者自设的“特异识别”标准（§4.3.4(3)，印 57 / 物 68）

“传感器理想状态下希望只对目标气体产生响应,即传感器可以特异性识别目标气体而避免交叉敏感问题（Ye et al., 2023）……”

第 4 章实测（§4.3.4(3)，印 58 / 物 69）

“……此外,小麦挥发性气味中含量较低的 1-壬醇和苯乙醇的频率响应反而略高于含量较高的邻苯二甲酸二丁酯、棕榈酸甲酯和 4-甲基-2-戊酮,出现这一现象的原因可能是 1-壬醇和苯乙醇均属于醇类,与 1-辛烯-3-醇具有相似的化学结构,说明合成修饰材料 MIP 时,羟基官能团的原因在印记空腔中贡献了比较重要的特征位点。”

第 6 章为何还要上机器学习（§6.1 章首，印 84 / 物 95）

“……然后结合机器学习的多种模式识别算法对不同霉变程度的小麦样品进行定性区分……结合机器学习的多种回归预测算法实现小麦样品不同污染水平的定量预测。”

4.3 数据物理隔离：图 4-15 选择性数据

注意：论文未给任何干扰物的频移数值，下表“响应”列只能填论文文字给出的定性序关系。

气体化学类别在小麦中含量 MIP 传感器响应（论文定性序）

1-辛烯-3-醇（目标/模板）醇类（含 -OH）较高、变化显著最大

1-壬醇（干扰） 醇类（含 -OH） 较低 次高——“反而略高于”下列酯酮

苯乙醇（干扰） 醇类（含 -OH） 较低 次高——“反而略高于”下列酯酮

邻苯二甲酸二丁酯（干扰）酯类较高低于上面两个同类醇

棕榈酸甲酯（干扰）酯类较高低于上面两个同类醇

4-甲基-2-戊酮（干扰）酮类较高低于上面两个同类醇

一句话读表：含量更低的两个“醇”压过了含量更高的“酯/酮”——传感器排序依据是“是不是醇（有没有 -OH）”，不是“是不是 1-辛烯-3-醇这个分子”。这是官能团级选择性的直接证据。

定量缺口：图 4-15 为雷达图，无数值；全文无选择性系数、无响应比、无干扰物检测限。若要主张“特异识别”，至少应给出 1-辛烯-3-醇响应 ÷ 同类醇响应的比值并证明该比值足够大（如 >5）；论文没有，且文字已暴露该比值接近甚至小于 1。

气体	化学类别	在小麦中含量	MIP 传感器响应（论文定性序）
1-辛烯-3-醇（目标/模板）	醇类（含 -OH）	较高、变化显著	最大
1-壬醇（干扰）	醇类（含 -OH）	较低	次高——“反而略高于”下列酯酮
苯乙醇（干扰）	醇类（含 -OH）	较低	次高——“反而略高于”下列酯酮
邻苯二甲酸二丁酯（干扰）	酯类	较高	低于上面两个同类醇
棕榈酸甲酯（干扰）	酯类	较高	低于上面两个同类醇
4-甲基-2-戊酮（干扰）	酮类	较高	低于上面两个同类醇

4.4 时间线讲法（三处矛盾点透）

论文在第 4 章实测里写得很清楚：传感器对两个含量更低的同类醇（1-壬醇、苯乙醇）响应反而比含量更高的酯、酮更强（§4.3.4 印 58），作者自己也把原因归到“羟基官能团”上——也就是传感器认的是“是不是醇”，不是“是不是 1-辛烯-3-醇这一个分子”。到了第 6 章，正因为单传感器分不清同类分子，才又提了 12 维特征上 4 种机器学习算法做模式识别（§6.1 印 84）。可第 7 章创新点（2）却写“突破了 QCM 气敏传感器无法特异性识别目标气体（选择性差）的局限性”（§7.2 印 116）。第 4 章只做到官能团级 → 第 6 章靠机器学习补 → 第 7 章却说已突破特异识别，三处对不上。

4.5 权威文献佐证（带出处）

MIP 气敏传感器对小分子常只达类选择性，是公认局限

综述《Template Imprinting Versus Porogen Imprinting of Small Molecules: A Review of Molecularly Imprinted Polymers in Gas Sensing》，Int. J. Mol. Sci. 2022, 23(17):9642（PMC9455763）。原文：“Selectivity for smaller molecules is more difficult to achieve with imprinting than it is with more complex molecules.”；“…some films showing no selectivity for their target and giving a greater response to several interferents.”（与本论文“同类醇响应反而更高”完全吻合）。
出处：https://www.mdpi.com/1422-0067/23/17/9642 ；https://pmc.ncbi.nlm.nih.gov/articles/PMC9455763/
意义：1-辛烯-3-醇是 C8 小分子醇，对同类醇响应更高是 MIP 小分子印迹的已知常见现象，不是合成失败，但也正因此够不上“特异识别”。这条既支持“夸大”定性，也帮作者卸责（现象正常，问题只在措辞）。

“粗选择性传感器 + 多特征/阵列 + 机器学习模式识别”是电子鼻领域标准做法（方法对，问题只在措辞）

《Class Specific Discrimination of Volatile Organic Compounds Using a Quartz Crystal Microbalance Based Multisensor Array》，Sensors（PMC6070349）：单个涂层 QCM 传感器只能区分化合物类别而非单个分子；标准做法是多个交叉敏感传感器组成阵列 + 模式识别；判别终点是“官能团类别”层级（98.6% 准确率区分 alcohols / chlorohydrocarbons / aromatic hydrocarbons / hydrocarbons）。出处：https://pmc.ncbi.nlm.nih.gov/articles/PMC6070349/
电子鼻综述《A Comprehensive Review on Sensor-Based Electronic Nose for Food Quality and Safety》（PMC12301011）：电子鼻由“半选择性传感器 + 模式识别软件”构成，结合机器学习对食品挥发物分类/预测——正是本论文实际所做。出处：https://pmc.ncbi.nlm.nih.gov/articles/PMC12301011/
综述《Overcoming the Limits of Cross-Sensitivity: Pattern Recognition Methods for Chemiresistive Gas Sensor Array》，Nano-Micro Letters 2024：标题即点明“交叉敏感是要靠模式识别去克服的”。出处：https://link.springer.com/article/10.1007/s40820-024-01489-z
意义（两面都要说清）：① 方法路线没错——本论文“QCM 单传感器（粗选择性）→ 12 维特征 → 分类 + 回归”完全是电子鼻标准范式，不应批评其“为什么还要用机器学习”；② 但宣称口径错了——领域共识恰是“单传感器/阵列只能做到类别（官能团）级判别，靠模式识别补”。正确写法是把“官能团级选择性 + 多特征机器学习模式识别”作整体路线陈述价值，而非宣称单传感器层面已“突破特异识别”。

MIP-QCM 真能做到高选择性的反例（强化对比）

同一综述（PMC9455763）指出，对较大分子（如甲醛 MIP 纳米颗粒）可做到高选择性：“various interferent VOCs … could not be detected above the noise level … even at concentrations of 100 ppm.”
意义：真正“特异”的 MIP-QCM 表现是“干扰物在 100 ppm 都低于噪声”；本论文干扰物（同类醇）响应反而高于部分干扰物、无一低于噪声，离“特异识别”的实际标准相去甚远。

4.6 辩护律师视角（反驳预案与回应）

反驳 1：“官能团级选择性也是选择性，我说‘选择性差’被突破，没说做到分子级特异。”

回应：站不住。① 创新点（2）原文是“突破了 QCM 气敏传感器无法特异性识别目标气体（选择性差）……的局限性”，“突破了无法特异识别”等于声称“现在能特异识别”。② 作者自己在 §4.3.4(3) 把“特异性识别”定义为“只对目标气体产生响应、避免交叉敏感”，按此标准对两个同类醇响应更高就是没达标。③ §7.1(2) 又称 MIP 具“特异性识别功能”——前后一致用“特异识别”自我定性。三处自述叠加，作者无法主张“我只说了选择性改善”。

反驳 2：“1-壬醇、苯乙醇含量低，实际样品里干扰小，不影响霉变检测。”

回应：① 这是把“应用层面凑合能用”偷换成“传感器特异识别成立”，两码事。创新点是对传感器能力的宣称，不是对系统在特定样品下够用的宣称。② 恰恰因为单传感器分不清同类分子，第 6 章才需要 12 维特征 + 机器学习；用“含量低所以不影响”来解释，正好承认了“靠的是浓度差和后端算法，不是传感器特异性”。

反驳 3：“图 4-15 已显示目标响应‘最大且差异显著’,选择性已证明。”

回应：① “差异显著”是雷达图目测结论，全文无一个数值、无选择性系数、无响应比。② 即便目标响应最大，“对同类醇响应高于含量更高的酯酮”已说明排序依据是官能团而非分子，“最大”只能支撑官能团级粗选择性。③ NIP 对照只证明“印迹比不印迹强”，不证明“印迹达到分子特异”。

反驳 4：“用机器学习是为了做霉变程度分级/菌落总数预测，跟传感器选择性是两回事。”

回应：部分成立但不解围。① 分级/定量确实需要建模，这点合理（方法路线没错）。② 但这恰说明：装置识别霉变靠的是“单传感器响应模式 + 机器学习”这一整体，而非“传感器特异识别 1-辛烯-3-醇”。既然系统价值来自“粗选择性 + 机器学习”的组合，创新点就该如实表述为该组合的价值。③ 论文第 6 章从未声明“因为传感器只到官能团级所以需要多特征”，反而默认装置可特异检测霉变气味，回避了这层逻辑，使创新点（2）与第 6 章实做脱节。

4.7 严重度与定性

严重度：高（创新点是博士论文核心评价对象）。但可通过改写措辞 + 补定量数据修复，不动实质结论档次。用词应是“夸大/言过其实/措辞强度超过数据支撑”，不能用“错误/造假/伪造”。须明确区分“方法对不对”（对）与“话说大了没有”（说大了）。在第三部分意见归类中列入“建议修改”——因其修复方式是改写措辞与补数据，不需要推翻实质结论或重做核心实验，与意见 1/2/3 的“必须补实验/重做分析”性质不同。

意见 5（详证）：装置频率读数核心为商用仪器，宣称偏“创制”；第 4↔5 章互依、装置图错章

5.1 完整论据

两个相对独立的子问题：① 论文反复强调“创制专用嗅觉检测装置”，但装置最核心的 QCM 频率信号读取完全由商用辰华 CHI400C 电化学石英晶体微天平完成，控制软件只是“将 CHI400C 软件嵌入”，整机其余部件基本为市售选型——论文未如实标定自研/选型边界，宣称口径偏高；② 第 4 章传感特性测试正文称用“第五章已研发的装置”、且引用第 4 章的图 4-12，而第 5 章装置又依赖第 4 章传感器——形成双向互依且呈现顺序倒置，装置核心气路图（图 4-12）物理编在第 4 章却被第 5、6 章反向回引。两子问题均不影响数据正确性，是规范性/可读性问题。

5.2 原文逐字摘录与锚点（带印刷页 / 物理页）

频率读取设备（§5.2.3，印 70 / 物 81，图 5-9）：商用辰华 CHI400C 电化学石英晶体微天平，基频 8 MHz，时间分辨法。图 5-9 机身印“石英晶体微天平”。

控制软件（§5.3.5(3)，印 78 / 物 89）：自研软件仅“将 CHI400C 软件嵌入”。图 5-14(a) 为 CHI400C 原生英文界面“Electrochemical Techniques”、(b)“Quartz Crystal Microbalance Parameters”。

下位机采集卡（§5.2.1，印 64 / 物 75，图 5-4、表 5-1）：市售恒凯 USB-DAQ-V1.2（板上丝印 USB_DAQ V1.2 / HKTECH），只管 MFC、继电器、电磁阀，不做频率采集。

气体检测室（图 5-8(b)，印 69 / 物 80）：机身印“CH Instruments EQCM Oscillator”，基于商用 EQCM 振荡器改制。

第 4 章对第 5 章的反向依赖（§4.3.2，印 53 / 物 64）

“在第五章以制备的 QCM 传感器为核心部件研发设计了……嗅觉检测装置,因此,QCM 传感器的传感特性评估将采用研发的嗅觉检测装置进行,如图 4-12 所示。”

装置核心气路图归属错位（图 4-12，印 54 / 物 65）：物理编号在第 4 章，被 §5.4.1（印 79）、§6.1.2（印 85）反向回引。

5.3 数据物理隔离：自研 vs 市售部件清单

部件/模块来源备注

频率信号读取 商用 CHI400C（辰华） 装置“读数核心”

频率采集软件界面 商用 CHI400C 软件嵌入 非自研

气体检测室 商用 EQCM Oscillator 改制 小幅改制

下位机数据采集卡 市售 USB-DAQ-V1.2（恒凯） 只管气路，不碰频率

质量流量控制器 市售 ACU10FA-LC（北京精量） —

气源（钢瓶+减压阀）市售 —

5 阀 5 继电器市售 —

气路时序集成（5 状态切换）自研原创成分

上位机控制软件外壳（C++/MFC 三层架构）自研原创成分

样品室/分体检测室结构 自研/小幅改制 原创成分

一句话：装置的“读数核心”是市售 CHI400C，原创成分主要落在气路集成、控制软件外壳、检测室小幅改制。集成创新可成立，但论文未如实标出此边界。

部件/模块	来源	备注
频率信号读取	商用 CHI400C（辰华）	装置“读数核心”
频率采集软件界面	商用 CHI400C 软件嵌入	非自研
气体检测室	商用 EQCM Oscillator 改制	小幅改制
下位机数据采集卡	市售 USB-DAQ-V1.2（恒凯）	只管气路，不碰频率
质量流量控制器	市售 ACU10FA-LC（北京精量）	—
气源（钢瓶+减压阀）	市售	—
5 阀 5 继电器	市售	—
气路时序集成（5 状态切换）	自研	原创成分
上位机控制软件外壳（C++/MFC 三层架构）	自研	原创成分
样品室/分体检测室结构	自研/小幅改制	原创成分

5.4 编排问题的本质（正常 part-of vs 顺序倒置）

正常的从属关系只要求“第 5 章用第 4 章的传感器”（单向，合理）。
本文实际是反向 + 双向交缠：① 第 4 章测试又用了尚未介绍的第 5 章装置（§4.3.2）；② 第 5 章装置的核心气路图（图 4-12）放进了第 4 章，第 5、6 章反向回引。
读者读第 4 章传感特性测试时，作为测试平台的装置尚未介绍即被使用，且要跳到第 4 章找本属第 5 章的图 4-12，逻辑断了一截。这是论证顺序倒置导致的局部循环依赖，属编排问题而非纯笔误。

5.5 辩护律师视角（反驳预案与回应）

反驳 1：“用商用 CHI400C 做频率读取是常规，集成本身就是创新。”

回应：承认集成创新可成立、有价值，本条不否定装置的工程价值。问题只在“如实标定”——论文把“集成 + 软件外壳”包装成“创制装置”，未标出频率测量靠商用、自研在集成与软件这条边界，宣称口径偏高。只需补一张自研/选型清单表、把“创制”准确限定到集成与软件层面即可，不要求推翻装置工作。

反驳 2：“图 4-12 放在哪章不影响内容正确性，是小事。”

回应：单看图序确实不影响数据，但叠加“第 4 章测试用第 5 章装置”的反向依赖，构成读者读第 4 章时“装置不存在却已被使用”的逻辑断点，读起来会卡住。修法简单（图移回第 5 章 + 第 4 章加前向说明），但应改。

5.6 严重度与定性

严重度：中（含金量披露偏中偏高，编排偏中）。两子问题都可通过如实补充披露 + 调整结构修复，不影响数据与结论正确性，列入“建议修改”。措辞用“宣称口径偏高/未如实标定边界”，不用“虚假/造假”——装置确实做了集成工作，问题在披露不充分。

意见 6（详证）：公式、图表与交叉引用校对问题汇总

本条为校对类合并条目。下列分“影响理解或照抄会误导”与“纯排版/校对级”两组，供作者全文系统通校。

6.1 影响理解或照抄会误导（建议优先改）

（1）式(4-8) Sauerbrey 方程分母漏电极面积 A（印 46 / 物 57）

式(4-7)（未简化）：Δf = −2f₀²Δm / (A√(ρ_q·μ_q)) · 1/(1+Δm/m)，分母含 A

式(4-8)（Δm≪m 简化后）：Δf = −2f₀²Δm / √(ρ_q·μ_q)，分母漏 A

参数：f₀ = 8 MHz、A = 0.196 cm²（d = 5 mm）、ρ_q = 2.684、μ_q = 2.947×10¹¹；作者自报“1 Hz ≈ 1.34 ng”

核实：按含 A 的正确式反算，量级与 1.34 ng 吻合；若按式(4-8) 字面无 A，结果差约 5 倍

标准 Sauerbrey 方程为 Δf = −2f₀²Δm / (A√(ρ_q·μ_q))。式(4-8) 漏掉 A 与上一步式(4-7)（有 A）及自报数值（实算含 A）矛盾。这是理论基石公式的排版错误，作者实际计算用了正确式，故非数值结论性错误，但照抄式(4-8) 会误导后人，应把分母的 A 补回。

（2）式(5-1)~(5-4) 与式(6-2)/(6-3)/(6-12)/(6-13) 逐字重复（印 80 vs 86–88）

第 5 章 §5.4.2 为算重复性给出 f_max、f_rec、I_res、I_rec 四个特征参数的定义与公式（式 5-1~5-4），其文字定义、公式、变量注（i_0 / i_90% / i_10% / i_max）与第 6 章 §6.1.3 的式 6-2、6-3、6-12、6-13 几乎完全相同。两章特征参数体系不一致：§5.4 性能评估只用 4 个特征，§6 应用建模用 12 个特征（多出 D_res / D_rec / D_resn / D_resx / D_recn / D_recx / T_res / T_rec 8 个导数与时间参数）。建议特征参数定义集中在第 6 章一处，第 5 章引用即可；并说明为何性能评估只用 4 参数而非建模的 12 参数（若 4 参数代表性不足，应补 12 参数的相对标准偏差）。

（3）图 3-3 ZIF-8 合成流程框锌源名称与用量双错（印 35）

流程框写“1.5 g 磷酸锌”，正文为“2.2 g 醋酸锌”。磷酸锌合不出 ZIF-8（ZIF-8 需锌盐 + 2-甲基咪唑配位），名称与用量双错，应改正为正文一致的醋酸锌与正确用量。

6.2 纯排版 / 校对级（建议一并改）

CCDC 卡片号不一致：正文 823084 vs 图 3-7 图例 864309（印 40）。

交叉引用章号/式号错位：§5.2.3 引“2.1.3 章节”应为“4.1.3”（印 69）；§6.1.5 决策树原理引“图 5-3”指向装置电气图（印 92）；SVR 目标函数引“式 6-31”应为“式 6-34”（印 95）。

§6.2.4 SVR 段正文误抄随机森林指标：写成 0.97 / 0.1491 / 5.59，表 6-4 该行（相关分析集）实为 0.94 / 0.1841 / 4.28（印 112）。表内数据自洽，是正文笔误。

单位标错：图 4-17 横轴“时间(s)”应为“天(d)”（印 59）；图 6-16~6-19 纵横轴菌落总数未标 lg CFU/g。

命名不统一：图 4-18(b)“疏水MIP” vs 正文“SiO₂-MIP”；图 3-6“ZIF-8MIP”缺斜杠；表 2-2“其他” vs 正文“环类”、“羧酸类” vs 正文“酸类”。

图 2-6 早期缺测画成 0 值连线（印 21）：1-辛烯-3-醇 0/1 d“未检出”被画成“0”并连线，视觉上掩盖“早期检不出”（与意见 3 相关），建议改为断点/空缺标注。

表 2-2“／”符号未在表注说明含义（印 22–23）：未检出/缺测/0 三义未区分，建议补表注。

自引未来年份文献：“Hou et al., 2026 / Hou et al., 2025”作既成结论佐证（印 40、60）。

图 1-5(b) 标为作者原理图却混入外文文献原图标注未清理（印 8）。

图 6-3 轴标“Va”未定义（印 99）：正文全程称“目标变量”，图轴标“Va”未注。

表 2-2“2,4-二叔丁基苯酚”行首多英文冒号（印 23）。

式(4-11) 变量表 ppm/c′ 混写、T=298 K 列出却不出现在式中（印 52）。

6.3 严重度与定性

严重度：中（含若干影响理解项，故不止“占位”）。在评阅书中合并为一条；在提交版中可压缩为“图表、公式与交叉引用校对问题较多，建议全文系统通校”一句，并点名式(4-8) 漏 A、图 3-3 锌源双错、特征公式两章重复三项优先处理。

附：评审结论与三件交付物立场一致性声明

本详细佐证与评阅书、提交版三件的事实判断、严重度排序、结论档次完全一致：

评审结论：修改后重新送审。
必须修改（需补实验/重做分析）：意见 1（第 6 章机器学习方法学，全文最严重）、意见 2（第 2 章数据查无对应）、意见 3（标志物与早期检测目标错配）。
建议修改（改措辞/调结构/补披露可修复）：意见 4（创新点夸大）、意见 5（装置含金量与编排）。
写作与格式：意见 6（校对类合并）。
结论依据：论文有实在工作量（材料合成表征、装置集成、完整检测流程、双模型对比），但核心定量结论（实现小麦霉变早期精准检测、可取代理化检测）的证据强度被第 6 章方法学问题与第 2 章数据问题削弱，且地基（标志物因果性）与链尾（机器学习泛化性）一头一尾相互关联。意见 1、2、3 必须改到位、由评审专家复核落实后，再决定是否进入答辩。结论按本篇论文自身证据独立判定，未继承任何其它论文的结论。

评审人签名：日期：2026-05-23