第 6 章是全文唯一产出高指标的章节(分类总体准确率 99.1%、回归 R²=0.97、RPD=5.59),全文核心结论(实现小麦霉变定量检测、可取代理化检测、储藏现场靶向精量识别)的全部定量证据都在这一章。但这些指标建立在一套从样本设计到建模评估都会让指标系统性虚高的流程上,四个子问题环环相扣:
四点叠加,使分类 99.1%、回归 R²=0.97 只能证明模型“认出了实验室这一批小麦的 7 个时间点”,证明不了它真的学到了“霉变程度与气味的定量关系”。
E1 — 样本构成(§6.1.1,印 84 / 物 95)
“本研究在试验过程中选择的小麦品种为‘郑麦 136’,购自河南省新乡市延津县‘帝益’麦业有限公司,收获于当年的五月上旬……试验依据小麦储藏在恒温恒湿箱中的不同时长(0 d、1 d、3 d、5 d、7 d、9 d 和 11 d)来制备不同梯度的小麦样本……每个梯度 16 个平行样本,共计 112 个样本。”
E2 — 特征优选(§6.2.2,印 99–100 / 物 110–111)
相关分析:“对目标变量与从QCM传感器原始频率响应曲线中提取的各个特征参数进行相关性分析,如果目标变量与各个特征参数的相关性越高,说明特征参数越重要,需要保留……将与目标变量相关性最低的特征参数 T_res 剔除……”
F 检验:“用 F 值来衡量各个特征参数与目标变量的关联程度,若 F 值越大,说明该特征参数越重要。”
E3 — 分类划分协议(§6.2.3,印 103 / 物 114)
“本研究使用的样品数量为 7 个梯度共计 112 个小麦样本,其属于小规模数据集,为了避免数据划分不合理导致的过拟合问题,故采用五折交叉验证法来评估模型的性能和泛化能力。”
E4 — 回归划分协议(§6.2.4,印 108 / 物 119)
“对 112 个小麦样本进行随机划分,训练集、验证集和测试集的划分比例为 70%、15% 和 15%……对于 PLSR、RFR 和 SVR……对 112 个小麦样本进行随机划分,训练集和测试集的划分比例为 75% 和 25%。”
E5 — 在测试集上挑最优特征集(§6.2.4,印 111 / 物 122,以随机森林为例)
“基于特征排列重要性分析后特征参数集的 RFR 模型测试集的决定系数 R² 最高、均方根误差 RMSE 最小,其值分别为 0.97、0.1491……综上所述,基于特征排列重要性分析后特征参数集的 RFR 模型展现出更优的预测性能……RPD 值为 5.59。”
E6 — 作者把离散真值误解释为“重叠”(§6.2.4,印 111 / 物 122)
“图 6-18 中看起来样本数较少的原因是样本点之间较为集中存在重叠现象,即相互遮挡导致的,样本数仍是 112 个。”
E7 — 核心结论措辞(§7.1(5)、§7.2(3),印 116 / 物 127)
“……实现了小麦霉变的定量检测,这将取代传统繁琐的四大霉菌毒素以及菌落总数的理化检测,实现在储藏现场小麦霉变的靶向精量识别。”
E8 — 作者自述的 RPD 判据(§6.1.6,印 96 / 物 107;式 6-41)
“当 RPD < 2.0 时,该模型被认为不适用于实际应用;当 2.0 ≤ RPD < 2.5 时……当 RPD ≥ 3.0 时,该模型被认为具有出色的预测性能。”
E9 — 作者诚实自承泛化性局限(§7.3(2),印 117 / 物 128)
本研究在实验室条件下对同一品种小麦“郑麦 136”进行检测,后续需验证不同品种、地理、年份的适用性。(转述,原文为展望第 2 条)
| 任务 | 模型 | 划分方式 | 比例(样本数) | 有无独立测试集 | 指标报在 | 原文页 |
|---|---|---|---|---|---|---|
| 分类 | DT/NB/SVM/KNN | 五折交叉验证 | 5 折轮流 | 无 | 五折 CV | 印 103 |
| 回归 | ANN | 随机划分 | 70/15/15(78/17/17) | 有验证+测试 | 测试集 | 印 108 |
| 回归 | PLSR/RFR/SVR | 随机划分 | 75/25(84/28) | 仅测试 | 测试集 | 印 108 |
三套划分协议并存且全部是随机划分,没有任何一套按时间或批次或平行样分组——近重复样必然跨训练/测试两边。任何一行都没有傻瓜基线对照列。
| 模型 | 最优特征集 | 训练 R²/RMSE | 测试 R²/RMSE | RPD |
|---|---|---|---|---|
| ANN | F 检验集 | 0.97 / 0.1949 | 0.96 / 0.1786 | 5.03 |
| PLSR | 聚类集 | 0.92 / 0.2302 | 0.94 / 0.1948 | 4.15 |
| RFR | F 检验集 | 0.99 / 0.0963 | 0.97 / 0.1491 | 5.59(全局最优) |
| SVR | 相关分析集 | 0.97 / 0.1457 | 0.94 / 0.1841 | 4.28 |
设回归目标变量(菌落总数对数值)只有 7 个离散档 y₁ < y₂ < … < y₇,且随霉变天数近乎单调递增。R² 的定义为:
R² = 1 − SS_res / SS_tot
其中 SS_tot = Σ(yᵢ − ȳ)²(目标变量总平方和),SS_res = Σ(yᵢ − ŷᵢ)²(残差平方和)。
关键在于 SS_tot 的结构:当真值聚成 7 个相距较远的离散档时,SS_tot 几乎全部来自“档与档之间的台阶”,而档内方差极小(同一档的 16 个平行样真值几乎相同)。这意味着:
RPD 同理。RPD 的定义为:
RPD = SD / RMSE
其中 SD 为真值标准差,RMSE 为预测均方根误差。
当真值跨度大(本文 7 档跨约 2.4 个 lg CFU/g 单位)时,分子 SD 被结构性抬高,RPD 随之偏大。Bellon-Maurel 等(2010)正是据此批评“RPD 神话”——RPD 依赖样本总方差,方差大时 RPD 虚高,单看 RPD 会高估模型质量。所以 RPD=5.59 看似远超作者自定的“出色”阈值(≥3.0,见 E8),但在离散单调目标上不能作为模型有效的证据。
伪重复进一步放大上述效应:把 16 个近重复样随机划分到训练/测试两边后,测试集每个样本在训练集都有十几个“孪生兄弟”,模型只要记住 7 个档的特征中心即可在测试时完成匹配。此时 SS_res 被压到极低,R² 与 RPD 双双虚高,但这反映的是“记住了 7 个簇心”,不是“学到了定量关系”。
P1 — 伪重复的经典定义与危害
P2 — 特征选择偏倚导致乐观偏差
P3 — 错误的交叉验证方式
P4 — 傻瓜基线对单调/平稳目标的必要性
P5 — 交叉验证不能补救伪重复
P6 — RPD 阈值来源与“RPD 神话”批评
辩护 1:“我用了五折交叉验证、留了独立测试集,泛化性是验证过的。”
回应:交叉验证救不了伪重复。五折交叉验证的前提是样本独立同分布,但本文每梯度 16 个平行样来自同一品种、同一批、同一加速处理,是近重复样本,不独立。随机五折必然把同一梯度的近重复样切到不同折,测试折里每个样本在训练折都有十几个“孪生兄弟”,折间泄露、准确率高估(P5)。要真正验证泛化性,必须按梯度分组做 GroupKFold,或用不同品种/批次的外部样本测试。回归更糟——连五折都没有,直接随机 75/25 划分,等于开卷考试。
辩护 2:“R²=0.97、RPD=5.59 是客观算出来的,数字摆在这里,很高。”
回应:高 R² 在“7 个离散单调真值”上没有意义(见 1.4 推导)。一个零参数平凡模型就能解释掉绝大部分档间台阶方差、轻松拿到高 R²,所以 0.97 无法区分“真学到了”和“只是认出了 7 个档”。RPD 同理被真值跨度结构性抬高(P6)。不设傻瓜基线,这两个数字证明不了任何东西(P4)。作者甚至把散点的离散簇误当成“重叠遮挡”(E6),说明对“只有 7 个真值”这一事实都没意识到。
辩护 3:“16 个平行样增加了样本量,让模型训练更充分、结果更可信。”
回应:平行样是伪重复,不是独立样本,它非但没增加有效样本量,反而制造了数据泄露。统计上的有效样本量是独立实验单元数(这里是 7 个霉变天数),不是 112(P1)。真要增加有效样本量,得加品种、加批次、加产地,而不是对同一批样品重复测 16 次。
辩护 4:“特征筛选只是降维,提高效率,不影响公正性。”
回应:本文特征筛选不是无监督降维,而是用了“特征与目标变量(答案)的相关性/F 值”来排序剔除(E2),且在划分之前、交叉验证之外做。这把测试集的标签信息提前漏进了特征选择,是 Ambroise & McLachlan 2002(PNAS)证明会产生显著乐观偏倚的选择偏倚,也是 Hastie ESL 明令禁止的“错误的交叉验证方式”(P2、P3)。
辩护 5:“这是同行常规做法,很多电子鼻/QCM 论文都这么划分。”
回应:领域里确有论文这么做,但“很多人这么做”不等于方法正确——Hurlbert 1984 当年统计的伪重复发生率就接近一半(P1),普遍不等于正确。对一篇博士学位论文而言,恰恰应高于“随大流”的标准;何况本文核心卖点是“实现储藏现场定量检测、取代理化检测”(E7),这种强应用主张必须有外部验证支撑。
严重度:必须修改、高(全文最严重的方法学问题)。这是方法学/实验设计层面的问题,不是数据造假指控。措辞应落在“现有验证设计无法支撑该强度的结论,需补做更严格的验证”,而非“结论错误”。结论本身未必为假,但论文提供的实验与建模设计无法证明它——结论强度显著高于证据强度。作者在 §7.3 已诚实自承泛化性未验证(E9),可在意见中正面引用以示公允。
§2.2.4 正文给出了两种物质含量随霉变变化的具体百分数(4-甲基-2-戊酮“从 9.75% 增加到 21.27%”、3-辛酮“从 4.81% 最终增加到 7.12%”),共 4 个数字(9.75 / 21.27 / 4.81 / 7.12)。把这 4 个数字与正文紧跟着引用的表 2-2(全表 28 种物质 × 7 个梯度约 130 个数据格)和图 2-6 的数据标签逐一比对,全部查无对应。已核实表头、图纵轴、正文叙述三处口径完全相同(均为“相对百分含量(%)”),排除了“口径不同导致数字不同但都真实”的可能。
“……4-甲基-2-戊酮的含量在霉变处理时间 1 d 和 3 d 之间产生一个较大的变化,从 9.75% 增加到 21.27%,此后的储藏时间里其含量均维持在 20%~25% 高含量区间内……3-辛酮这一挥发性化合物出现在小麦霉变处理时间的第 7 天,且含量呈现增长趋势,从 4.81% 最终增加到 7.12%……”
4-甲基-2-戊酮
- 正文(印 25)说:1 d → 3 d 从 9.75% 增加到 21.27%
- 表 2-2 实测(印 22–23,酮类该行 7 个梯度):3.67 / 7.90 / 19.33 / 20.28 / 11.52 / 15.93 / 22.56
- 图 2-6 黄柱数据标签(印 21):3.67 / 7.79(图内标签拥挤,表为 7.90)/ 19.33 / 20.28 / 11.52 / 15.93 / 22.56
- 结论:9.75 与 21.27 在表与图中均不存在。表中 1 d 实为 7.90、3 d 实为 19.33。
3-辛酮
- 正文(印 25)说:第 7 天出现,从 4.81% 增加到 7.12%
- 表 2-2 实测(印 22–23):未检出 / 未检出 / 未检出 / 未检出 / 2.76 / 1.5 / 6.73
- 图 2-6:3-辛酮未进入图 2-6(图 2-6 只画 4 个主要成分)
- 结论:4.81 与 7.12 在表中均不存在。表中 7 d 实为 2.76、11 d 实为 6.73。
趋势方向也对不上
- 正文说 4-甲基-2-戊酮“此后维持在 20%~25%”
- 实测 5/7/9/11 d = 20.28 / 11.52 / 15.93 / 22.56——其中 7 d(11.52)、9 d(15.93)明显跌出 20% 下限
- 正文说 3-辛酮“从 4.81 单调增到 7.12”
- 实测 7/9/11 d = 2.76 / 1.5 / 6.73——先升、再降、再升,非单调增
表 2-2 表头数值列总表头为“相对百分含量(%)”;图 2-6 纵轴标注“相对百分含量(%)”,刻度 0–25;§2.2.4 正文叙述用“含量……%”。三处口径完全相同。进一步证明:图 2-6 中 4-甲基-2-戊酮黄柱的数据标签(3.67 / 7.79 / 19.33 / 20.28 / 11.52 / 15.93 / 22.56)与表 2-2 该物质数值几乎逐点重合(仅 1 d 处因图内标签拥挤读作 7.79、表为 7.90,属 0.1 级别排版误差),证明图与表是同一套数据的两种呈现,不存在“峰面积 vs 相对含量”两套口径错位。因此本条不能降级为“口径未标注致混淆”。
反驳 A:“正文引用的是某两个特定时间点的值,不是表里的梯度值。”
回应:正文已明确把数字绑定到具体梯度——“1 d 和 3 d 之间……从 9.75% 增加到 21.27%”即 1 d=9.75、3 d=21.27;“第 7 天出现……从 4.81% 增加到 7.12%”即 7 d=4.81、终点=7.12。这些正是表 2-2 已有的梯度点,但表里这些点的实测值是 7.90 / 19.33 / 2.76 / 6.73,与正文四值全部不符。表 2-2 就是全部 7 个时间点的完整数据,没有第 8 个时间点可供引用。反驳不成立。
反驳 B:“图和表口径不同(峰面积 vs 相对含量),所以数字不同但都真实。”
回应:已逐字核对,表 2-2 表头、图 2-6 纵轴、正文叙述三处口径完全相同,均为“相对百分含量(%)”,且图 2-6 黄柱标签与表 2-2 数值几乎逐点重合,证明是同一套数据。反驳不成立。
反驳 C:“9.75、21.27 可能是某个未列入表 2-2 的细分组分或重复样均值。”
回应:表 2-2 是 GC-MS 解析的最终结果表,4-甲基-2-戊酮、3-辛酮各只占一行,无细分组分;论文全章未提供任何重复样的逐次原始值或第二套均值表。正文数字若来自“另一套均值”,则该套数据全文未披露,仍构成“正文数据无图表支撑”。反驳不成立。
反驳 D:“这是笔误——把别的物质或别的梯度的数字写错了。”
回应:这是最宽容的解释,但仍无法把四个数字“对回”任何真实来源——9.75 / 21.27 / 4.81 / 7.12 在全表任何物质任何梯度都找不到,不是“抄错行/抄错列”那种能定位到源头的笔误(例如把 19.33 误写成 21.27 尚可理解,但 9.75 在全表无任何近邻值可对应)。即便假设为笔误,作者也必须重新核对原始数据并改正。此反驳可作为作者最低限度的台阶,但不改变“必须修改”的处置。
严重度:必须修改、高。定性为“正文数值在所引图表中查无对应(数据来源不明 / 正文数据与图表不一致)”,非“口径混淆”(口径已核实同源)。禁用“编造/造假/伪造数据”等定性词。理由:第 2 章是全文标志物选择的地基,本章数据若有“正文写的数图表里找不到”的情况,会直接动摇读者对整章 GC-MS 解析结果与后续相关分析的信任。3-辛酮第 11 天实测 6.73 与正文 7.12 接近,更像记录或誊写环节出了问题。
论文核心目标是“小麦霉变早期检测”,但选定的唯一标志物 1-辛烯-3-醇在最早两个时间点(0 d、1 d)完全未检出、3 d 才首次出现且仅 3.21%(全程最低)。标志物的地基有三处裂缝:① 早期检不出与早期检测目标方向相反(最硬);② 仅凭一个最高相关系数定唯一标志物,未做唯一性/特异性论证;③ 菌落总数口径自相矛盾(自承不能判定霉变程度,却作唯一对照)。标志物是全文研究链起点,地基松则后续 MIP 靶向合成、双模型预测的机理正当性全部失支点。
研究目标 = 早期检测(§1.3.1,印 10 / 物 21)
“本研究旨在基于 QCM 传感器开发嗅觉检测装置用于小麦霉变早期的快速无损与精准定量检测。”
§1.3.2(5)(印 11 / 物 22)
“……实现小麦霉变的快速、无损与精准的早期检测,更好地指导防霉减损工作,为粮食安全提供有力的保障。”
1-辛烯-3-醇逐梯度实测(表 2-2,印 22–23 / 物 33–34)——见 3.3 隔离块。
作者自述(§2.2.4,印 25 / 物 36)
“1-辛烯-3-醇的含量在第 3 d 后随着储藏时间的增加而有规律地增加……”
选唯一标志物的理由(§2.2.4,印 25 / 物 36)
“对不同霉变时间小麦的挥发性化合物含量与菌落总数进行相关性分析,相关系数的计算选择皮尔逊相关系数……1-辛烯-3-醇展现出了与菌落总数的最大相关系数,其值为 0.95,这一结果验证了选择 1-辛烯-3-醇为小麦霉变过程中挥发性标志物的合理性……”
菌落总数口径(§2.2.3,印 23 / 物 34)
“根据国标 GB 4789.2-2022 检测出小麦样品的菌落数并不等于霉菌数,不能直接用于判定小麦的霉变程度,仅用于卫生污染水平参考。因此,本研究将菌落总数作为表征霉变小麦污染水平的理化指标……”
储藏时间 0 d 1 d 3 d 5 d 7 d 9 d 11 d 1-辛烯-3-醇相对含量(%) 未检出 未检出 3.21 5.15 5.48 8.93 17.33
- 早期(0 d、1 d):完全未检出
- 首次检出:3 d,仅 3.21%(全程最低)
- 终点:11 d 达 17.33%,是 3 d 的 5.4 倍
- 形态分级(§2.2.1):初期变质阶段为 3~5 d;0/1 d 为新鲜小麦
- 一句话:在本文这套加速霉变实验的实测数据里,它 0 d、1 d 未检出、3 d 才出现,早期缺席、越到后期越强,恰好把灵敏度给了最不需要的后期,与本文设定的早期检测目标错配。
论文两处明写终极目标是“早期检测”(§1.3.1 印 10、§1.3.2(5) 印 11),且明写传感器是“根据标志物”用分子印迹制备的靶向器件。可作为唯一标志物兼 MIP 模板分子的 1-辛烯-3-醇,在最早的 0 d、1 d 实测为未检出(表 2-2 印 22),3 d 才首现且仅 3.21%。开头说要做早期检测 → 选的标志物却在早期是空的 → 结尾仍把“早期精准检测”当成已实现的成果(§7.1/§7.2 印 116)——目标与手段方向相反。
支持作者的一面
反对“把它当早期标志物”的一面
标志物筛选应多指标综合(支持症状②)
反驳 A:“1-辛烯-3-醇是国际公认标志物,文献都这么用,选它没错。”
回应:承认 1-辛烯-3-醇是公认真菌标志物。但“是公认标志物”回答的是“它能不能表征霉变”,回答不了“它能不能用于早期检测”。领域规范明确早期预警标志物的判据是“在可见污染之前可检出”,而本文实测它在 0/1 d 检不出、3 d 才 3.21%——在自己的数据里它就不是早期信号。文献光环洗不掉表 2-2 里那两个“未检出”。
反驳 B:“0.95 是 28 种里最高的相关系数,最高的当然最该选。”
回应:最高相关只证明“在所有候选里它与菌落总数的线性同步性最好”,证明不了“它唯一”“它因果”“它特异”。多种 VOCs 随霉变时间齐涨,都会与同样随时间上升的菌落总数高相关,高相关在这里很大程度是“共同被时间驱动”的假象。论文未给其它 VOCs 的相关系数(图 2-10 不可辨认),读者无从判断 0.95 与次高值差多少。而且最高相关与早期可检出可能正相反——一个后期才陡升的物质恰恰容易拿到高时间相关系数,却正因“后期才起来”而不适合早期检测。
反驳 C(作者最强反驳):“0 d、1 d 是新鲜小麦本来就没霉变,测不到很正常,不能算缺陷。”
回应:部分承认——0/1 d 确是新鲜小麦,无真菌代谢、检不出真菌 VOC 在生物学上说得通,这一点不宜定性为“数据异常”。但这恰恰反证了“用它做早期检测”的逻辑漏洞:早期检测的价值正是在“霉变刚启动、肉眼还看不出”时报警,而论文自己把最早的霉变阶段定在 3~5 d,1-辛烯-3-醇在 3 d 才首现且仅 3.21%(全程最低)。结论不是“0/1 d 测不到是数据错误”,而是“选一个早期信号最弱的物质作早期检测的唯一靶分子,是标志物选择与研究目标的方向性错配”。越承认它早期没有,越说明它不该被指派做早期检测的主力。
反驳 D:“我用菌落总数做对照是粮食领域常规,CFU 和霉变就是正相关。”
回应:承认菌落总数作霉变污染代理在粮食卫生领域有惯例,本条不宜上纲到“方法错误”。但问题不在“能不能用菌落总数”,而在“论文自己先声明它不能判定霉变程度,转头又拿它当判定标志物合理性的唯一标尺”——这是论文内部口径的自相矛盾。作者只需补一句“虽菌落总数不等于霉菌数,但作为污染水平代理与霉变进程正相关,故作对照”把逻辑补圆即可,但现稿没补。
| 症状 | 定性 | 处置 | 严重度 |
|---|---|---|---|
| ① 早期检不出 | 标志物选择与早期检测目标方向性错配(地基级逻辑断裂) | 必须修改 | 高 |
| ② 仅凭最高相关定唯一 | 标志物唯一性论证不充分(相关≠因果≠特异) | 必须补充论证 | 高 |
| ③ 菌落总数口径矛盾 | 前后表述冲突(口径矛盾) | 建议修改 | 中 |
措辞红线:症状①用“冲突/错配”不用“不足”,但不写成数据造假(0/1 d 检不出有生物学解释);症状②用“论证不充分”,不写成“标志物选错了”(1-辛烯-3-醇作霉变标志物本身站得住);症状③用“前后表述冲突”,不写成“方法错误”。
创新点(2)宣称“突破了 QCM 气敏传感器无法特异性识别目标气体(选择性差)……的局限性”,把“特异性识别”当成已做到的成果宣讲。但第 4 章实测显示,传感器只能认出“含羟基的醇类”这一大类(对 1-壬醇、苯乙醇的响应反而高于含量更高的酯、酮干扰物),并没有认出“1-辛烯-3-醇这一个分子”;正因单传感器分不清同类分子,第 6 章才要再上 12 维特征 + 机器学习做模式识别。三处口径对不上:第 4 章实测(只到官能团级)→ 第 6 章实做(靠多特征机器学习补)→ 第 7 章宣称(已突破无法特异识别)。
定性为“宣称口径夸大/措辞与实做不符”,不是技术错误——技术路线(粗选择性传感器 + 多特征 + 机器学习)本身是电子鼻/气敏阵列领域的标准合理做法。
创新点(2)(§7.2,印 116 / 物 127)
“(2)合成了分子印迹聚合物(MIP)、金属有机框架(ZIF-8)和疏水 SiO₂ 等新型功能材料……突破了 QCM 气敏传感器无法特异性识别目标气体(选择性差)与高湿度检测条件下信号漂移失真(湿度敏感)的局限性。”
作者自设的“特异识别”标准(§4.3.4(3),印 57 / 物 68)
“传感器理想状态下希望只对目标气体产生响应,即传感器可以特异性识别目标气体而避免交叉敏感问题(Ye et al., 2023)……”
第 4 章实测(§4.3.4(3),印 58 / 物 69)
“……此外,小麦挥发性气味中含量较低的 1-壬醇和苯乙醇的频率响应反而略高于含量较高的邻苯二甲酸二丁酯、棕榈酸甲酯和 4-甲基-2-戊酮,出现这一现象的原因可能是 1-壬醇和苯乙醇均属于醇类,与 1-辛烯-3-醇具有相似的化学结构,说明合成修饰材料 MIP 时,羟基官能团的原因在印记空腔中贡献了比较重要的特征位点。”
第 6 章为何还要上机器学习(§6.1 章首,印 84 / 物 95)
“……然后结合机器学习的多种模式识别算法对不同霉变程度的小麦样品进行定性区分……结合机器学习的多种回归预测算法实现小麦样品不同污染水平的定量预测。”
注意:论文未给任何干扰物的频移数值,下表“响应”列只能填论文文字给出的定性序关系。
气体 化学类别 在小麦中含量 MIP 传感器响应(论文定性序) 1-辛烯-3-醇(目标/模板) 醇类(含 -OH) 较高、变化显著 最大 1-壬醇(干扰) 醇类(含 -OH) 较低 次高——“反而略高于”下列酯酮 苯乙醇(干扰) 醇类(含 -OH) 较低 次高——“反而略高于”下列酯酮 邻苯二甲酸二丁酯(干扰) 酯类 较高 低于上面两个同类醇 棕榈酸甲酯(干扰) 酯类 较高 低于上面两个同类醇 4-甲基-2-戊酮(干扰) 酮类 较高 低于上面两个同类醇 一句话读表:含量更低的两个“醇”压过了含量更高的“酯/酮”——传感器排序依据是“是不是醇(有没有 -OH)”,不是“是不是 1-辛烯-3-醇这个分子”。这是官能团级选择性的直接证据。
定量缺口:图 4-15 为雷达图,无数值;全文无选择性系数、无响应比、无干扰物检测限。若要主张“特异识别”,至少应给出 1-辛烯-3-醇响应 ÷ 同类醇响应的比值并证明该比值足够大(如 >5);论文没有,且文字已暴露该比值接近甚至小于 1。
论文在第 4 章实测里写得很清楚:传感器对两个含量更低的同类醇(1-壬醇、苯乙醇)响应反而比含量更高的酯、酮更强(§4.3.4 印 58),作者自己也把原因归到“羟基官能团”上——也就是传感器认的是“是不是醇”,不是“是不是 1-辛烯-3-醇这一个分子”。到了第 6 章,正因为单传感器分不清同类分子,才又提了 12 维特征上 4 种机器学习算法做模式识别(§6.1 印 84)。可第 7 章创新点(2)却写“突破了 QCM 气敏传感器无法特异性识别目标气体(选择性差)的局限性”(§7.2 印 116)。第 4 章只做到官能团级 → 第 6 章靠机器学习补 → 第 7 章却说已突破特异识别,三处对不上。
MIP 气敏传感器对小分子常只达类选择性,是公认局限
“粗选择性传感器 + 多特征/阵列 + 机器学习模式识别”是电子鼻领域标准做法(方法对,问题只在措辞)
MIP-QCM 真能做到高选择性的反例(强化对比)
反驳 1:“官能团级选择性也是选择性,我说‘选择性差’被突破,没说做到分子级特异。”
回应:站不住。① 创新点(2)原文是“突破了 QCM 气敏传感器无法特异性识别目标气体(选择性差)……的局限性”,“突破了无法特异识别”等于声称“现在能特异识别”。② 作者自己在 §4.3.4(3) 把“特异性识别”定义为“只对目标气体产生响应、避免交叉敏感”,按此标准对两个同类醇响应更高就是没达标。③ §7.1(2) 又称 MIP 具“特异性识别功能”——前后一致用“特异识别”自我定性。三处自述叠加,作者无法主张“我只说了选择性改善”。
反驳 2:“1-壬醇、苯乙醇含量低,实际样品里干扰小,不影响霉变检测。”
回应:① 这是把“应用层面凑合能用”偷换成“传感器特异识别成立”,两码事。创新点是对传感器能力的宣称,不是对系统在特定样品下够用的宣称。② 恰恰因为单传感器分不清同类分子,第 6 章才需要 12 维特征 + 机器学习;用“含量低所以不影响”来解释,正好承认了“靠的是浓度差和后端算法,不是传感器特异性”。
反驳 3:“图 4-15 已显示目标响应‘最大且差异显著’,选择性已证明。”
回应:① “差异显著”是雷达图目测结论,全文无一个数值、无选择性系数、无响应比。② 即便目标响应最大,“对同类醇响应高于含量更高的酯酮”已说明排序依据是官能团而非分子,“最大”只能支撑官能团级粗选择性。③ NIP 对照只证明“印迹比不印迹强”,不证明“印迹达到分子特异”。
反驳 4:“用机器学习是为了做霉变程度分级/菌落总数预测,跟传感器选择性是两回事。”
回应:部分成立但不解围。① 分级/定量确实需要建模,这点合理(方法路线没错)。② 但这恰说明:装置识别霉变靠的是“单传感器响应模式 + 机器学习”这一整体,而非“传感器特异识别 1-辛烯-3-醇”。既然系统价值来自“粗选择性 + 机器学习”的组合,创新点就该如实表述为该组合的价值。③ 论文第 6 章从未声明“因为传感器只到官能团级所以需要多特征”,反而默认装置可特异检测霉变气味,回避了这层逻辑,使创新点(2)与第 6 章实做脱节。
严重度:高(创新点是博士论文核心评价对象)。但可通过改写措辞 + 补定量数据修复,不动实质结论档次。用词应是“夸大/言过其实/措辞强度超过数据支撑”,不能用“错误/造假/伪造”。须明确区分“方法对不对”(对)与“话说大了没有”(说大了)。在第三部分意见归类中列入“建议修改”——因其修复方式是改写措辞与补数据,不需要推翻实质结论或重做核心实验,与意见 1/2/3 的“必须补实验/重做分析”性质不同。
两个相对独立的子问题:① 论文反复强调“创制专用嗅觉检测装置”,但装置最核心的 QCM 频率信号读取完全由商用辰华 CHI400C 电化学石英晶体微天平完成,控制软件只是“将 CHI400C 软件嵌入”,整机其余部件基本为市售选型——论文未如实标定自研/选型边界,宣称口径偏高;② 第 4 章传感特性测试正文称用“第五章已研发的装置”、且引用第 4 章的图 4-12,而第 5 章装置又依赖第 4 章传感器——形成双向互依且呈现顺序倒置,装置核心气路图(图 4-12)物理编在第 4 章却被第 5、6 章反向回引。两子问题均不影响数据正确性,是规范性/可读性问题。
频率读取设备(§5.2.3,印 70 / 物 81,图 5-9):商用辰华 CHI400C 电化学石英晶体微天平,基频 8 MHz,时间分辨法。图 5-9 机身印“石英晶体微天平”。
控制软件(§5.3.5(3),印 78 / 物 89):自研软件仅“将 CHI400C 软件嵌入”。图 5-14(a) 为 CHI400C 原生英文界面“Electrochemical Techniques”、(b)“Quartz Crystal Microbalance Parameters”。
下位机采集卡(§5.2.1,印 64 / 物 75,图 5-4、表 5-1):市售恒凯 USB-DAQ-V1.2(板上丝印 USB_DAQ V1.2 / HKTECH),只管 MFC、继电器、电磁阀,不做频率采集。
气体检测室(图 5-8(b),印 69 / 物 80):机身印“CH Instruments EQCM Oscillator”,基于商用 EQCM 振荡器改制。
第 4 章对第 5 章的反向依赖(§4.3.2,印 53 / 物 64)
“在第五章以制备的 QCM 传感器为核心部件研发设计了……嗅觉检测装置,因此,QCM 传感器的传感特性评估将采用研发的嗅觉检测装置进行,如图 4-12 所示。”
装置核心气路图归属错位(图 4-12,印 54 / 物 65):物理编号在第 4 章,被 §5.4.1(印 79)、§6.1.2(印 85)反向回引。
部件/模块 来源 备注 频率信号读取 商用 CHI400C(辰华) 装置“读数核心” 频率采集软件界面 商用 CHI400C 软件嵌入 非自研 气体检测室 商用 EQCM Oscillator 改制 小幅改制 下位机数据采集卡 市售 USB-DAQ-V1.2(恒凯) 只管气路,不碰频率 质量流量控制器 市售 ACU10FA-LC(北京精量) — 气源(钢瓶+减压阀) 市售 — 5 阀 5 继电器 市售 — 气路时序集成(5 状态切换) 自研 原创成分 上位机控制软件外壳(C++/MFC 三层架构) 自研 原创成分 样品室/分体检测室结构 自研/小幅改制 原创成分 一句话:装置的“读数核心”是市售 CHI400C,原创成分主要落在气路集成、控制软件外壳、检测室小幅改制。集成创新可成立,但论文未如实标出此边界。
反驳 1:“用商用 CHI400C 做频率读取是常规,集成本身就是创新。”
回应:承认集成创新可成立、有价值,本条不否定装置的工程价值。问题只在“如实标定”——论文把“集成 + 软件外壳”包装成“创制装置”,未标出频率测量靠商用、自研在集成与软件这条边界,宣称口径偏高。只需补一张自研/选型清单表、把“创制”准确限定到集成与软件层面即可,不要求推翻装置工作。
反驳 2:“图 4-12 放在哪章不影响内容正确性,是小事。”
回应:单看图序确实不影响数据,但叠加“第 4 章测试用第 5 章装置”的反向依赖,构成读者读第 4 章时“装置不存在却已被使用”的逻辑断点,读起来会卡住。修法简单(图移回第 5 章 + 第 4 章加前向说明),但应改。
严重度:中(含金量披露偏中偏高,编排偏中)。两子问题都可通过如实补充披露 + 调整结构修复,不影响数据与结论正确性,列入“建议修改”。措辞用“宣称口径偏高/未如实标定边界”,不用“虚假/造假”——装置确实做了集成工作,问题在披露不充分。
本条为校对类合并条目。下列分“影响理解或照抄会误导”与“纯排版/校对级”两组,供作者全文系统通校。
(1)式(4-8) Sauerbrey 方程分母漏电极面积 A(印 46 / 物 57)
- 式(4-7)(未简化):Δf = −2f₀²Δm / (A√(ρ_q·μ_q)) · 1/(1+Δm/m),分母含 A
- 式(4-8)(Δm≪m 简化后):Δf = −2f₀²Δm / √(ρ_q·μ_q),分母漏 A
- 参数:f₀ = 8 MHz、A = 0.196 cm²(d = 5 mm)、ρ_q = 2.684、μ_q = 2.947×10¹¹;作者自报“1 Hz ≈ 1.34 ng”
- 核实:按含 A 的正确式反算,量级与 1.34 ng 吻合;若按式(4-8) 字面无 A,结果差约 5 倍
标准 Sauerbrey 方程为 Δf = −2f₀²Δm / (A√(ρ_q·μ_q))。式(4-8) 漏掉 A 与上一步式(4-7)(有 A)及自报数值(实算含 A)矛盾。这是理论基石公式的排版错误,作者实际计算用了正确式,故非数值结论性错误,但照抄式(4-8) 会误导后人,应把分母的 A 补回。
(2)式(5-1)~(5-4) 与式(6-2)/(6-3)/(6-12)/(6-13) 逐字重复(印 80 vs 86–88)
第 5 章 §5.4.2 为算重复性给出 f_max、f_rec、I_res、I_rec 四个特征参数的定义与公式(式 5-1~5-4),其文字定义、公式、变量注(i_0 / i_90% / i_10% / i_max)与第 6 章 §6.1.3 的式 6-2、6-3、6-12、6-13 几乎完全相同。两章特征参数体系不一致:§5.4 性能评估只用 4 个特征,§6 应用建模用 12 个特征(多出 D_res / D_rec / D_resn / D_resx / D_recn / D_recx / T_res / T_rec 8 个导数与时间参数)。建议特征参数定义集中在第 6 章一处,第 5 章引用即可;并说明为何性能评估只用 4 参数而非建模的 12 参数(若 4 参数代表性不足,应补 12 参数的相对标准偏差)。
(3)图 3-3 ZIF-8 合成流程框锌源名称与用量双错(印 35)
流程框写“1.5 g 磷酸锌”,正文为“2.2 g 醋酸锌”。磷酸锌合不出 ZIF-8(ZIF-8 需锌盐 + 2-甲基咪唑配位),名称与用量双错,应改正为正文一致的醋酸锌与正确用量。
- CCDC 卡片号不一致:正文 823084 vs 图 3-7 图例 864309(印 40)。
- 交叉引用章号/式号错位:§5.2.3 引“2.1.3 章节”应为“4.1.3”(印 69);§6.1.5 决策树原理引“图 5-3”指向装置电气图(印 92);SVR 目标函数引“式 6-31”应为“式 6-34”(印 95)。
- §6.2.4 SVR 段正文误抄随机森林指标:写成 0.97 / 0.1491 / 5.59,表 6-4 该行(相关分析集)实为 0.94 / 0.1841 / 4.28(印 112)。表内数据自洽,是正文笔误。
- 单位标错:图 4-17 横轴“时间(s)”应为“天(d)”(印 59);图 6-16~6-19 纵横轴菌落总数未标 lg CFU/g。
- 命名不统一:图 4-18(b)“疏水MIP” vs 正文“SiO₂-MIP”;图 3-6“ZIF-8MIP”缺斜杠;表 2-2“其他” vs 正文“环类”、“羧酸类” vs 正文“酸类”。
- 图 2-6 早期缺测画成 0 值连线(印 21):1-辛烯-3-醇 0/1 d“未检出”被画成“0”并连线,视觉上掩盖“早期检不出”(与意见 3 相关),建议改为断点/空缺标注。
- 表 2-2“/”符号未在表注说明含义(印 22–23):未检出/缺测/0 三义未区分,建议补表注。
- 自引未来年份文献:“Hou et al., 2026 / Hou et al., 2025”作既成结论佐证(印 40、60)。
- 图 1-5(b) 标为作者原理图却混入外文文献原图标注未清理(印 8)。
- 图 6-3 轴标“Va”未定义(印 99):正文全程称“目标变量”,图轴标“Va”未注。
- 表 2-2“2,4-二叔丁基苯酚”行首多英文冒号(印 23)。
- 式(4-11) 变量表 ppm/c′ 混写、T=298 K 列出却不出现在式中(印 52)。
严重度:中(含若干影响理解项,故不止“占位”)。在评阅书中合并为一条;在提交版中可压缩为“图表、公式与交叉引用校对问题较多,建议全文系统通校”一句,并点名式(4-8) 漏 A、图 3-3 锌源双错、特征公式两章重复三项优先处理。
本详细佐证与评阅书、提交版三件的事实判断、严重度排序、结论档次完全一致:
评审人签名: 日期:2026-05-23