论文选题: [ ] 优 [√] 良 [ ] 中 [ ] 差
文献综述: [ ] 优 [√] 良 [ ] 中 [ ] 差
创新成果: [ ] 优 [ ] 良 [√] 中 [ ] 差
理论知识: [ ] 优 [√] 良 [ ] 中 [ ] 差
科研能力: [ ] 优 [ ] 良 [√] 中 [ ] 差
学术道德: [ ] 优 [√] 良 [ ] 中 [ ] 差
写作规范: [ ] 优 [ ] 良 [√] 中 [ ] 差
总体评价: [ ] 优 [ ] 良 [√] 中 [ ] 差
是否同意答辩: [ ] 同意答辩
[√] 较大修改后答辩
[ ] 不同意答辩
评阅人对该研究领域的熟悉程度:
[√] 熟悉 [ ] 比较熟悉 [ ] 一般 [ ] 不够熟悉
各维度定档理由:
本文面向小麦在储藏中易霉变、而现有理化检测准确却慢且贵、难以在储粮现场实时使用这一实际瓶颈,构建了一条从标志物解析到整机检测的完整研究链。作者先用顶空固相微萃取结合气质联用解析了小麦霉变过程的挥发性气体并锁定一个挥发性标志物,再以该标志物为模板分子合成了分子印迹聚合物、金属有机框架与疏水二氧化硅的复合气敏材料并做了较系统的表征,随后把这套材料修饰到石英晶体微天平金电极上制成气敏传感器,集成了一台小麦霉变专用嗅觉检测装置,最后提取十二维特征参数、建立四种分类模型与四种回归模型,做霉变程度分类与污染水平定量预测。论文工作量是实在的,材料合成与多手段表征、传感器制备到整机集成、再到完整检测流程都走通了,分类与回归两类模型也做了横向对比,章节结构完整、图表丰富,体现了作者在材料、传感、机械与算法上的综合工程素养。论文整体规范,但其核心定量结论的证据强度尚不足以支撑结论强度,第六章建模设计、第二章数据一致性、标志物选择与早期检测目标的匹配等方面存在若干需补做实验或重做分析才能修复的问题,需较大修改完善后再行送审。
意见一:第六章解析了小麦霉变的检测建模,是全文唯一产出高指标的章节,但当前的实验与建模设计会让指标系统性虚高。
第六章用一百一十二个样本建立了分类与回归模型,报告了分类总体准确率百分之九十九点一、回归决定系数零点九七、剩余预测偏差五点五九,是支撑全文核心结论的全部定量证据。该章工作完整,但目前从样本设计到建模评估有四处相扣的环节会让指标偏高,需要先解决。
首先,这一百一十二个样本不是一百一十二个互相独立的样本。样本来自单一品种、单一来源、单一批次,在恒温恒湿箱里按七个霉变天数加速处理,每个天数做十六个平行样。同一天数的十六个平行样几乎是同一条曲线的复制品,统计上叫伪重复,真正独立的实验对象只有七个霉变天数。把这十六个近乎一样的样本随机打散到训练集和测试集两边,测试集里每个样本在训练集都能找到十几个几乎一模一样的孪生兄弟,于是模型不必学会霉变程度与气味的对应关系,只要记住每个天数那一簇曲线的样子就能在测试时匹配上,这就造成了数据泄露,因为伪重复人为夸大了有效样本量、压低了误差,导致指标虚高。
其次,特征筛选时偷看了答案。论文的相关分析和 F 检验都是用特征与目标变量的相关性在全部样本上排序、再剔除弱特征,而且这一步放在划分训练测试集之前完成。这等于在留出测试集之前就让特征选择见过了将来要当测试集的那些样本的答案,因而带来明显的乐观偏差,使后续在测试集上的表现被高估。
此外,回归目标只有七个离散真值,全章四个模型只互相比,从头到尾没有和永远预测均值、按相邻档真值外推这类零参数傻瓜模型比过。菌落总数只有七个档且随霉变天数近乎单调递增,这种离散单调结构下目标的方差几乎全来自档与档之间的台阶,一个零参数模型只要把样本大致归到正确的档就能解释掉绝大部分方差、轻松拿到高决定系数,因此零点九七这个数分不清模型是真学到了还是只认出了七个档;剩余预测偏差也因真值跨度大而被结构性抬高,单看这个数会高估模型质量。此外作者把回归散点聚成几簇误解释为样本点重叠遮挡,没意识到那是因为真值只有七个档造成的。
把这四点叠起来,分类百分之九十九点一与回归零点九七只能证明模型认出了实验室这一批小麦的七个时间点,证明不了它真的学会了什么样的气味对应什么程度的霉变,因而无法支撑实现定量检测、可取代理化检测、储藏现场靶向精量识别的结论强度。需要说明的是,结论本身未必为假,作者在第七章展望中也诚实写明只对郑麦一三六在实验室条件下检测、后续要验证不同品种产地年份,这恰好印证了泛化性尚未验证,因此这是实验设计层面的问题而非数据造假。
建议作者:
意见二:第二章解析了小麦霉变的挥发性气体谱并测了各成分含量,但正文写的两组数据在它自己引用的表和图里查无对应。第二章是全文标志物选择的地基,正文第 25 页描述两种物质含量随霉变的变化时给了四个具体百分数,即 4-甲基-2-戊酮从百分之九点七五增加到百分之二十一点二七、3-辛酮从百分之四点八一增加到百分之七点一二。但翻到它紧跟着引用的表 2-2 和图 2-6,这四个数一个都找不到:表里 4-甲基-2-戊酮七个时间点实测为百分之三点六七、七点九、十九点三三、二十点二八、十一点五二、十五点九三、二十二点五六,3-辛酮实测为前四点未检出、后三点为百分之二点七六、一点五、六点七三。已核实表头、图纵轴、正文叙述三处口径完全相同,都是相对百分含量,且图柱标签与表值几乎逐点重合,因此不是峰面积与相对含量两套口径造成的数字差异;趋势方向也对不上,正文说 4-甲基-2-戊酮此后维持在百分之二十到二十五,但实测第七天、第九天都跌出了百分之二十的下限。由于正文数字在全表任何物质任何时间点都找不到对应,不属于能定位到源头的抄错行抄错列,会直接动摇读者对整章解析结果的信任。这里客观说明,这是正文数据与图表对不上、来源不明,不是数据造假,3-辛酮第十一天实测六点七三与正文七点一二接近,更像记录或誊写环节出了问题。建议作者把这四个数与表 2-2、图 2-6 逐一核对,改成与实测一致或补出确切出处;把两种物质的趋势描述改为与实测相符;并对第二章全部正文引用的数值与图表逐一复核,确认没有其它同类不一致。
意见三:论文从头到尾以小麦霉变早期检测为目标,但选定的唯一标志物恰好在早期检不出来。这条目标与手段的方向性错配是全文研究链起点上的问题,需要理顺。
研究目标在第 10 页明确写为小麦霉变早期的快速无损与精准定量检测,传感器也是根据这个标志物用分子印迹制备的靶向器件,因此标志物选得是否合适直接决定后续合成与建模的机理正当性。目前这个标志物的地基有三处需要补的地方。
首先,被选为唯一标志物的 1-辛烯-3-醇在本文实测的最早两个时间点根本测不到。表 2-2 显示它第零天、第一天均未检出,第三天才首次出现且仅百分之三点二一(全程最低),到第十一天才升到百分之十七点三三。作者自己也写它在第三天后才随储藏时间有规律地增加。早期检测的价值正在于霉变刚启动、肉眼还看不出时就预警,而本文恰恰把灵敏度给了最不需要的中后期,等于让报警器对最该报警的时段失灵,因此用它做早期检测的唯一靶分子与论文设定的目标方向相反。这里需要公允说明,1-辛烯-3-醇确是国际公认的真菌霉变标志物,作者选它表征霉变本身没错,但是公认标志物回答的是它能不能表征霉变,回答不了在本文这套数据里它能不能撑起早期检测。
其次,论文只凭一个最高相关系数就定了它一个。正文只给出 1-辛烯-3-醇与菌落总数的皮尔逊相关系数最大、为零点九五这一条理由,没有列其它物质对菌落总数的相关系数排名。相关系数高只证明它和菌落总数同步上升得最好,证明不了它唯一、它因果、它特异;霉变过程里多种挥发物都随时间齐涨,都会和同样随时间上升的菌落总数高相关,这种高相关很大程度是被时间共同推着走的假象。由于读者看不到第二名差多少(图 2-10 字太小、数值重叠读不出),无从判断零点九五的区分度,唯一性更谈不上。
此外,菌落总数的口径前后打架。作者先声明菌落数不等于霉菌数、不能直接用于判定小麦霉变程度、仅作卫生污染水平参考,转头却把它当成判定标志物合理性的唯一对照变量。用菌落总数作霉变污染的代理在粮食领域有惯例基础、不算方法错,问题在于论文自己打自己的脸却没把逻辑补圆,读者会卡在这处自相矛盾上。
建议作者:
意见四:创新点二提出用分子印迹聚合物(MIP)复合修饰来突破 QCM 传感器选择性差的瓶颈,实现对小麦霉变标志物的特异识别,这是本文传感器部分的核心卖点。但从第四章的选择性实测数据看,传感器实际达到的选择性层级与分子特异识别的宣称之间存在差距。
首先,第四章的选择性实测结果并不支持分子级识别。实测显示,含羟基的 1-壬醇与苯乙醇的频率响应反而高于含量更高的酯类、酮类干扰物。因为传感器对带羟基的这一类物质都给出强响应,而不是只对 1-辛烯-3-醇这一个分子的形状响应,所以它识别的实际上是带羟基这一类物质,而非目标的单一分子,能达到的只是官能团级选择性。作者在第 4.3 节自己把特异识别定义为只对目标气体响应、避免交叉敏感,按这个自定义标准,对同类醇响应更高恰恰说明交叉敏感没有避免,因而实测并未达到作者自己设定的特异识别门槛。
其次,第六章的技术路线也反过来说明单传感器的分子级特异识别并未实现。第六章仍然依赖十二维特征参数加机器学习来做霉变分类与回归。如果传感器真做到了对单一分子的特异识别,那么单维响应本身就足以对霉变程度分级,不必再从信号里榨取十二维特征上机器学习;正是因为单传感器分不清同类分子,第六章才需要靠多特征加机器学习来补足区分能力。因此第六章选择这条技术路线,本身就反证了在传感器层面尚未做到单分子级的特异识别。
这里需要为作者说明分寸:用官能团级选择性的传感器,配合多维特征与机器学习来做霉变识别,本身是电子鼻与气敏阵列领域的标准合理做法,技术路线没有问题,本意见不针对这套方法本身。问题只在于创新点二把这套传感器加机器学习的整体功劳,单独算到了传感器的分子特异识别上,宣称的说法偏高,与实做不符。
建议作者:
意见五:第五章集成了一台小麦霉变专用嗅觉检测装置并打通了完整检测流程,这是本文工作量的集中体现,但装置的自研边界标注与第四、五章的编排有需要修正的地方。
首先,装置最核心的频率信号读取完全由商用仪器完成。频率测量是嗅觉检测装置的命脉,而这个命脉由市售的辰华 CHI400C 电化学石英晶体微天平在做,控制软件也只是把 CHI400C 的软件嵌进来,下位机采集卡只管流量阀门继电器、不碰频率采集,气体检测室基于商用振荡器改制,整机其余部件也基本是市售选型。论文真正的原创成分落在五种状态切换的气路时序集成、上位机控制软件外壳与检测室小幅改制上。这种集成创新本身可以成立、也有价值,但论文反复强调创制专用装置、没有如实划清哪些是买的哪些是自研的,把集成与软件包装成创制装置,宣称的说法就偏高了。
其次,第四章和第五章互相依赖、读起来顺序倒置。第四章讲传感器特性测试时明文写用第五章研发的装置来测,可读者读到第四章时第五章的装置还没出场就已经被拿来用了;而且这台装置的核心气路图(图 4-12)被编进了第四章,第五章和第六章反过来回头引用它。这不是传感器作为装置一个部件的正常单向从属关系,而是反向交缠,读者读第四章测试时得跳到本章去找一张本该属于第五章的图,逻辑断了一截。
此外,全文图表、公式与交叉引用还存在较多校对问题(约十四处),其中几项照抄会误导、建议优先处理:式 4-8 的 Sauerbrey 方程分母漏掉了电极面积 A(作者实际计算用的是含 A 的正确式,但照抄会误导后人)、图 3-3 的 ZIF-8 合成流程框把锌源名称和用量都写错(写成磷酸锌一点五克、正文为醋酸锌二点二克,磷酸锌合不出 ZIF-8)、特征参数公式在第五章和第六章一字不差地重复两遍;其余如交叉引用章号式号错位、第六章 SVR 段误抄了随机森林的指标、个别图轴单位标错等属纯排版校对级。建议作者结合本意见对全文做一次系统通校。
建议作者:
较大修改后答辩。
落盘前已对照模板第五部分清单与八条铁律逐项核查,详见回传说明。