汇报顺序:
研3:周书发 → 文柘青 →
研2:李浩铭 → 管明露 → 李山岚 →
研1:王硕 → 朱丹晨 → 马婧怡 →
研0:南迪柯
注:该组会记录内容,录音音频由通义听悟转为文字并识别说话人、由 Gemini 3.1 Pro 归纳、由自研 LIA 系统自动发布文章。因此可能存在由音频转换、AI 幻觉造成的错误,请阅读时甄别,以实际组会过程中的表达为准。
一、 学生工作进展汇报与讨论
1. 李浩铭(核心工作:修改基于GCN与LSTM的代码,准备投稿)
- [代码修正与模型训练] 主要汇报了针对关键核心技术识别的代码修改情况。本次修改参考了一篇顶会论文(I31分区,高引用),使用了“GCN+LSTM”结构进行节点表示训练,并采用了与以往不同的“训练集与AUC评估集分离”的策略。目前模型已初步跑通,AUC指标达到0.9左右,接近论文的基线效果,但AI评审认为可能存在标签泄露问题。
- [图表优化与可视化] 针对研究结果的可视化部分进行了讨论。林老师建议,应将原本用于展示识别结果和预测结果的列表形式,优化为展示技术在不同年份是否被识别出的“热力图”,以使趋势更直观。同时,需要考虑如何在一张图中有效展示跨年份(从最早年份至2024年)关键核心技术的变化情况。
- [下一步工作计划] 计划完成代码的最终调整,添加早停机制并微调训练轮次(原为100轮)。根据反馈,将结果展示部分从表格改为更直观的图表形式,并整合预测结果与全部技术的可视化图。之后,即可进入投稿前的最终文稿核对阶段。
2. 朱丹晨/李浩铭/王硕(团队成员,汇报市场调研比赛情况及反思)
- [比赛回顾与反馈] 团队汇报了近期参加的市调比赛情况。评委提问主要集中于两点:一是对聚类结果的解读提出质疑,认为结果(如“老年群体更注重社交性而非安全性”)与常识不符,且聚类样本比例(如98% vs 2%)悬殊;二是质疑研究对象(老年群体)的选题是否过于普遍,创新性不足。
- [问题分析与教训] 团队反思认为,问题根源在于问卷设计可能导致结果偏差,以及论文中对聚类结果的解读不够清晰、未能有效回应“反常识”发现。此外,选题的前期论证不够充分,未能形成独特的研究视角。
- [下一步工作计划] 当前比赛已结束,主要任务是总结经验教训。对于未来,需要更审慎地选择研究对象和调研方法,并在论文中更充分、逻辑清晰地解释数据结果与研究发现。
3. 王硕(核心工作:基于fsQCA的动力机制论文撰写)
- [论文结构搭建与内容完善] 已基本完成论文主体部分的撰写,结构上主要参考了《科学学研究》的范文模板。内容包括:阐述fsQCA方法的选用原因、详述变量校准过程、展示组态分析结果,并新增了拓展性分析(如区分发达与欠发达地区)。
- [细节优化与待完成任务] 针对AI生成内容进行了口语化改写以避免AIGC审查风险。根据林老师建议,需进一步调整表格样式以区分“布尔运算结果”与“原始数值”,并考虑将摘要、引言、文献综述等前置部分与主体章节进行有效衔接与精炼。
- [下一步工作计划] 下一步将重点撰写引言、文献综述、摘要和关键词。同时,需对照《科学学研究》的投稿格式与字数要求(不超过12000字),对全文进行整合、修改与精简。
4. 朱丹晨(核心工作:数据清洗与时间序列分布分析)
- [数据处理完成] 已完成对新闻数据的清洗工作,清理了无日期信息的记录,最终获得6700条有效数据,并补充了2020年前后的数据以保持时间连续性。
- [初步分析与可视化] 已利用Python绘制了新闻数量随时间(年)分布的折线图,趋势初步符合预期。根据林老师建议,后续还需在数据中分别提取“年份”和“月份”两列,为后续按季度或月度进行更精细化的分析(如回归)做准备。
- [下一步工作计划] 首先,将提取好年份和月份的完整数据表发给林老师。其次,需要撰写数据获取与处理过程的描述,明确数据来源与清洗步骤。
二、 其他事务性通知
林超然老师将于近期出差前往昆明,预计周五出发,周一返回。

