汇报顺序:
研3:周书发 → 文柘青 →
研2:李浩铭 → 管明露 → 李山岚 →
研1:王硕 → 朱丹晨 → 马婧怡 →
研0:南迪柯
注:该组会记录内容,录音音频由通义听悟转为文字并识别说话人、由 Gemini 3.1 Pro 归纳、由自研 LIA 系统自动发布文章。因此可能存在由音频转换、AI 幻觉造成的错误,请阅读时甄别,以实际组会过程中的表达为准。
会议记录整理
学生汇报进展摘要
周书发 (已完成实证分析,即将开始论文撰写)
- [实证完成] 上周完成了颠覆性创新指数的构建,并将其作为结果变量进行了fsQCA分析。初始校准范围和真值表阈值设定导致解的数量太少(仅1-2条),经过多次调试(包括校准点从(0.75, 0.5, 0.25)改为(0.4, 0.9, 0.1),最终将真值表的一致性阈值设定为0.6),最终得到4条可解释的组态解。
- [稳定性检验] 进行了稳定性检验(将一致性阈值调整为0.7),结果解减少为2条,与原解不完全对应,稳定性不足,因此该结果图不宜放入论文。
- [论述逻辑调整] 计划调整第一章的论述逻辑,将衡量城市创新能力的一般方法作为切入点,论证为何选取集成电路产业作为代表性产业进行实证研究。
- [下一步工作计划] 所有计算工作已完成,即将进入论文撰写阶段,主要任务是调整第一章论述逻辑并完成全文写作。
李浩铭 (正在修改市调大赛报告并推进个人论文)
- [市调大赛修改] 与师弟师妹共同修改市调大赛报告。主要修改内容包括:摘要、文献综述(重新梳理了从“用户需求重要性”到“传统访谈问卷”再到“数据驱动方法”的逻辑)、研究创新点(将之前重复的2、3点拆分为“舆情方法创新”和“问卷分析方法创新”,并保留了“适老化改造与智能手表”的选题创新)、品牌效应部分、增加了实地访谈(华为、OPPO门店)内容与照片(将放入附录)、调整了图表格式、结论部分(弱化了结构方程模型中“享乐动机是第一因素”的表述,转而强调结构方程用于证明因素间关系,为后续分析做铺垫)、聚类分析(引入了网格搜索进行参数调优,以“类内相似、类间相异”为目标)、结论与营销建议(基于聚类得到的“安全守护型”和另一群体,借鉴6P营销理论分别提出针对性的建议)。报告已提交,目前无法修改。
- [个人论文修改] 对个人论文(关键核心技术识别)进行了修改,调整了文献综述部分“双链网络”、“动态预测”等内容的顺序和表述,试图优化“研究总结了……”等生硬的过渡句。导师指出“动态预测”已有研究,创新点需更多体现在方法整合上。
- [下一步工作计划] 继续修改个人论文,重点审视创新点的表述;市调大赛报告等待结果。
管明露 (修改小论文创新点与公式格式)
- [论文创新点调整] 修改了小论文的创新点:1. 使用BERTopic进行主题建模;2. 将HTM(Hierarchical Topic Model)与多尺度结构化表征方法融合;3. 在新颖度评价方面采用多维特征(计划突出其中一两项他人未考虑的指标作为创新)。导师建议检索相关文献以确认指标独特性。
- [公式录入问题] 论文中部分公式需要手动使用LaTeX或Word的MathType插件重新录入,以保持格式正确。
- [题目优化] 当前题目包含“大规模”,导师建议可寻找更实质的亮点优化题目。
- [下一步工作计划] 检索文献以确认新颖度评价指标的独特性;手动录入公式;优化论文题目;完成修改后再次提交给导师。
李山岚 (推进大论文,解决DID样本量与政策界定问题)
- [研究方案调整] 针对开题报告反馈进行修改。核心议题:1. 政策界定:将以“人工智能政策”为题,但使用的政策文件实为“指引”,计划参考同类DID研究中的表述进行迁移论证。2. 样本量:DID实验组为18个城市,对照组原计划也为这18个城市。导师指出DID最好在30个以上,建议将对照组扩展为全国285个地级市,并可使用PSM(倾向得分匹配)算法匹配出与18个实验组城市属性相近的对照组城市。3. 章节调整:中间需增加一章“人工智能政策现状与指标构建”。
- [下一步工作计划] 开始大论文核心部分的推进,优先查找数据并进行实证计算;文字和形式问题可后续调整。
王硕 (整合fsQCA结果并修改市调大赛报告)
- [实证分析推进] 本周主要撰写论文的实证分析部分。fsQCA结果已初步整合,参考了《科学学研究》上的示例论文结构。与示例论文的区别在于:1. 必要性分析使用了“同比复制”(对比典型产业间的差异),而非“差别复制”(对比高低绩效产业);2. 自变量分为三个维度,因此进行了三次fsQCA分析。目前结果以表格形式呈现,后续需手动将其转化为带圆圈/叉号的组态图,并详细解释TOE框架下各条件(T1, T2等)的具体含义。
- [市调大赛修改] 修改了市调大赛报告的调查方案设计部分:新增了5个对商家的访谈,发现商家视角(绩效期望更重要)与部分用户访谈(价格更重要)存在差异,因此将模型统一为UTAUT2(包含价格价值)。结论部分进行了改写,结构方程模型仅用于证明因素间存在关系(而非比较强弱),后续再用XGBoost和SHAP方法进行深入分析。将所有“意愿”变量统一表述为“行为意向”。报告整体精致度提升。
- [下一步工作计划] 继续完善论文实证部分的文字表述,参考《科学学研究》投稿模板;丰富市调大赛报告中的访谈发现(如手环防摔功能缺失、数据共享问题等)。
朱丹晨 (收集政策新闻数据,解决数据格式化问题)
- [数据收集] 收集了关于“颠覆性创新”的政策新闻数据,来源包括LexisNexis等。目前通过平台下载了约1500条新闻,数据以Word文档或ZIP压缩包形式存在,每条新闻为一个独立文件。目标数据总量有数万条。
- [数据格式化] 当前数据格式不利于分析(非结构化文本)。导师建议:1. 研究平台是否支持导出为结构化表格(类似知网);2. 若不行,则编写Python代码自动从Word文件中提取结构化信息(如时间、发布机构、内容)并整合到Excel中。
- [下一步工作计划] 尝试从数据平台导出结构化表格;若不可行,则编写代码进行数据提取和格式化;继续收集更多新闻数据。
马婧怡 (处理政策文本数据,准备向量化分析)
- [数据整合] 已合并处理了中美两国关于“颠覆性创新”的政策文本数据,整理了来源、时间、发文机关等信息。
- [数据格式问题] 生成的CSV文件用Excel打开时出现中文乱码,需调整编码格式(如切换UTF-8或GB2312)解决。
- [分析计划] 计划下一步将文本向量化,然后按年度对政策向量和企业研发向量进行平均,以分析方向一致性。曾考虑根据发文机关权威性赋予权重,但导师建议暂不使用权重,直接进行平均。
- [数据规模] 中国政策文本数据约3000条,美国政策文本数据约400-500条(时间跨度较短)。
- [下一步工作计划] 解决CSV文件乱码问题后提交数据给导师;开始进行文本向量化及年度方向分析。
南迪柯 (复现算法,修改开题报告)
- [开题报告修改] 根据导师意见修改了开题报告,但论文指导老师要求将“优化经验借鉴”部分打散融入其他章节,本周将继续修改。
- [算法复现] 本周复现了LDA(Latent Dirichlet Allocation)主题模型算法,并实现了可视化。下一步计划复现困惑度等评估指标。
- [下一步工作计划] 继续修改开题报告;按计划推进算法复现学习;有时间时参与课题组其他算法学习。
(根据录音,文柘青未在本次会议中进行汇报。)
会议其他事项与闲聊
- 导师提醒同学们注意工作节奏,提及之前的论文撰写周期较长,希望现在能加快进度。
- 同学们讨论了市调大赛访谈中拍照的伦理问题,涉及隐私权。有同学提出可以打马赛克或使用隐蔽拍摄设备(如运动相机),但最终将不露脸的照片放在了附录中。
- 有同学提及之前因手术住院影响了工作进度,但未说明是什么手术。
- 同学们谈及论文投稿时间线,希望能在今年9月前完成以参与评奖。
- 有同学询问导师是否有专门办公室,导师回答目前办公室资源紧张。
真值校准设门槛,组态太少解不完,稳健检验图全删,再算!
政策指引做双重,十八样本略显空,倾向匹配拉满配,能中!
走街串巷做访谈,药店门店偷拍脸,模型全改行为侧,实战!
海量新闻下成包,表格乱码心发毛,爬虫清洗转结构,贼好!
大病初愈接着熬,公式排版手动敲,只为九月冲大奖,奋斗!

