组会记录 2026-03-18

汇报顺序:
研3:周书发 → 文柘青 →
研2:李浩铭 → 管明露 → 李山岚 →
研1:王硕 → 朱丹晨 → 马婧怡 →
研0:南迪柯

注:该组会记录内容,录音音频由通义听悟转为文字并识别说话人、由 Google Gemini 3 Pro 归纳、由自研信息管理系统(LIA)自动发布文章。因此可能存在由音频转换、AI 幻觉造成的错误,请阅读时甄别,以实际组会过程中的表达为准。



一、 各学生汇报要点

1. 周书发(完成了两套城市数据的匹配与指标体系的初步分析)
* [数据匹配] 完成了“城市颠覆性创新指数”与“城市年鉴统计数据”两套数据的匹配,通过代码处理了名称差异(如“唐山市”与“唐山”)后,共获得221个匹配成功的城市样本,排除部分样本的原因为数据缺失或在另一数据源中不存在。
* [指标构建与分析] 构建了以城市创新能力(Y)为结果变量,包含创新主体(A)、创新资源(B)、创新环境(C)三个维度的六个条件变量指标体系。使用fsQCA进行了初步分析(以2017年与2022年为例),所得组态的一致性与覆盖率结果尚可(均在0.75以上),但识别出部分条件变量的必要性检验未超过0.9的阈值。
* [下一步计划] 开始学习并尝试进行动态QCA分析,以探究变量间的时序因果关系,并计划寻找或尝试使用相应的分析工具。

2. 管明露(正在修改文献综述、研究流程图与创新点表述)
* [文献质量提升] 已查找并整理了十余篇高质量(一区、二区)英文文献及一篇中文核心期刊文献,计划用于替换和提升现有论文中参考文献的质量。
* [图表修订] 优化了论文中的研究流程图,调整了布局使其更清晰,并计划将通用的“Topic”流程图中的概念替换为自己研究中的具体术语(如“技术主题”),使其与论文内容紧密结合。
* [表述修正] 根据老师建议,对三个创新点的表述进行了修改,力求更具体、客观,避免使用“浅层”、“失衡”等主观性过强的词汇。
* [下一步计划] 将新收集的高质量文献引用到论文相应部分,完成替换后提交给老师审阅。

3. 李山岚(重点修改了引言、文献综述与结论三个部分的逻辑结构与对应关系)
* [结构调整] 参考了相近领域已发表论文的框架,将引言部分重新组织为“背景与困境-破解途径-研究不足-本文做法”四个逻辑段落;在文献综述部分,为每一部分的研究现状都对应说明了本文的研究做法;在结论部分,明确区分并撰写了“研究结论”、“本文贡献”(即三个创新点)和“未来展望”。
* [内容精简] 当前论文字数较多,尤其是文献综述部分(约4000字)。计划参照目标期刊论文的体例与逻辑,对该部分进行大幅压缩和精炼。
* [下一步计划] 首先压缩文献综述部分的篇幅;其次,更新参考文献,补充2025或2026年的最新文献(若没有则更新至2025年);最后,完善参考文献的格式。数据部分暂不更新。

4. 王硕 & 朱丹晨 & 李浩铭(三人共同推进“正大杯”市场调查大赛项目,临近截止日期)
* 王硕
* [数据分析] 使用UMAP降维与HDBSCAN聚类方法对问卷数据进行分析,最终将受访者聚类为两类特征群体,并结合问卷题目从四个维度(运动、功能、购买、情感)对两类群体进行画像描述。
* [内容撰写与设计] 完成了研究思路图的绘制,并计划在创新点中突出使用VADER情感分析和BERTopic等较新的文本分析方法。同时,已开始进行PPT的美化与制作工作。
* 朱丹晨
* [模型应用与难题] 主要负责问卷设计、数据收集及建模分析部分,使用了XGBoost和SHAP模型进行分析,并识别出“感知收益(PE)”和“价格”是影响购买意愿的关键因素。当前面临的核心难题是:团队使用的UTAUT模型与学姐已完成部分使用的UTAUT2模型在自变量上存在差异(特别是包含了关键的“价格价值”变量),时间紧迫难以统一重做。
* [应对策略] 计划在研究方法中尝试解释两种模型的差异与选用理由,并在报告中采用分段处理(4.1/4.2用一套模型,4.3/4.4用另一套模型),强调其均基于同一份问卷数据。
* 李浩铭
* [数据爬取与处理] 负责“舆情与评论分析”部分,已从微博、B站、小红书等社交平台爬取话题评论,并使用BERTopic进行主题分析;同时从京东、天猫等电商平台爬取具体商品评论,并创新性地使用Ollama大模型对评论进行结构化信息提取(如归因优缺点)和自动化报告生成。
* [整合挑战] 目前代码正在运行,结论部分尚未完全产出。需要与管明露的访谈部分进行整合,并最终形成完整报告。
* [项目整体状态] 项目处于最后冲刺阶段,需在周五晚截止前完成报告整合、PPT制作及细节调整(如统一术语“评论数据”替代“舆情”、美化图表、更换学校Logo等)。团队正面临模型不统一、数据整合和时间紧张的多重压力。

5. 南迪柯(已基本完成论文初稿修改,正着手中期材料与代码复现)
* [论文修改完成] 已按照老师此前的要求,完成了论文初稿的格式调整、核心概念扩充至半页以上、补充脚注等工作,目前只需填入数据即可。
* [中期准备] 已撰写完中期检查材料并制作了PPT。
* [下一步计划] 在完成比赛项目后,将投入时间复现老师提供的相关代码,为后续研究做准备。

6. 马婧怡(因电脑故障,委托他人协助爬取美国政策数据)
* [数据获取] 电脑损坏期间,委托他人尝试爬取美国国会及联邦公报等来源的政策文本数据。发现美国政策文本内容多为具体措施,与中国政策的表述风格不同,计划后续分开分析。
* [技术调整] 在爬取过程中遇到正文内容受限的问题。为确保数据量,决定优先爬取包含摘要的数据,将正文内容作为锦上添花的补充。
* [下一步计划] 优先追求数据规模,从多个美国政策信息源全面爬取带摘要的数据,以保障后续分析的样本全面性。

二、 会议其他事项与讨论

  1. 技术问题咨询:会议中,针对管明露遇到的VS Code文件丢失问题,林老师与同学们共同提供了解决方案(通过File -> Open Recent菜单查找最近打开的文件)。
  2. 工具使用交流:同学们讨论了使用 nano banana 绘制流程图(需注意去除AI水印和调整背景)、购买PPT模板、使用问卷星“互填问卷”功能可能带来的数据规律性强等问题。
  3. 进度督促:林老师提醒“正大杯”团队注意截止时间,以报告完整性为第一要务,细节美化可后续调整。同时,鼓励朱丹晨在比赛后无缝衔接推进学术研究。
Avatar photo

Chaoran