汇报顺序:
研3:周书发 → 文柘青 →
研2:李浩铭 → 管明露 → 李山岚 →
研1:王硕 → 朱丹晨 → 马婧怡 →
研0:南迪柯
注:该组会记录内容,录音音频由通义听悟转为文字并识别说话人、由 AI 归纳、由系统自动发布文章。因此可能存在由音频转换、AI 幻觉造成的错误,请阅读时甄别,以实际组会过程中的表达为准。
以下是根据提供的转录文本整理出的学术组会会议记录。
1. 周书发(目前工作重心为数据整理与清洗)
- [数据整理] 本周主要任务是按照预设指标体系整理数据。核心问题集中在“创新资源”板块的研发人员和研发经费投入(B1、B2)指标数据。数据搜集面临时间跨度(最早至2017年,最新至2022年)和行政区划频繁变更(特别是西藏地区)的挑战,已初步筛选并处理了2017-2022年的数据。
- [数据问题与处理] 数据源存在缺失与错误:研发人员与经费数据在2020-2022年缺失;部分数据(如盘锦市博物馆数量)存在明显的录入错误。计划采用回归插值法补全缺失的研发数据;对于明显的离群值,将采用前值替换或常规插值法进行平滑处理;对于藏书量等因城市自身特性导致的差异,则按实际情况录入。
- [后续计划] 数据收集工作持续进行,重点是补充完整各指标数据。计划在完成数据全集收集后进行统计分析,并根据离群值情况决定是否剔除个别数据严重缺失的城市样本。同时,将同步推进算法构建和论文正文撰写工作。
2. 管明露(论文初稿已完成,正在进行精细化修改)
- [修改进展] 已根据上周讨论意见,重新绘制了Topsis建模流程图,并补充了参考文献部分,目前论文框架完整。
- [存在问题] 林老师指出论文存在两个主要需修改项:一是图表专业度不足,当前流程图存在信息密度低、元素含义不清(如处理过程与结果未作区分)、排版松散(空白区域多)等问题,需参考优秀范例进行精细化调整;二是参考文献质量有待提升,需将引用文献等级提升至CSSCI(中文)或SCI(英文)期刊,并剔除不符合要求的文献。
- [下一步工作计划] 优先完成图表(特别是流程图)的专业化重绘,确保信息清晰、布局紧凑;同时,系统性地筛查并替换参考文献,提升文献质量。完成这两项工作后,论文将接近投稿状态。
3. 李山岚(正在优化论文的创新点部分与结构)
- [创新点提炼] 已将论文创新点归纳为五点:1)HMM模型在动态上能刻画技术演化的非线性与偶发阶段性特征;2)引入了七个网络主题特征,增强了模型解释性;3)使用BERTopic实现了更精准的语义层面技术主题挖掘;4)结合BERTopic与HMM实现了从静态主题到动态演化的预测;5)所绘制的图谱能够定位根基与衍生节点,使分析更体系化。
- [结构调整] 发现《情报学报》等期刊常将创新点陈述置于文献综述之后、而非文末,计划参照此模式调整论文结构,使“针对现有不足,本文进行如下创新”的逻辑更顺畅。
- [下一步工作计划] 将优化后的五个创新点内容整合至论文正文中,并确保与文献综述部分相对应。同时,按照林老师要求,全面提升参考文献的等级(以CSSCI、SCI及自科基金委A/B类期刊为主)。完成整合与修改后提交审议。
4. 王硕(正在进行期刊筛选与投稿方向确定)
- [期刊调研] 围绕“平台企业”、“技术创新”、“fsQCA”等关键词,对与研究主题相似的已发表论文进行了系统性的期刊调研与筛选。初步筛选出数本备选期刊,并根据期刊等级、相似论文发表情况进行了排序。
- [投稿策略] 明确当前首要投稿目标为《科学研究》(科学学研究),该刊虽IF较高,但处理流程较快,且已有使用fsQCA研究技术创新的先例,可作为高质量模板进行仿写。次要备选为《科研管理》。同时,确认了“必要性条件分析中不存在一致性大于0.9的条件”在已发表的高质量fsQCA研究中是允许存在的,因此本研究在此环节不存在方法论障碍。
- [下一步工作计划] 以《科学研究》上发表的相似论文为模板,着手进行论文的针对性修改与完善,准备尝试投稿。
5. 朱丹晨(聚焦于“Transformer”新兴技术弱信号识别的数据收集)
- [数据收集进展] 已尝试从论文(arXiv预印本)、专利(智慧芽、Derwent)及GitHub代码库等多源数据中检索与Transformer架构及其变体(如Mamba)相关的信息。目前专利数据量较少(约千条),论文数据量较大(数万条),GitHub数据检索方式尚在摸索。
- [研究方法讨论] 与林老师讨论了构建检索式的逻辑:为避免“Transformer”一词的多义性(如变形金刚),需用“AND”连接其他技术关键词(如应用领域、具体模型)来限定范围,同时用“OR”扩展相关词以防遗漏。检索式的合理性比绝对准确度更重要,需能清晰阐述其设计原理。
- [后续任务] 继续完善并确定针对论文、专利、GitHub三者的检索式。核心任务是完成数据收集与导出,为后续算法应用做好数据准备。算法部分将由林老师提供支持。
6. 李浩铭(手术) & 王硕 & 朱丹晨 (共同负责“正大杯”市场调研大赛项目)
- [项目进展] 小组选题为“适老化智能穿戴设备市场需求研究”。目前正在进行问卷设计初稿,并讨论了数据来源的构成。
- [核心讨论与建议] 林老师建议:1)拓宽数据来源:除问卷和访谈外,应积极引入京东等平台的用户评论作为主要数据源之一,使用八爪鱼等工具进行批量爬取,以增加研究的厚度和亮点。2)聚焦研究领域:需确定是聚焦于“智能腕带”这一具体产品,还是涵盖更广的“适老化穿戴设备”领域。关键在于最终的分析能否将这些产品整合到一个逻辑框架下,而非分散论述。3)明确时间节点:需尽快向学院或相关负责人确认校方提交作品的最终截止日期(可能为3月25日),以便合理安排进度。
- [下一步工作计划] 小组内部需尽快商定研究的具体聚焦点(产品/领域)。同步推进问卷设计的优化与线上评论数据的爬取探索工作,确保项目主线清晰、数据多元。
7. 马婧怡(正在进行政策数据收集,以支持技术演化研究)
- [数据收集方法] 针对“新能源”领域(具体关联动力电池/固态电池技术),使用“上政通”等网站,通过关键词爬取了2017年至2026年的相关政策文本,信息包括标题、年份、发文机关、文号、类型等。
- [研究回顾与任务] 研究主题为“政策对技术演化轨迹的导向效应与偏差识别”。需回顾并确认具体的研究框架与代码。林老师已掌握约30万条相关专利数据。
- [下一步工作计划] 将已收集的国内政策数据与代码整理后分享至群组,并将数据单独发送给林老师。同时,探索并补充国外相关政策的数据来源,以完善研究的数据基础。
8. 南迪柯(学位论文初稿已完成大部,正在根据导师意见修改)
- [修改进展] 已根据导师反馈对初稿进行了格式调整和内容补充,重点增加了“老年用户政务服务”等相关概念的论述篇幅(要求至少半页),并深化了理论框架与论文内容的结合,细化了部分三级标题。
- [当前状态] 论文主体部分已接近完成,待补充完整数据后即可形成较为完整的初稿,准备迎接月末的中期检查。
会议其他事项
- 数据安全提醒:林老师提醒同学们注意个人数据备份,特别是存储于非系统盘(如桌面)的重要文献和研究资料,谨防因电脑故障导致丢失。
- “正大杯”项目组队:确认朱丹晨、王硕、李浩铭为一组,共同备赛。李浩铭因故(手术)缺席本次会议。

