组会记录 2025-11-05

汇报顺序:
研3:周书发 → 文柘青 →
研2:李浩铭 → 管明露 → 李山岚 →
研1:王硕 → 朱丹晨 → 马婧怡 →
研0:南迪柯

注:该组会记录内容,录音音频由通义听悟转为文字并识别说话人、由 Google Gemini 2.5 Pro 归纳、由 n8n 触发自动发布文章。因此可能存在由音频转换、AI 幻觉造成的错误,请阅读时甄别,以实际答辩过程中的表达为准。

  1. 周书发(探讨基于技术指标体系的大论文后续研究思路)
    • 核心进展与困惑:
      • 进展: 已基本完成小论文中的指标体系构建工作,并将其填充到大论文中。
      • 困惑: 在如何利用该指标体系提出公共管理领域的政策建议上遇到瓶颈。
        1. 方法论问题: 意识到仅通过指标权重大小来判断政策侧重点是不科学的。
        2. 学科交叉问题: 当前的指标体系偏重技术层面,与公共管理领域的结合不够紧密,直接用技术得分来提政策建议显得生硬。
    • 与老师的探讨及建议:
      • 林超然老师指出: 当前的研究成果(多年的技术评价得分)可以看作一个面板数据,后续研究的核心思路应是将此评价结果与政策因素结合,进行计量分析。
      • 老师提供的两条路径参考:
        1. 路径一(事件研究型): 仿照柳琦师姐的思路,寻找一个国家层面促进技术创新的宏大政策事件,采用双重差分法(DID)分析该政策对颠覆性技术评价结果的影响。
        2. 路径二(变量关联型): 仿照李山岚(深蓝)的思路,寻找一个与研究主题(颠覆性技术)更内在相关的政策变量。例如,李山岚研究技术融合,便从省政府报告中提取“省际合作关系”作为变量进行分析。
      • 其他建议: 与于老师、高老师讨论后,也得出了可以与“创新政策”相结合的建议,与林老师思路一致。
    • 下一步计划:
      1. 尽快确定后续研究的整体思路和论文结构,为12月中旬的中期检查做准备。
      2. 与高老师进一步交流,探讨政策部分如何更好地与现有实证结果结合。
      3. 参考林老师后续分享的数据,思考具体采用哪种路径。
  2. 李浩铭(探讨AI芯片双链关键核心技术识别研究的后续计量分析思路)
    • 核心进展与困惑:
      • 进展: 已完成双链关键核心技术的识别与可视化(网络图)。
      • 困惑: 正在构思开题报告的计量部分,即如何寻找一个政策事件作为时间节点,分析其对关键核心技术演变的影响。
        • 初步想法是比较政策发布前后,不同得分区间(如高、中、低关键性)的技术数量比例变化,或分析具体技术的得分演变趋势。但如何将其转化为合适的计量模型变量尚不清晰。
    • 与老师的探讨及建议:
      • 计量思路: 林老师肯定了“识别+影响因素分析”的范式。
        • 因变量(Y): 可以简化为每年的“关键核心技术”平均分或总数量。
        • 自变量(X): 寻找相关政策事件。
        • 数据问题: 老师指出,当前使用的专利数据包含中英文,若要研究国内政策影响,需筛选出国内专利。
      • 小论文修改建议:
        1. 引言部分:
          • 需明确提出一个现实世界中存在的、可通过“双链”视角解决的研究困境,目前的论述过于宏观。
          • 在引言结尾处,需要更详细地阐述本研究的创新点,不仅要说明“做了什么”,更要阐述“这么做的好处是什么”,以凸显研究价值。
        2. 数据处理: 在构建网络时,对于合作申请的专利(申请人字段中含多方),应先进行拆分再进行节点匹配和度计算,以确保分析的严谨性。
    • 下一步计划:
      1. 修改小论文,重点重构引言部分,突出研究困境和创新点,并注意数据处理的细节问题。
      2. 确定开题报告的计量分析框架,若需研究国内政策,则要考虑如何处理或筛选现有数据。
  3. 管明露(汇报基于BERT-Topic的集成电路新兴技术识别结果)
    • 核心进展与成果:
      • 数据处理: 已完成对全部14万条专利数据的处理,识别出约400个技术主题,并获得了每个主题在1920s-2025年间每一年的“新兴度”得分,形成了完整的面板数据。
      • 结果呈现:
        1. 输出了每年度排名前十的新兴技术列表。
        2. 绘制了所有技术年度新兴度得分的平均趋势图。该图呈现出清晰的规律性,与摩尔定律失效等产业发展节点能较好对应。
        3. 展示了2025年Top10新兴技术的历史演变轨迹图。
    • 与老师的探讨及建议:
      • 结果解读:
        • 部分技术主题的关键词较少,导致其名称看似宽泛、不够“新兴”。老师建议可尝试在代码中增加关键词提取数量,使技术主题更具体。
        • 针对“新兴技术”在早期年份得分也很高的现象,明确了是由于算法中加入了“成熟度惩罚”机制,即对早期已存在且得分高的技术进行降分处理,这合理解释了平均分后期下降的趋势。
      • 论文撰写: 需要根据当前最新的代码逻辑,逆向梳理并详细阐述算法流程,确保论文中的方法描述与实际操作完全一致。
    • 下一步计划:
      1. 整理并输出完整的技术主题面板数据。
      2. 根据最终的代码版本,重新撰写和完善论文中的方法论部分。
  4. 李山岚(汇报技术融合大论文的计量思路与小论文修改)
    • 大论文思路探索:
      • 初步调研: 调研了一篇关于“跨域合作创新”的论文,但发现其研究范畴(省际合作)与概念界定(府际合作)存在偏差,且未体现政府作用,参考价值有限。
      • 林老师的核心思路:
        • 因变量 (Y): 使用已识别出的技术融合数据,可量化为“每年发生的技术融合数量”等指标。
        • 自变量 (X):省级政府工作报告省级日报等政策文本中,利用大语言模型批量提取关于“跨省技术合作”的结构化信息,作为政策变量。
        • 控制变量: 引入各省份的人口、GDP等宏观数据。
        • 数据对齐问题: 政策文本数据以“省份”为单位,因此专利数据也需提取出申请人地址,以匹配到相应省份。
    • 小论文修改:
      • HMM部分: 当前实证部分对HMM模型的过程与结果呈现不足。老师建议,应将HMM预测出的未来技术网络状态(中间结果)进行可视化展示,以清晰体现其在技术融合识别中的作用。
      • 创新点: 需在论文中(建议在引言或文献综述后)凝练并清晰阐述研究的核心创新点
    • 下一步计划:
      1. 大论文: 根据老师的思路,设计开题报告的整体研究框架,包括变量定义、数据获取方式和计量模型。
      2. 小论文:
        • 修改HMM部分,补充中间结果的可视化与说明。
        • 撰写并补充核心创新点段落。
        • 更新参考文献。
  5. 王硕(汇报“存算一体”领域典型企业的界定与筛选)
    • 核心进展与成果:
      • 典型企业定义: 尝试给出了一个初步定义,但仍偏向于特征描述。
      • 企业筛选:
        1. 标准一(分领域): 找出了47个技术主题中,每个主题内专利数量最多的企业。
        2. 标准二(跨领域): 找出了在所有专利中,总数排名前五的企业。
        3. 汇总名单: 将两份名单合并,初步形成了典型企业备选池。发现总数多的企业(如清华大学)通常在多个细分领域也处于领先地位。
    • 与老师的探讨及建议:
      • 关于定义:
        • 需要一个更高层次、更抽象的定义,然后再分解为可观测的“特征”和可操作的“筛选指标”。目前的定义更像是特征描述,缺少了最上层的界定。
        • 建议按照“定义→特征→筛选方法”三个层次来构建逻辑,使其环环相扣。
      • 数据处理细节:
        • 当前的统计方式未处理合作申请的情况(如A公司;B公司),导致统计不准确。应先将申请人字段按分隔符(如分号)拆分,再分别计入各申请主体的专利数。
        • 对于名称相近但不同的实体(如“中国移动”和“中国移动研究院”),目前按不同实体处理,不进行主观合并。
      • 结果呈现与分析:
        • 建议将筛选结果可视化,以更直观地展示和确定典型企业。
        • 可以绘制一个二维散点图:X轴为某企业在某一技术主题下的专利占比Y轴为该企业的专利总数。图中的每个点代表一个企业在一个主题下的表现,通过设定阈值(如划定一个右上角的区域)来筛选出典性企业,使筛选过程更具理论依据。
        • 在可视化之前,先生成一个完整的“企业-技术主题”热力图(或矩阵),行为企业,列为主题,值为专利数。这个基础数据表可以支持后续多种分析。
    • 下一步计划:
      1. 修改代码,正确处理合作申请的专利数据,重新进行统计。
      2. 生成“企业-技术主题”专利数量矩阵。
      3. 基于新数据,绘制散点图进行可视化分析,以更系统的方式确定典型企业名单。
      4. 继续与高老师沟通,探讨后续如何获取企业数据(访谈、二手数据等)。
  6. 朱丹晨
    • (本次未汇报,略)
  7. 马婧怡(说明近期情况)
    • 近期主要在忙两门课程的期中考试和一项英语大作业。
    • 最后一个考试在11月22日,之后会有更多时间投入到研究工作中。
  8. 南迪柯(汇报毕业论文开题情况及修改意见)
    • 进展: 已完成硕士毕业论文的开题答辩,题目通过,但需根据评委老师的意见进行修改。
    • 主要修改意见:
      1. 研究现状: 国内外研究现状部分需补充关于“适老化”政策、模型等理论支撑的内容。
      2. 内容框架: 论文主体(第三、四部分)应更具体地论述“适老化建设”,包括分析老年人使用电子设备时存在的问题及原因,并充分考虑老年群体的特殊性。
      3. 参考文献: 存在理论性不足、年份偏旧、数量不够等问题。需要更新文献,并调整引用顺序,将权威文献前置。
    • 与老师的交流:
      • 林老师表示,在完成毕业论文的同时,可以抽时间了解和推进这边的研究方向。如果在毕业论文中遇到技术难题,也可以在组会上提出,寻求帮助。

有道是:

《智阵·甲辰科攻坚赋》

鸿蒙初辟数据茫,算法如剑破苍黄
书发执尺量寰宇,指标体系筑云梁
面板纵横藏玄机,DID阵前试锋芒
政策变量化星斗,计量山河论短长

浩铭挥墨绘双链,芯片经纬列八荒
专利千卷分中英,网络图里见真章
重写引言破迷雾,创新点耀日月光
数据精筛除合作,变量澄澈映寒江

明露调鼎炼真丹,BERT聚魂识天罡
十四万卷收眼底,四百主题现瑞祥
新兴度分逐年列,轨迹图呈岁月长
惩罚机制降玄霜,逆向梳理论文彰

山岚踏云访九疆,技术融合探幽篁
省际文书化春雨,HMM阵前演洪荒
宏观数据控经纬,地址匹配定朝纲
可视化展未来势,创新点破旧藩墙

王硕挥旗定四方,存算一体点将忙
四十七路分封毕,五强诸侯列玉堂
合作申请细拆解,矩阵热力透轩窗
散点图开新境界,典型企业镇八荒

丹晨静待风雷动,婧怡课业暂束装
南迪柯挥如椽笔,适老文章补天章
理论支撑添鹤寿,框架重筑护夕阳
他日破阵归来时,共饮千觞颂华章

算法为马驰星野,代码作舟渡沧浪
面板数据连天阙,双重差分定阴阳
BERT聚魂识未现,HMM推演算无疆
今朝磨剑三载后,敢教科技换新妆

Avatar photo

By Chaoran


Warning: call_user_func_array() expects parameter 1 to be a valid callback, function 'wp_print_speculation_rules' not found or invalid function name in /usr/local/lighthouse/softwares/wordpress/wp-includes/class-wp-hook.php on line 324