组会记录 2026-02-04

汇报顺序:
研3:周书发 → 文柘青 →
研2:李浩铭 → 管明露 → 李山岚 →
研1:王硕 → 朱丹晨 → 马婧怡 →
研0:南迪柯

注:该组会记录内容,录音音频由通义听悟转为文字并识别说话人、由 Google Gemini 3 Pro 归纳、由 n8n 触发自动发布文章。因此可能存在由音频转换、AI 幻觉造成的错误,请阅读时甄别,以实际组会过程中的表达为准。

1. 周书发(城市创新能力评价指标体系构建与数据逻辑论证)

  • 指标体系构建:
    • 对比了新旧两种构建方法,目前确立了创新环境、创新投入、创新产出三个核心维度。
    • 从文献中归纳了18个影响因素并进行了排名,但由于高新技术产业和创新促进板块资料不全,体系仍待完善。
  • 数据选取与处理争议:
    • 零值与缺失值界定: 针对地级市在特定技术领域无专利的情况,明确了“零值”代表该地区确实无技术记录,而非数据缺失。
    • 样本范围分歧: 提出按梯队筛选前28个地区或仅聚焦特定区域(如长三角)进行研究,但林老师强调样本代表性,主张全量数据(238个地级市)入模,反对用局部代替整体。
    • 代理变量的合理性: 试图使用“集成电路产业的颠覆性技术”作为“区域创新能力”的代理变量。林老师指出此逻辑存在硬伤(局部无法代表整体),要求在论文中详细阐述选取的理由并做好应对质疑的准备。
  • 方法论调整:
    • 计划进行QCA(定性比较分析)分析 ,但在条件变量的收集(如教育占比、GDP)和结果变量(专利数据)的匹配上仍需进一步明确逻辑。

2. 李浩铭(链路预测模型的可视化优化与结果解释)

  • 结果可视化优化:
    • 针对链路预测结果图,林老师建议大幅降低原有黑色边线的透明度,以突出显示当年新增的红色边线,确保在期刊发表时的清晰度。
  • 趋势解释与理论支撑:
    • 现象: 预测结果显示每年新增边数呈递减趋势。
    • 问题: 简单归因于“节点数量固定”被认为不够学术。
    • 建议: 需要引入更严谨的学术逻辑(如资源有限性、技术机会被逐步发现等)来解释这一趋势,并用历史数据验证技术发展先上升后下降的规律。
  • 阈值设定与算法:
    • 分类阈值: 讨论了如何划分预测结果。林老师反对为每年单独设定Top-K阈值,建议使用整体数据计算一个统一的阈值以简化流程。
    • 算法验证: 决定尝试使用OTSU(最大类间方差法)算法 来确定分类阈值,并评估其在双峰数据分布下的适用性。
    • 网络动态性: 确认不预测层间(如申请人与公司)的动态所属关系,仅依赖初始匹配维持连接。

3. 李山岚(论文引言结构调整与核心创新点提炼)

  • 创新点提炼(聚焦算法优势):
    • 语义优势: 明确第一个创新点为“利用语义信息分析技术融合过程”。
    • 动态分析优势: 明确第二个创新点为HMM(隐马尔可夫模型) 在动态层面的优势。
    • 逻辑闭环: 需将创新点与研究现状、研究内容紧密结合,形成逻辑闭环。
  • 引言撰写指导:
    • 结构优化: 按照《情报学报》期刊的模板,应参考思路相似的优秀论文,将背景、现实困境与研究路径拆分清晰。

4. 王硕(基于AI辅助的企业技术数据量化与分析方法)

  • 数据收集方法:
    • 采用AI辅助收集企业报道,优先选取正规媒体(如金融界),设定了每家企业最少5篇报道的限制。
    • 重点关注华为、中国移动等头部企业。
  • 量化分析方法的转型:
    • 原有方案: 计划利用FS-QC模型对新闻报道进行赋分(0-1区间)。
    • 存在问题: AI赋分存在波动性,且评分标准主观性强,难以保证数据的一致性。
    • 改进方案: 林老师建议也许可以使用BERT模型 直接测量“语义相似度”(距离),以提高分析效率和客观性。
  • 后续计划:
    • 停止纠结于分类,直接进行数值计算验证,推动项目进入结果验证阶段。

5. 朱丹晨(新兴技术弱信号识别的数据源拓展与领域锁定)

  • 多源数据融合:
    • 探讨了除专利和论文外,引入新闻、科技报告和政策数据的可行性。
    • 结论: 确认新闻数据可用于弱信号识别;但科技报告和政策数据因缺乏明确参考依据和链接逻辑,暂时排除。最终确定数据源为:新闻 + 专利 + 论文。
  • 研究推进瓶颈:
    • 算法与数据: 算法框架已搭建完成,核心瓶颈在于数据收集。
    • 弱信号定义: 双方在“弱信号”的定义上存在分歧(基于指标vs基于语义)。林老师倾向于直接从文本提取弱信号,建议融合两种思路。
  • 本周任务:
    • 必须在两天内通过新闻和AI筛选,锁定一个具体的技术研究领域,随后开展针对性的数据清洗工作。

6. 马婧怡(政策与技术关联性研究及多模态分析可行性探讨)

  • 数据获取与验证:
    • 正在整理政策数据(约400条)和尝试通过MCP API获取专利数据。
    • 关键问题: 林老师要求必须核实API调用的专利数据库是否全面,以及具体包含哪些字段,这直接关系到论文的立足点。
  • 多模态(图像)分析探讨:
    • 创新点质疑: 提出对专利附图进行分析。林老师指出两个矛盾:一是图像在政策文本比对中无对应参照;二是图像数据的获取难度和必要性需进一步论证。
    • 替代方案: 讨论了用文本描述替代图像特征的方案。
  • 研究方向建议:
    • 建议避开竞争激烈的芯片领域,寻找更有政策影响力的细分赛道(如数字政府)。
    • 当前优先级是夯实数据基础,暂缓技术细节的深究。

7. 南迪柯(城市适老化改造研究资料整理)

  • 工作内容:
    • 主要负责资料收集,整理并分享了关于城市适老化改造具体措施(如应急处理能力、多方联动机制)的政务网站链接和政策文件,为相关研究提供素材支持。
Avatar photo

Chaoran