年度技术分析论文进展 20251026

 

学术分析报告:基于近期专利分析文献

本报告旨在对近期发表的18篇关于专利分析的学术论文进行系统性梳理。通过对这些前沿研究的归纳、剖析与展望,本报告将揭示该领域当前的研究热点、方法论进展、核心议题演进,并为后续研究提供方向性建议。

I. 主题归纳

基于所提供的论文,当前专利分析领域的研究可以归纳为以下四个主要主题:

1. 基于人工智能的专利自动分类与定性

  • 涉及论文: [6], [8], [9], [10], [11], [12], [13]
  • 主题阐述: 该主题关注如何利用机器学习,特别是深度学习与大语言模型(LLMs),来提升专利分类的准确性、效率和粒度。精确的专利分类是技术监测、创新评估和知识产权管理的基础,但传统依赖人工或简单关键词的方法已难以应对海量、复杂的专利数据。这些研究通过引入结构化特征 [8]、BERT模型 [12]、乃至最前沿的LLMs [9, 11] 来处理文本,旨在实现更精准的多标签、层次化分类,并探索了分类系统在评估“循环经济进展” [10] 和预测“主导设计” [6] 等复杂概念中的应用潜力与局限性。

2. 基于文本挖掘的技术演化路径与趋势追踪

  • 涉及论文: [1], [5], [14], [17], [18]
  • 主题阐述: 该主题致力于通过分析专利文本的时间序列数据,来描绘特定技术领域的演化轨迹和未来趋势。理解技术如何随时间发展,对于企业制定研发战略、政府进行产业布局至关重要。这些论文综合运用宏观与微观分析框架 [1], 采用动态主题模型等方法,对海上风电 [1]、泰国汽车产业追赶 [5]、锂电池回收 [14]、6G通信 [17] 及教育技术 [18] 等关键领域的技术生命周期、创新网络演变和核心主题变迁进行了深入刻画。

3. 面向专利文本的深度语义理解与知识抽取

  • 涉及论文: [2], [3], [4]
  • 主题阐述: 此主题的核心目标是超越关键词匹配,深入解析专利文本的复杂语义,并抽取出结构化的知识。专利文献语言专业、结构复杂,简单处理会丢失大量关键信息。这些研究旨在解决这一挑战,例如,通过两步法精确匹配学术发明人的“论文-专利”对 [2],利用先进的注意力机制模型抽取文本中的实体与关系 [3],或应用预训练模型理解特定领域(如AI医疗)的专利文本演进 [4],为构建专利知识图谱和进行更精细的分析奠定基础。

4. 面向特定决策场景的高级专利分析应用

  • 涉及论文: [7], [15], [16]
  • 主题阐述: 该主题聚焦于将专利分析方法应用于具体的、高价值的决策场景,如法律、商业和技术预测。通用性的技术分析往往无法直接指导实践,因此需要面向特定问题开发专门的分析工具。这些研究探索了利用知识图谱与图像相似性进行专利侵权分析 [7],通过主题挖掘与预测来绘制GPU技术图谱 [15],以及系统性地回顾软计算方法如何通过专利全景分析来加强工业实践 [16],展现了专利分析从“描述性”向“决策支持性”的转变。

II. 发展趋势

1. “新”方法、分析路径、理论视角与应用场景

本次分析的论文集中涌现了若干显著的新动向,尤其是在方法论层面,深度学习和自然语言处理(NLP)的最新进展正被快速引入专利分析领域:

  • 新的方法:
    • 大语言模型(LLMs)的应用: 以 [9] 和 [11] 为代表,开始运用LLMs进行专利摘要生成和层次化分类。
    • 多模态融合分析: [7] 提出了融合专利知识图谱(源于文本和元数据)与专利附图图像相似性的新方法,用于侵权分析。
    • 定制化深度学习架构: [3] 提出了一种基于上下文查询和轴向注意力机制的模型来优化专利文本的实体和关系抽取。
  • 新的分析路径:
    • AI生成内容作为分析中介: [9] 探索了一条新颖的路径,即先用LLM为专利生成高质量摘要,再将这些摘要输入分类模型,从而提升分类性能。这是一种“AI辅助AI”的工作流。
    • 跨文献类型实体对齐: [2] 提出的两步法专门解决学术界与产业界知识流动的关键节点——识别同一发明人的论文和专利,这是一个精细化的数据链接任务。
  • 新的应用场景:
    • 图文结合的侵权判定: [7] 将分析从纯文本扩展到“权利要求书(文本)+附图(图像)”的综合比对,极大地贴近了专利侵权的司法实践。

2. “新意”所在及相较传统做法的革新

  • 从“特征工程”到“端到端学习”的深化: 传统方法严重依赖关键词、IPC分类号等人工设计的特征。而基于BERT [4, 12] 和LLMs [9, 11] 的新方法,能够自动从原始文本中学习深层语义表示,省去了繁琐的特征工程,并能捕捉更复杂的语言现象。LLMs的引入尤其显著,它们强大的零样本/少样本学习能力和生成能力 [9],正在改变专利分析的数据标注和任务范式。
  • 从“单模态”到“多模态”的跨越: 传统的专利分析几乎完全局限于文本和结构化数据。而 [7] 的工作通过引入图像信息,实现了多模态分析,这是一种质的飞跃。因为在许多技术领域(如机械、电子),附图是理解技术方案不可或缺的部分,仅靠文本分析会造成信息缺损,尤其在侵权比对等场景下。
  • 从“静态知识”到“结构化知识网络”的演进: 以往的文本挖掘多止步于提取主题或关键词。而知识图谱的构建(如 [3] 的基础工作和 [7] 的应用)将专利中的实体(技术、申请人、功效)及它们之间的关系显式地连接起来,形成一张知识网络。这使得查询和推理(如分析技术间的关联、寻找侵权证据链)成为可能,其分析深度远超传统方法。

3. 明显的加速方向

大语言模型(LLMs)在专利分析领域的应用正在快速成熟并形成一个显著的加速方向。 论文 [9] 和 [11] 表明,学术界已经迅速跟进LLMs的技术浪潮,并成功将其应用于专利分类和摘要生成等核心任务上。特别是 [9] 提出的“LLM生成摘要以辅助分类”的思路,巧妙地利用了LLM的生成能力来优化传统NLP任务,这预示着一系列基于LLM的“生成式分析”新范式即将涌现,有望在短期内重塑专利分析的工作流程。

III. 研究脉络中的推进情况

(1)数据分析深度的演进

  • A层 (仅用结构化信息): [8] 明确基于结构化特征进行分类;[14] 的创新网络分析主要依赖专利的合作、引证等结构化数据。
  • B层 (使用专利摘要): 这是最普遍的层次。多数进行文本挖掘和主题分析的论文,如 [1], [4], [5], [6], [10], [12], [15], [17], [18],其方法都适用于摘要级文本。[9] 虽使用LLM,但其分析对象是AI生成的摘要,也落在此范畴。
  • C层 (使用专利全文): [2] 为精确匹配论文与专利,很可能需要检索全文信息;[3] 的实体关系抽取任务通常在全文中效果更好;[11] 的多标签层次化分类,为区分细微的技术类别,也极可能依赖全文。
  • D层 (专利图文多模态): [7] 是唯一的、明确的代表,它将专利的知识图谱(文本派生)与图像相似度结合,是向多模态分析迈进的关键一步。
  • E层 (更高维度数据): 本次分析的论文中未见明确使用实验数据、传感器数据或产业链交易数据等形态。

推进情况分析:
是的,出现了明确的方法论层面推进。主流研究仍停留在B层和C层,但 [7] 从文本(C层)向图文多模态(D层)的迈进是质的飞跃。它不仅仅是增加了数据源,而是提出了一种融合不同模态信息进行复杂决策(侵权分析)的方法论,这为解决仅靠文本无法解决的问题开辟了新路径,构成了显著的推进。

(2)技术表征物(我们拿什么来刻画“技术”)的演进

  • 技术分类标签/IPC: [8], [10], [13] 直接将技术视为其所属的分类类目。
  • 合作网络中的节点: [14] 将技术(或拥有技术的机构)表征为创新网络中的节点。
  • 关键术语或关键词簇 (主题): [1], [15], [17] 通过主题模型将技术表征为一组概率性相关的关键词集合。
  • 文本的嵌入向量/语义表示: [4], [6], [9], [11], [12] 等采用深度学习的论文,将技术(通过其专利文本)表示为高维空间中的一个向量,向量间的距离代表了技术的语义相似性。
  • 知识图谱节点及跨模态组合表征: [3] 的工作旨在将技术分解为更细粒度的实体和关系,为构建知识图谱做准备。而 [7] 则实现了一种新的组合式表征:它将一项技术同时表示为知识图谱中的相关节点/子图(语义维度)和其附图的视觉特征(视觉维度)。

推进情况分析:
是的,出现了方法论层面的显著推进。研究不仅是从简单的标签、关键词向更丰富的语义向量演进,更重要的是 [7] 提出的跨模态组合式表征,是在重新定义如何为特定目的(如法律比对)而“刻画”一项技术。这种表示方法超越了单一的文本或结构化视角,承认了技术的复杂性和多面性,是一种更接近技术本质的表征方式,构成了方法论上的重要推进。

(3)关注技术类别的话题演进

  • 具体技术领域: 大部分论文聚焦于分析具体的前沿或重要技术领域,如“海上风电”[1], “AI医疗”[4], “6G技术”[17], “锂电池回收”[14]等。
  • 特定创新经济学概念: [6] 关注“主导设计”的出现,这是一个超越技术本身的、与市场动态结合的概念。
  • 政策导向型标签: [10] 关注“绿色专利”和“循环经济”,并批判性地审视现有分类体系能否有效衡量这一政策目标。

推进情况分析:
在这一脉络中,出现了战略/政策话语层面的推进。虽然没有出现类似“卡脖子技术”的全新流行标签,但研究的关注点正在深化。[10] 的工作是一个关键信号,它不再是简单地接受或使用一个标签(如“绿色专利”),而是反思该标签及其背后的分类体系是否真正反映了其所要衡量的新经济范式(循环经济)。这标志着研究从“应用框架”转向“审视框架本身”,其新意在于:

  • 强调的风险: 现有评价指标可能无法准确衡量真正的创新进展,导致政策和投资的错配。
  • 强调的价值: 呼吁建立与新发展理念(如循环经济)更相符的、更精确的技术评价体系。
  • 评价指标: 从简单的技术分类符合度,转向评估技术方案是否真正实现了物质循环、能效提升等循环经济的核心原则。
    这是一种从量化分析到更具批判性和建设性的战略话语的演进。

IV. 研究空白、期刊特征、后续选题

1. 研究空白:NLP/DL 最新进展的反哺

  • 可信度与可解释性 (XAI): 当前研究 [9, 11] 热情拥抱LLMs,但专利分析是高风险场景(如侵权判定),LLMs的“幻觉”问题是致命的。未来的研究亟需引入可信AI技术,如为模型的分类或判定结果提供源自专利原文的、可验证的解释和证据链。
  • 长文本理解与处理: 专利全文非常长,而多数流行的Transformer模型(如BERT)有输入长度限制。如何高效、无损地处理和理解完整的专利文档(尤其是权利要求书的复杂逻辑),仍是一个技术缺口。最新的长文本模型(如Longformer, Big Bird)和RAG(检索增强生成)架构有巨大应用潜力。
  • 复杂推理能力的融合: 专利侵权判定 [7]、新颖性评估等任务需要复杂的逻辑推理,而不仅仅是语义相似度匹配。将LLMs的常识和推理能力与专利知识图谱的结构化知识相结合,开发面向专利的专用推理引擎,是一个重要空白。
  • 大规模多模态模型应用: [7] 做了开创性工作,但仍是专用模型。利用更大规模的预训练多模态模型(如CLIP, LLaVA),有望系统性地解决专利中图表、化学式、流程图与文本的联合理解问题。

2. 期刊特征

尽管论文信息中“来源(Venue)”字段为N/A,但基于这类研究的性质,可以推断其潜在的发表渠道,以备后续投稿参考:

  • 技术创新与管理类期刊:Technological Forecasting and Social Change, Research Policy, Technovation。这些期刊偏好探讨技术演化、创新政策和产业动态的研究(如 [1], [5], [14], [17])。
  • 情报学与计量学期刊:Scientometrics, Journal of Informetrics, World Patent Information。这些期刊专注于科学计量、信息分析方法及其在专利数据上的应用(如 [2], [8], [10])。
  • 计算机科学与NLP顶级会议/期刊: 对于方法论创新性强的论文(如 [3], [7], [9], [11]),可以考虑投向ACL, EMNLP, AAAI等AI会议,或 IEEE Transactions on Knowledge and Data Engineering 等期刊。

3. 后续选题 (交叉领域)

  1. 基于多模态知识图谱的产业链“技术韧性”评估:
    • 交叉领域: 经济管理 (产业链韧性) + 公共政策 (技术安全) + 情报学方法 (多模态知识图谱)。
    • 内容: 融合专利文本、附图以及公司财报、贸易数据,构建一个多模态、跨领域的知识图谱。利用该图谱识别特定产业链(如半导体)上游关键组件的技术瓶颈,不仅在文本层面分析技术依赖,更通过附图分析(如关键设备、材料结构)来评估可替代方案的真实可行性,为产业政策提供更精准的“预警”和“强链”建议。
  2. 利用LLM进行创新政策效果的深度文本归因分析:
    • 交叉领域: 公共政策 (政策评估) + 经济管理 (创新绩效) + 情报学方法 (LLM, 因果推断)。
    • 内容: 传统政策评估多依赖专利数量或引用的变化。本选题旨在利用LLM“阅读”政策发布前后的大量专利,进行细粒度的技术方案对比。通过“文本差异归因”,判断政策(如新能源补贴)是否真正催生了“技术方案的本质性创新”,而非简单的现有技术重复组合。这能极大提升政策评估的深度和有效性。
  3. 预测“颠覆性技术”的早期信号:从“科学-技术”知识迁移路径出发:
    • 交叉领域: 情报学方法 (NLP, 动态网络分析) + 经济管理 (技术预见)。
    • 内容: 在 [2] 的工作基础上,大规模自动化链接学术论文与专利。利用先进的NLP模型追踪“科学概念”在学术文献中出现,到它演变为“技术术语”并出现在专利中的时间滞后、语义漂移和网络扩散模式。通过识别那些能快速、高效地从科学转化为多样化技术应用的知识路径,来寻找颠覆性技术潜力的早期信号。

V. 参考文献列表

[1] Quande Qin; Lan Luo; Fucheng Liao; Ying Liu; Jihong Chen; Chuan Pang. Tracking offshore wind technological evolution through patent text mining: A macro-micro analysis framework. N/A, 2025. URL: N/A
[2] Yuhang Wang [Nanjing University (CN)]; Lei Pei [Nanjing University (CN)]; Jianjun Sun [Nanjing University (CN)]; Lele Kang [Nanjing University (CN)]. Trace on both sides: a two-step text mining method to identify academic inventors’ patent–paper pairs. N/A, 2024. URL: N/A
[3] Tengke Wang [Anhui University of Science and Technology (CN)]; Yushan Zhao [Anhui University of Science and Technology (CN)]; G. Zhu [Anhui University of Science and Technology (CN)]; Yunduo Liu [Anhui University of Science and Technology (CN)]; Hanchen Li [Anhui University of Science and Technology (CN)]; Shunxiang Zhang [Anhui University of Science and Technology (CN)]; Meng-Yen Hsieh [Providence University (TW)]. An entity and relation extraction model based on context query and axial attention towards patent texts. N/A, 2024. URL: N/A
[4] Yi Jie Wang [Universiti Putra Malaysia (MY)]; Wei Chong Choo [Universiti Putra Malaysia (MY)]; Keng Yap Ng [Universiti Putra Malaysia (MY)]; Ran Bi [SAS Institute (United States) (US); Université Bourgogne Franche-Comté (FR)]; Peng Wang [Jiangsu Second Normal University (CN)]. Evolution of AI enabled healthcare systems using textual data with a pretrained BERT deep learning model. N/A, 2025. URL: N/A
[5] Suchit Pongnumkul; Kazuyuki Motohashi. Measuring technology catching up of automotive industry in Thailand by text mining of patent information. N/A, 2025. URL: N/A
[6] Koji Masuda; Yoshinori Hayashi; Shigeyuki Haruyama. Forecasting the Emergence of a Dominant Design by Classifying Product and Process Patents Using Machine Learning and Text Mining. N/A, 2025. URL: N/A
[7] Liting Jing [Zhejiang University of Technology (CN)]; C. Zhou [Zhejiang University of Technology (CN)]; Di Feng [Shanghai Industrial Technology Institute (CN); Zhejiang University of Technology (CN)]; Yubo Dou [Zhejiang University of Technology (CN)]; Xiaoyan Fan; Shaofei Jiang [Zhejiang University of Technology (CN)]. A Patent Infringement Analysis Approach Based on Patent Knowledge Graph Driven Fusion of Graph and Image Similarity. N/A, 2025. URL: N/A
[8] Ran Li [Jingdezhen Ceramic Institute (CN); Nanjing University of Science and Technology (CN)]; Wangke Yu [Jingdezhen Ceramic Institute (CN)]; Shuhua Wang [Jingdezhen Ceramic Institute (CN)]. Research on Chinese patent classification based on structured features. N/A, 2025. URL: N/A
[9] Naoya Yoshikawa; Ralf Krestel. Do large language models understand patents? Enhancing patent classification through AI-generated summaries. N/A, 2025. URL: N/A
[10] Anne Rainville; Irma Dikker; Magnus Buggenhagen. Tracking innovation via green patent classification systems: Are we truly capturing circular economy progress?. N/A, 2024. URL: N/A
[11] Bardia Rafieian; Pere‐Pau Vázquez. Improved multi-label hierarchical patent classification using LLMs. N/A, 2025. URL: N/A
[12] Munan Li; Liang Wang. Leveraging patent classification based on deep learning: The case study on smart cities and industrial Internet of Things. N/A, 2024. URL: N/A
[13] Lorenzo Fiorineschi; Rocco Furferi; Marco Melani; Federico Rotini. Does the Patent Classification Help Creativity in Generating New Product Applications? Some Preliminary Answers. N/A, 2024. URL: N/A
[14] Xia Wei; Shiyi Zheng; Liping Qiu; Hao Hu; Yufeng Chen; Shaobin Wei; Haiyan Zhou. Evolution of the Innovation Network of Lithium-Ion Battery Recycling Technologies in China from the Perspective of Patents. N/A, 2025. URL: N/A
[15] K. C. Hou; Mengying Wu; Wenjun Wu; Lei Huang. Topic mining and forecasting on patent map for GPU technology. N/A, 2025. URL: N/A
[16] S. Tamilselvan; G. Dhanalakshmi; D. Balaji [KPR Institute of Engineering and Technology (IN)]; L. Rajeshkumar [Alliance University (IN)]. Application‐Based Review of Soft Computational Methods to Enhance Industrial Practices Abetted by the Patent Landscape Analysis. N/A, 2024. URL: N/A
[17] Jianmin Jiang [Institute of Scientific and Technical Information (CN)]; Fangli Ying [East China University of Science and Technology (CN)]; Riyad Dhuny [University of Technology, Mauritius (MU)]. Unveiling Technological Evolution with a Patent-Based Dynamic Topic Modeling Framework: A Case Study of Advanced 6G Technologies. N/A, 2025. URL: N/A
[18] Navid Mohammadi [University of Tehran (IR)]; Mehrdad Maghsoudi [Shahid Beheshti University (IR)]; Mohammad Sabet [University of Tehran (IR)]; Mahdi Soghi [University of Tehran (IR)]. Unveiling the Evolution of Educational Technologies: A Patent-Based Clustering and Life Cycle Analysis. N/A, 2025. URL: N/A

Avatar photo

By Chaoran


Warning: call_user_func_array() expects parameter 1 to be a valid callback, function 'wp_print_speculation_rules' not found or invalid function name in /usr/local/lighthouse/softwares/wordpress/wp-includes/class-wp-hook.php on line 324