一、AI 与智能技术:先分清能力边界,再谈应用价值
杰文斯悖论可以用于理解 AI 扩散。模型单位推理成本下降、性能提升、工具可用性增强,会降低单次任务成本,但也会扩大使用规模,诱发更多应用场景、更高调用频率、更复杂工作流和更多基础设施需求。结果可能不是总算力、数据、能源和设备需求下降,而是单次任务更便宜、总需求更大。判断 AI 技术影响时,不能只看单位成本曲线,还要看需求弹性、应用密度、组织采用速度和任务链扩展。
当多个基础模型在常见 benchmark 上接近时,模型提供方很难只靠通用能力形成差异。真正的差异会转向领域适配、工具调用、私有知识库接入、可控性、稳定性、成本、延迟、上下文管理、权限体系、工作流嵌入和生态服务。模型强不等于产品强,通用能力强也不等于能在组织场景中稳定完成任务。后续竞争更像系统工程:模型只是核心部件,数据、流程、验证和服务才决定最终可用性。
机器学习是大范畴,深度学习是机器学习的子集,BERT 和现代大语言模型是深度学习在自然语言处理中的具体模型或模型类别。BERT 基于 Transformer encoder,核心能力偏向语义理解、分类、命名实体识别等任务,不能像自回归生成模型那样直接连续生成长文本。现代 LLM 通常规模更大,偏向生成、对话、开放任务和工具调用。n-gram 是统计语言模型,不是深度学习模型;它依赖词序列共现概率,不依赖深层神经网络。概念层级不清,后续方法选择和论文表述都会乱。
具身智能不是“更聪明的 AI”,而是有身体、有感知、有动作、有环境反馈的智能系统。机器人、自动驾驶、智能机械臂、无人系统等可以通过传感器感知环境,通过动作改变环境,再根据反馈修正行为。纯文本大语言模型、问答系统、写作工具、信息检索系统属于非具身智能,它们主要在信息空间中处理符号和文本,不直接作用于物理世界。只输出 token 的模型可以辅助具身系统推理和规划,但本身不等于具身智能。
科研中的 AI 使用可以拆成三层:内容供给、推理展开、文档一致性。内容供给依赖本地知识库和向量检索,把个人已经积累、筛选、理解过的资料调出来,减少手动回忆和关键词检索;推理展开依赖结构化思考工具,把模糊问题拆成可检查步骤,避免一次性生成造成的跳跃;文档一致性依赖工程化编辑平台,从全局检查术语、结构、章节目标、研究问题和前后结论是否一致。AI 的价值不是替代创新性判断,而是把重复检索、材料关联、结构推演和全局修改变得可控。
算法成果的保护通常比硬件装置、工艺设备、结构设计更困难。专利保护需要满足新颖性、创造性、技术效果和公开要求,公开后又可能降低保密性;商业秘密依赖持续保密,一旦被反向工程、人员流动或独立开发突破,保护强度就下降;著作权主要保护代码表达,不保护算法思想本身。先发者承担研发成本、市场教育成本和试错成本,后发者可能复制思路、使用更好的基础设施和数据、避开早期错误。算法领域的先发优势必须叠加数据壁垒、用户网络、切换成本、部署能力、品牌信任和生态绑定,否则容易变成先发劣势。
二、技术预见与知识产权:把未来问题变成可计算、可讨论、可验证的结构
技术预见是系统性、参与性、面向未来的分析过程,用于识别可能出现的新兴技术、评估潜在影响,并为当下行动提供依据。它不等于给出一个确定预测,而是构建多种情景、识别早期信号、比较技术路线、评估资源配置方向和形成行动共识。德尔菲法、情景分析、技术路线图、专家研讨、文献计量、专利分析和文本挖掘都可以进入技术预见流程。关键不是“未来一定如何”,而是“哪些变化已经有信号,哪些路径值得提前准备”。
技术主题建模只是从文本中抽取主题,得到“有哪些技术主题”;新兴度测度是在主题基础上构建指标,判断新颖性、增长性、持续性、扩散性和影响力;新兴技术识别是在测度之后按阈值或规则筛出候选对象;演化分析关注这些对象如何随时间迁移、分化、融合或衰退;预测分析才是判断后续趋势。测度通常在识别之前,识别不能和主题抽取混为一谈。章节结构也要跟流程一致,否则会出现标题写“识别”,内容却只是“建模”的问题。
“多维特征融合”只是技术路线描述,不自动构成研究创新。需要说清楚是哪几类特征,例如语义特征、时间特征、网络特征、增长特征、引用特征、主体特征;这些特征来自什么数据;每一类特征解决什么不足;融合后比单一特征多解释了什么;融合结果如何验证。如果只是把多个指标放进一个模型,创新性很弱。真正有意义的是把对象、特征、测度、识别和验证连接起来,让读者看清为什么必须融合,以及融合之后判断能力具体提高在哪里。
以专利文本做技术演化研究时,第一步是解决术语识别,尤其是技术文献中大量复合词、专有词和行业词无法被普通词典稳定切分的问题;第二步是用主题模型识别技术主题,把大量文本转成主题分布;第三步是引入时间维度和转移关系,识别主题之间的稳定、迁移、衰退和潜在热点。Viterbi 可用于改善术语识别,LDA 可用于主题挖掘,HMM 可把技术创新看成带有随机性的演化过程。方法组合的价值在于让技术路径不只是人工叙述,而是可以从文本和时间序列中被追踪。
高新技术项目的知识产权评议不能只查有没有相关专利。更完整的评议包括:围绕核心技术构建专利数据库,做专利态势分析、重点技术趋势分析、重要权利人分析;评估项目的自由实施度,判断是否存在潜在侵权风险;再评估承担主体自身的专利储备、技术创新能力、知识产权管理能力和预警机制。结论应服务项目决策:哪些技术方向可以推进,哪些方向需要规避,哪些专利需要布局,哪些合作或许可需要提前处理。
技术创新偏好不一定只能用专利数量、引用次数或专家判断衡量。可以先用主题模型识别技术主题,再用大语言模型从专利文本中抽取与特定维度相关的关键表述,最后用跨语种语义模型计算这些表述与指标词集合的语义距离。效率可以覆盖生产效率、能耗效率、传输速度、成本降低和产能提升;质量可以覆盖可靠性、稳定性、精度、耐用性和安全性。这样能把“某类技术更偏效率还是更偏质量”从主观判断变成可复核的文本测度问题。
模型做出主题、指标、路径和预测之后,必须回答结果是否可信。验证可以来自人工抽样复核、专家判断、历史数据回测、不同模型对比、不同参数敏感性检验、不同数据集扰动后的稳定性检验、实际案例匹配和预测误差评估。验证不应被塞在某个小节末尾一笔带过,重要研究中可以单列二级标题。没有验证,技术路线看起来复杂,但结论仍然只是模型输出;有验证,方法才有机会变成可以被他人相信和复用的研究流程。
三、科研方法与论文写作:概念要窄,证据要硬,结论要能回到问题
消融实验的核心是比较完整系统和删除、添加、替换某个模块后的系统差异。指标通常沿用任务本身的评价指标,例如分类任务用准确率、召回率、F1、AUC,回归任务用 MSE、MAE、R²,检测任务用 mAP,生成任务用 FID 或其他领域指标。还要同时看效率和成本,例如参数量、FLOPs、推理时间、训练时间、内存占用和部署复杂度。删除模块后性能显著下降,说明模块有贡献;添加模块后提升很小但成本暴涨,说明性价比不足;删除后性能不变甚至提升,说明原模块可能冗余、噪声化或过拟合。
消融实验不能只是列几个模型名称。完整模型、基础模型和各变体必须使用相同数据、相同预处理、相同训练策略、相同超参数和相同评价指标。若删除某个模块导致参数量、计算量明显变化,需要讨论性能变化是否来自结构贡献,还是来自模型规模变化。多个模块之间可能存在交互:单独删除 A 和单独删除 B 的损失相加,不一定等于同时删除 A+B 的损失。消融实验的目标不是“证明每个模块都有效”,而是解释系统为什么有效,哪些模块关键,哪些模块可以简化。
MECE 的含义是相互独立、完全穷尽。相互独立要求每个类别边界清楚,不把同一个对象同时放进多个类;完全穷尽要求所有类别加起来覆盖研究对象,不留下空白。它适合用于问题树、课程结构、研究框架、案例分类、原因分析和评分标准设计。判断一组分类是否 MECE,不能只看名称是否整齐,要看分类轴是否统一。按年龄分组、按流程分组、按公式分解通常更稳定;把“年轻人、上班族、学生”放在同一级,重叠和遗漏都会出现。
“研究不充分”“体系不完善”“解释性不强”不是合格缺口。合格缺口要说明:已有研究没把什么和什么结合,导致什么对象无法识别;已有指标只覆盖哪一面,导致哪类变化被低估;已有模型黑箱在哪个环节,导致结果不能解释;已有研究停留在哪类数据,导致哪个场景不可用。缺口还要和后文创新点一一对应。前面写三个不足,后面写四个创新,且无法对应,论文结构就会松。评述不是批评别人,是给自己的研究必要性铺证据。
论文开头不能在宏大背景里绕太久。第一段最好快速界定核心概念,指出对象为什么重要,说明如果这个问题不解决会造成什么分析或实践困难。题目如果写“某产业的新兴技术识别”,引言就要早一点出现产业和识别问题,不能先铺大量泛化的新兴技术意义。章节标题也要暴露足够信息,尽量看出使用的数据、方法和研究动作;“基于某视角的研究”信息量低,“主题建模、测度、演化、预测、验证”这类动作更清楚。
结论部分应当把研究问题、核心证据和最终判断压成一条线。它可以按研究问题逐条回应,也可以按主要发现组织,但不能只是把每章内容重新概括一遍。有效结论通常包含:研究对象的总体状态、关键机制、主要差异、可执行路径、方法贡献和边界条件。政策建议、管理启示或改进方向必须由前文证据推出,不能在结论里突然出现。结论越想有分量,越要少说空话,多说具体判断。
稳定的润色提示词需要四个部分:角色、任务、原则、输出格式。角色用于限定学科和文本类型;任务用于说明是翻译、润色、降重还是摘要;原则用于限制保持原意、不扩写、不改引文、不改公式、不改专业术语、短标题不大改;输出格式用于要求直接输出、保持编号、保持段落数、不加解释。多段文本应先编号,再要求模型按同样编号返回,方便程序解析。英文文本必须要求英文输出,中文文本必须要求中文输出;如果不写语言一致,模型可能在中途换语种。
论文降重提示词要明确:保持输入语言,保持原意,保持相近长度,输出单段或保持原段落数,不使用 Markdown,不解释过程,不增加新观点,不改技术术语和引文。多轮降重尤其容易导致文本越来越长,因为模型会把“学术化”理解成扩写。更稳的做法是每一轮只承担一个任务:第一轮调整句法和词汇,第二轮重排表达方式,第三轮做最终精炼。每一轮都必须写“不要显著扩展内容”,否则篇幅会失控。
四、教学与课程设计:工具要进入流程,要求要能指导执行
在“教”的层面,AI 可以辅助备课、教案生成、课件初稿、题目生成、案例整理和教学资源管理;在“学”的层面,AI 可以提供个性化学习路径、即时答疑、错题反馈、复习材料和知识点练习;在“管”的层面,AI 可以做出勤、学习行为、课堂参与度、作业提交和教学活动分析;在“评”的层面,AI 可以辅助客观题批改、主观题初筛、评分一致性检查和学习预警。这个分类比泛泛说“AI 改变教育”更可操作,也能看出哪些环节适合自动化,哪些环节仍需要教师判断。
课程音频先转写成文本,再做关键词提取、主题建模、摘要生成、问答对提取、术语识别和大纲对齐检查,可以判断一节课讲了哪些核心概念、哪些主题占用时间过多、哪些内容和课程目标偏离、哪些问题被学生集中提出。音频本身还可以分析语速、停顿、音量、填充词和多人互动比例。结果可以用于教师复盘、课堂摘要、FAQ、复习题和教学改进。前提是音频质量可靠、说话人识别准确,并且关键结论经过人工核对。
可用的 AI 教学平台至少要贯通资源、图谱、智能体、备课、课堂、作业和反馈。课程资料上传后能生成知识库和知识图谱;智能体能围绕课程内容回答学生问题;教案、课件、题目和案例能基于课程资源生成并允许教师逐步编辑;课堂中可以签到、投票、检测和答疑;课后可以按知识点布置作业,分析学生掌握情况,并提示薄弱知识点。只展示“大模型接入”没有意义,必须说明它解决了传统课堂中哪个具体痛点。
课程名是“金融数据挖掘”,内容就不能仍然只围绕文本挖掘。金融数据挖掘至少要覆盖结构化金融数据、非结构化文本数据、金融时间序列、分类、聚类、回归、关联规则、情感分析、主题模型、信用风险、欺诈检测、客户细分、市场分析和数据伦理。课程目标要从“理解文本数据挖掘”改成“理解金融数据挖掘的理论、数据类型、处理技能、工具方法和实际金融问题应用”。题目变了,目标、内容、实践项目、考核方式和参考教材都要同步变。
一个有效的大作业说明应包括:任务目标、选题范围、题目格式建议、报告结构、课程知识点使用要求、标注方式、字数、文件格式、提交方式、截止时间、学术规范和评分细则。评分细则要提前量化,例如选题价值与问题界定、课程知识运用、分析逻辑与论证深度、报告规范与文字表达分别占多少分。最关键的是课程知识不能只被列出,必须进入分析;不能贴标签,必须解释现象;不能只描述案例,必须形成判断。学生知道什么算有效使用知识点,作业质量才不会散。
章节末尾的教学反思不需要写成长篇感想,更不需要写空泛表态。可以围绕几个问题压成一段:本章知识点是否讲清,案例是否支撑概念,学生在哪些环节可能卡住,课堂互动是否充分,作业或测验能否检验目标,下次如何调整讲授顺序、案例材料或练习设计。教学反思的价值在于留下下一轮教学可修改的对象,而不是表达教师态度。
五、创新管理与案例教学:案例只是材料,机制才是知识
技术创新能为企业带来优势,至少包括四类机制:第一,形成差异化性能、成本、效率或可靠性优势,在竞争中取得位置;第二,解决原有技术路线的瓶颈,把设备难题、工艺难题、材料难题或应用难题变成新方案;第三,开辟新产品、新场景和新赛道,把原有能力迁移到更高价值空间;第四,支撑关键技术自主性,减少对外部技术路径、供应链或标准体系的被动依赖。教学时不应只说某企业“重视创新”,而要说明创新到底改变了哪一种约束。
同一个案例可以服务不同教学目标:如果讲技术追赶,就看外部知识吸收、二次创新和能力积累;如果讲商业模式,就看价值创造、价值传递和价值获取;如果讲平台生态,就看网络效应、治理规则和互补者激励;如果讲专精特新,就看细分市场、核心技术和组织专注;如果讲标准必要专利,就看技术标准、权利布局和谈判位置。案例名称只是入口,课堂问题才是教学结构。学生要被引导回答“这个案例说明了什么机制”,不是记住企业故事。
活动可以按体力/智力、创造性/重复性形成四象限。创造性体力活动包括雕塑、舞蹈编排、工艺制作、场景搭建等;创造性智力活动包括理论构建、论文设计、算法设计、课程设计、商业模式创新等;重复性体力活动包括搬运、装配、标准清洁、固定路线驾驶等;重复性智力活动包括数据录入、标准化校对、按模板报表、执行测试用例、批改客观题等。这个分类有助于判断 AI 和自动化适合替代哪里:重复性智力活动最容易被替代,创造性智力活动更适合被辅助而不是被完全接管。
组织不能只按名称分类。按功能目标,可以看组织生产什么、服务什么、整合什么、维持什么;按受惠者,可以看成员、客户、所有者还是公众获益;按顺从方式,可以看强制、报酬还是规范感召;按技术类型,可以看长链流程、媒介连接还是集约处理。分类的目的不是贴标签,而是决定分析哪一面。教学和论文中如果先选好分析轴,后面的案例比较、变量选择和理论解释都会更稳。
六、科学与工程常识:把现象还原成约束条件
制冷不是凭空消除热量,而是把热量从低温空间搬运到高温空间。热力学第一定律要求能量守恒,室内被吸收的热量加上压缩机做功转化的热量,最终都必须排到系统外;热力学第二定律要求热量不能自发从低温流向高温,要实现这个过程必须做功,并伴随放热。所谓不排热的设备,如果只是水蒸发降温,本质是把显热转成潜热并增加湿度,没有把房间总热量移走;如果是移动空调却不接排热管,热量仍留在室内,长期看不会真正降温。
自然光的电场振动方向杂乱,照射到水面、玻璃、路面等非金属表面后,反射光会在较大程度上变成特定方向的偏振光,尤其是造成刺眼眩光的水平偏振分量。偏振光镜相当于只允许某一方向振动的光通过的滤网,当镜片透振方向与眩光振动方向不匹配时,眩光被吸收或阻挡。它并不让世界变暗这么简单,而是选择性削弱反射形成的特定偏振分量,所以能看清水面下、玻璃后或路面细节。
日出日落时,太阳光斜穿过更厚的大气层,短波长的蓝紫光被瑞利散射大量散掉,长波长的红橙光更容易穿透大气。若此时天空中有适量中高云,云中的水滴和冰晶会把红橙光反射、散射到观察者眼中,于是云层呈现橘红、深红或金色。没有云就缺少幕布,云太厚又会挡住光,空气中颗粒过多也可能削弱色彩。火烧云不是云自己发光,而是太阳低角度光线经过大气筛选后照亮云层。

