2025 年 1 月收获

图像生成参数排错

图像生成出现花屏时，不要先改提示词，先排查采样器、调度类型和步数。通用顺序是：先用默认稳定组合测试；如果花屏，切到更稳定的 DDIM、Turbo 或 DPM++ 2M；再把采样步数提高到 20-30；最后再考虑放大算法。放大算法也要按图像类型选：一般图像先用 Latent，真实感和细节要求高再用 R-ESRGAN 4x+，动漫类再用 Anime6B。这个知识点可以后续整理成一张“生成异常排查表”：花屏、细节糊、速度慢、边缘坏、放大失真，各自对应参数调整。

Excel 工作簿公式审计

审计一个多表 Excel 模型时，不能只看最终表格，应先把公式抽出来，按“直接引用、跨表引用、跨工作簿引用、外部链接、易错公式”分层检查。最应该优先看的不是普通加减乘除，而是 VLOOKUP、INDEX/MATCH、INDIRECT、OFFSET、数组公式、隐藏表、命名区域和外部链接。审计动作可以固定成四步：先列出所有工作表与隐藏状态；再提取全部公式及所在单元格；再生成引用关系图；最后定位断链、硬编码、循环引用、异常空值和同列公式不一致。这样处理的重点不是“帮人看 Excel”，而是把工作簿当成一个小型程序来做依赖分析。

机构合作网络生成

用专利或论文数据生成机构合作网络时，节点不应直接使用原始机构名。第一步要做机构名清洗，把同一主体的不同写法合并，把明显不是机构的字段剔除。第二步要确定边的含义：如果一条记录中有多个申请人或作者机构，就在这些机构之间建立共现边；如果同一对机构在多条记录中出现，边权重累加。第三步要输出适合 Gephi 的节点表和边表，节点表至少有 Id、Label、类型、国家或地区等字段，边表至少有 Source、Target、Weight。这个方法后续可以复用到高校合作、企业合作、区域创新网络、技术联盟分析。

Gephi 网络导入与解释

Gephi 里的网络图不是为了“看起来复杂”，而是为了回答节点重要性、群落结构和关系强度。导入前要保证节点表和边表字段一致，Source 与 Target 必须能在节点 Id 中找到。导入后先跑基本统计：度、加权度、介数中心性、模块度；再做布局。解释时不要只说“某节点很大”，要说明它是连接多、权重高、跨群落桥接，还是处在某个局部团簇中心。颜色通常表达模块或类别，大小表达中心性或规模，边粗表达合作强度。图只是结果入口，真正可用的是指标、群落、异常节点和可解释的结构关系。

LDA 主题数选择

LDA 的主题数不能只靠困惑度，也不能只看可视化图好不好看。困惑度倾向于数学拟合，可能主题更多时更低，但不一定更可解释；一致性指标更接近人工理解，但也不能替代领域判断。比较可靠的做法是设定一个候选范围，例如 5-30 个主题，分别计算困惑度和一致性，同时查看每个主题的前若干关键词和代表文档。如果主题之间高度重复，说明主题数偏多；如果一个主题里混入多个明显不同方向，说明主题数偏少。最后选择的不是“最优数学点”，而是指标可接受、主题可解释、能服务研究问题的折中点。

LDA-HMM 技术主题预测

LDA-HMM 可以把文本主题和时间演化连接起来。LDA 负责把专利或论文文本转成主题分布，HMM 负责把主题分布看作观测序列，识别潜在技术状态及状态转移。可操作流程是：按年份或时间窗口整理文本；训练 LDA 得到每篇文档的主题概率；把同一时间窗口内的主题概率聚合成序列；用 HMM 学习状态转移矩阵；最后分析哪些主题更可能从当前状态转入增长、稳定或衰退状态。这个框架的价值不在于预测一个确定未来，而在于把“主题变化”转成可讨论的状态迁移问题。

技术突变阈值不能随手定

识别技术突变时，不能直接规定“增长超过多少就是突变”。阈值如果没有依据，就很容易变成主观判断。更稳妥的做法是先定义指标，例如主题占比变化、关键词频次变化、专利数量变化、中心性变化或相似度变化；再用统计方式确定异常点，例如均值加若干倍标准差、分位数阈值、同比变化分布的上尾，或者结构断点检测。阈值还要和样本规模绑定：数据量小的时候，单个记录就可能造成大幅波动；数据量大时，较小比例变化也可能有实际意义。技术突变不是单一数字，而是指标、窗口、阈值和解释共同构成的判断。

BERT 与技术网络预测

BERT 可以用于技术网络预测，但要先明确预测对象。它可以把专利摘要、权利要求、论文摘要等文本编码为向量，再用向量相似度构造技术相似网络，或作为节点特征输入图模型。可预测的问题包括技术主题相似、潜在合作关系、技术路径延伸、专利引用关系和未来主题归属。一个可行结构是：BERT 负责文本语义表示，图网络负责关系结构学习，时间切片负责演化约束。不能把 BERT 当成万能预测器；它解决的是语义特征抽取，真正的预测还要靠任务定义、标签构造、时间验证和外部解释。

BERT 模型加载

加载 BERT 模型时，常见错误不是算法问题，而是路径、依赖、模型文件和环境不一致。需要确认模型目录里是否有 config.json、权重文件、词表文件，确认 transformers 版本是否兼容，确认本地路径没有被当成远程模型名。离线环境下尤其要注意缓存目录和模型文件完整性。调试顺序是：先用最小代码加载 tokenizer；再加载 model；再输入一条短文本测试输出维度；最后接入正式数据。这样可以把“环境错误”和“任务代码错误”分开，不至于在完整流程里盲查。

Derwent 3D 打印专利检索

Derwent 检索 3D 打印专利时，关键词不能只写 3D printing。需要同时覆盖 additive manufacturing、rapid prototyping、selective laser sintering、fused deposition modeling、stereolithography、powder bed fusion、binder jetting 等术语，并结合 Derwent 手工代码、IPC/CPC 分类号和标题摘要字段。检索式应区分核心技术、材料、设备、应用场景和后处理。比较稳的策略是先用宽检索取样，观察高频术语和分类号，再收紧检索式；最后人工检查噪声样本，避免把普通打印、二维打印或无关制造工艺混进来。检索不是一次写完，而是迭代逼近边界。

Tasker 与滴答清单自动化

Tasker 可以把手机上的零散输入转成任务系统动作，但关键是降低触发成本。比较可用的方案是：通过快捷方式、通知栏按钮、剪贴板监听、分享菜单或语音输入，把文本送到 Tasker；Tasker 再调用滴答清单接口、URL Scheme 或中间服务写入指定清单。为了后续稳定，任务字段最好结构化，例如标题、备注、日期、标签、来源。不要一开始就追求复杂工作流，先做到“随时记录一条内容，自动进入固定收集箱”，再逐步增加分类、提醒、同步和日志。

Tasker 剪贴板与 WebDAV

Tasker 和 WebDAV 可以构成一个轻量信息管道。剪贴板或分享文本进入 Tasker 后，Tasker 把内容写成 Markdown 或 JSON，再通过 WebDAV 同步到固定目录。这个方案适合保存临时想法、网页摘录、待处理知识点和跨设备输入。设计时要注意文件命名，最好用时间戳加短标题，避免覆盖；内容里保留来源、时间、原文、备注等字段；失败时写入本地队列，恢复网络后再同步。它的核心价值是把“想到一下”变成可追踪文件，而不是停留在聊天框或剪贴板里。

OAuth2.0 本地调试

OAuth2.0 本地调试要先确认授权模式、回调地址和令牌交换流程。常见问题集中在 redirect URI 不一致、端口不匹配、scope 不足、client secret 错误、授权码过期、HTTPS 与 HTTP 限制。调试时应把流程拆开：先构造授权 URL；打开浏览器授权；确认本地服务能收到 code；再用 code 换 access token；最后调用一个最简单的 API 验证权限。不要在完整业务代码里同时查 UI、服务端和授权问题。OAuth 的错误通常很明确，但前提是把每一步的请求和响应都单独保存下来。

提示词工具应做成状态化网页

提示词工具如果只是一段文本，很快会变得不可维护。更好的形态是状态化网页：把角色、任务、输入材料、约束、输出格式、示例、变量和历史版本拆成字段，而不是堆在一个大文本框里。用户修改某个字段时，系统实时生成最终提示词，并可以复制、保存、导出。这样的工具还应支持模板、版本对比和测试记录。它解决的不是“写一个更漂亮的提示词”，而是把提示词变成可配置、可复用、可审计的工作对象。

JSON、SVG、HTML 的轻量转换

很多小工具不需要复杂后端，只要能在浏览器里完成 JSON、SVG、HTML 的转换和预览。JSON 可以用于结构化配置，SVG 用于可编辑图形，HTML 用于展示和导出。一个轻量工具可以支持粘贴 JSON，生成可视化 SVG；也可以把 SVG 嵌入 HTML，生成可发布页面。关键是输入校验、错误提示和导出格式。对于一次性可视化、课程材料、流程图和小型数据展示，这种本地网页比完整系统更快，也更容易长期维护。

邮轮空间化完工管理

邮轮建造或类似大型复杂装备的完工管理，不能只按专业或系统拆分，还要按空间组织。空间化管理的核心是把舱室、区域、甲板、系统、设备、任务和责任单位绑定起来。这样可以回答某个空间内还有哪些任务未完成、哪些系统互相影响、哪些区域具备交付条件。数据结构上，空间是主索引，任务、问题、材料、人员、检查记录都挂到空间节点下。它比单纯清单更接近现场，因为现场处理问题时首先面对的是“这个区域现在能不能交付”。

邮轮数字交付接口

数字交付不是把文件打包给对方，而是要明确对象、格式、版本、责任和验收标准。接口设计应覆盖设备台账、图纸、证书、检验记录、变更记录、维保信息、空间位置和系统关系。每类数据都要有唯一标识，能和空间、系统、设备对应起来。交付过程中还要处理版本冻结、问题回退和补交。数字交付的难点不是上传文件，而是让交付数据和建造过程数据保持同一套标识逻辑，否则交付后很难检索、维护和追责。

邮轮异常管控

异常管控需要区分问题、缺陷、变更、风险和待确认事项。所有异常都应记录来源、位置、责任方、影响范围、处理时限、状态、证据和关闭条件。状态不能只写“处理中”，应至少区分新建、已分派、处理中、待验证、已关闭、退回。对于复杂项目，异常还要能关联空间、系统、任务和交付物。这样做的目的不是增加填表负担，而是避免问题在会议纪要、微信群、口头安排和现场记录之间丢失。

区域权限通符管理

权限配置如果逐项列出，很快会失控。区域权限可以用通符或层级规则处理，例如按组织、项目、区域、数据类型、操作类型组合生成权限。关键是规则要可解释，不能出现一个人因为多个角色叠加而获得无法追踪的权限。设计时应支持白名单、黑名单、继承、覆盖和审计日志。权限系统的难点不在“能不能访问”，而在“为什么能访问、谁给的权限、什么时候失效、是否越权”。通符是为了减少配置量，不是为了模糊责任边界。

教学激励体系

教学激励不能只奖励最终成绩，否则会鼓励短期应试。更合理的结构是把过程投入、阶段产出、协作表现、能力提升和最终成果分开评价。激励对象也不只学生个人，还可以包括小组、助教、教师和课程组织者。指标设计要注意可观察、可记录、可反馈，避免抽象口号。比如课堂参与、作业迭代、同伴互评、项目贡献、反思记录、公开展示都可以成为过程指标。激励体系的作用是把希望发生的学习行为变成可见的制度信号。

专业英语作文评分

专业英语作文评分应把语言正确性和专业表达分开。语言层面看语法、词汇、句式、衔接和可读性；专业层面看概念使用是否准确、论证是否符合学科语境、术语是否恰当、是否能清楚表达技术或管理问题。评分标准最好有分档描述，避免只给总分。反馈也应具体到可修改点，例如术语误用、句子过长、逻辑跳跃、例证不足。对于教学场景，评分不是终点，应能引导学生知道下一稿具体改什么。