public-agent-skills

About public-agent-skills

## cafe3310's Public Agent Skills 个人常用的 Agent Skill（公开部分）。通过合适的上下文工程，可以将 Agent Skill 用在几乎任何地方。 ### 提醒 Agent Skill 可能非常个性化，很多都是用户个人最佳实践的提炼，不一定对其他人有用。这玩意儿说穿了是提示词和代码的集合。在当下，提示词也是代码。审核你放进本地 agent 的每一个 skill 的所有文档和代码，不要被人搞啦。任何 LLM 相关的问题基本都是公开知识，学习如何使用 LLM 或让它协同你工作的方法里，最好的就是问 LLM 自己，最智障的是花钱买课。可以先问问 Gemini / GPT「这是我看到的文档，我希望学习关于 x 的知识。交互式地教教我」。为了让 Agent 能够正确识别每个 Skill 的依赖，这个仓库中的 `SKILL.md` Frontmatter 声明了以下扩展属性： - `depends_on_skill`：这个 Agent Skill 运行依赖的其他 Agent Skill。 - `depends_on_binary`：这个 Agent Skill 运行依赖的其他程序（如 `ffmpeg`、`python3`）。 ### 后续计划工作和生活中自己不想做的麻烦事情基本会做成 Agent Skill 放在这里。有计划认真给我猫制作 [咩咩和啾啾相册](https://github.com/cafe3310/miemie-jiujiu-album) ... ### 安装 #### 手动安装在 ...

c

Published by

cafe3310

Visit View Profile

README.md

View on GitHub

cafe3310's Public Agent Skills

个人常用的 Agent Skill（公开部分）。通过合适的上下文工程，可以将 Agent Skill 用在几乎任何地方。

提醒

Agent Skill 可能非常个性化，很多都是用户个人最佳实践的提炼，不一定对其他人有用。

这玩意儿说穿了是提示词和代码的集合。在当下，提示词也是代码。审核你放进本地 agent 的每一个 skill 的所有文档和代码，不要被人搞啦。

任何 LLM 相关的问题基本都是公开知识，学习如何使用 LLM 或让它协同你工作的方法里，最好的就是问 LLM 自己，最智障的是花钱买课。可以先问问 Gemini / GPT「这是我看到的文档，我希望学习关于 x 的知识。交互式地教教我」。

为了让 Agent 能够正确识别每个 Skill 的依赖，这个仓库中的 SKILL.md Frontmatter 声明了以下扩展属性：

depends_on_skill：这个 Agent Skill 运行依赖的其他 Agent Skill。
depends_on_binary：这个 Agent Skill 运行依赖的其他程序（如 ffmpeg、python3）。

后续计划

工作和生活中自己不想做的麻烦事情基本会做成 Agent Skill 放在这里。

有计划认真给我猫制作咩咩和啾啾相册 ...

安装

手动安装

在同时使用 antigravity-cli, opencode, pi 等不同 Agent 工具时，详尽的 skills 安装说明与最佳实践如下：

原始文件保持在 git 目录
在 ~/.agents/skills 目录物理拷贝同步（支持差异比对与覆盖提示，供 opencode, pi 等工具使用）
在 ~/.gemini/antigravity-cli/skills 目录物理拷贝同步（供 antigravity-cli 使用）

你可以克隆项目仓库后，直接运行以下脚本来自动完成安装与同步：

chmod +x link_skills.sh
./link_skills.sh

该脚本会自动探测你系统中的 ~/.agents、~/.claude、~/.gemini/antigravity-cli 和 ~/.gemini 等目录，并在这些已存在的目录下执行物理技能目录的同步与拷贝。若目标目录中已存在且文件有修改，会交互式提示您确认覆盖（若均不存在，则默认在 ~/.agents/skills 和 ~/.gemini/antigravity-cli/skills 中创建并拷贝）。

此外，脚本在执行时，若目标目录下不存在 agents.md，它会自动在该目录下创建一个 agents.md 说明文件，指明这里的 skills 是复制自哪个本地物理仓库路径，提示在该工作区下编辑 skills 时应优先编辑源路径并重新运行 link_skills.sh 脚本；若目标目录下已存在该文件，则跳过生成。

自动安装

向你的 Agent 发以下指令：

请先读取并按此文件的指示进行操作： https://raw.githubusercontent.com/cafe3310/public-agent-skills/main/skills/cafe3310-skill-installer/SKILL.md

记得先审核一下脚本做了什么。

一、创作与知识管理

这类 Skill 解决信息结构化、表达优化与知识复用问题。

适用于内容生产、研究分析及长期知识资产管理。

深度研究 / deep-research

一个具备严谨性的多阶段深度研究方案。通过领域方法论机制，在展开具体研究前自动确立行业标准评估框架。随后，它动态编排多个 Subagent 深入网络挖掘关键数据点与对比指标，避免生成表面化的总结。它内置了基于交叉对比的饱和度测试，确保研究覆盖足够的维度、数据和来源，最终生成一篇有数据支撑的综合研究报告。

语音转写长文处理 / long-audio-transcript-processor

解决超长语音转写稿（如全天会议、深度访谈）无法一次性塞入上下文的难题。通过文件系统记录处理状态，支持分段校对、清洗与结构化，同时动态维护全局勘误和术语表，以确保前后文一致。支持「断点续传」，随时中断工作而不丢失进度，适合整理大规模录音稿。也能随语音处理满足额外的内容提炼、问答获取、角色识别等需求。

方便从自己身上提取知识。

语音整理入库 / long-audio-to-obsidian

专门用于将语音转写项目的复杂文件结构（原始录音、分段脚本、说明文档）整理并合并。它采用「Agent 规划与脚本执行相结合」的模式，产出适合在 Obsidian 归档的 Markdown。

面试记录处理 / interview-processor

处理面试前后的一系列记录。输入面试记录(转写)、面试官笔记、岗位信息、简历；在面试前规划面试大纲，在面试后提取真实提问、规范化问题、生成结构化的面试纪要与专家级面试官自评。它支持配合 memories-off 技能，将生成的数据作为实体沉淀到本地知识图谱。

IM 知识库整理 / im-local-kb

重型 IM 知识整理和分析技能，专注于从聊天记录中提取高价值的知识。它维护一个基于 Markdown 的本地文件系统，支持数据摄入、断档诊断和知识生成。可以处理上万行的大量群聊信息。

方便从网友身上提取知识。

IM Wiki 提取 / im-wiki-extractor

用于从超长 IM 对话中增量提取结构化知识，并沉淀为可持续更新的 Wiki。通过滑动窗口处理、断点续传和来源追踪，避免一次性处理大体量聊天记录时的信息遗漏与上下文漂移。适合做长期群聊沉淀、项目复盘与事实查证。这个 Agent Skill 需要配合 memories-off 工具使用。

聊天记录项目化处理 / long-chat-task-processor

专门用于处理按 Markdown 标题组织的超长聊天记录。它基于文档目录结构 (TOC) 进行分段分析，能够精准提取任务、决策和里程碑，并自动积累实体映射表（人名/概念），将其转化为结构化的项目管理资产，支持断点续传。

网页/视频本地化剪藏 / online-content-collector

扫描 Obsidian 中带有 #Marker-待下载 的链接，用工具下载素材内容，并按 [YYYY-MM-DD-HH] {分类} {描述} 规范整理，实现自动化素材本地化。

项目交互式学习 / project-learner

让 Agent 充当导师，在讲解项目代码或底层技术时，自动将过程记录到持久化的学习日志中。支持断点续学，让学习过程像项目开发一样有据可查。

单文件沉浸式网页生成 / oneshot-website

一键生成高审美、全交互的单文件 HTML 网页。无需外部图片或构建步骤，仅通过 CSS 渐变、SVG 艺术和 Canvas API 提供高质量的视觉效果。适用于成果展示、AI 能力演示或创建令人惊叹的 CodePen 作品。（来源：github/jpcaparas）

深度调研生态合作规划 / deep-research-partnership-planner

结合深度调研与人工洞察，为生态合作生成商业落地规划与颗粒度的宣发物料。通过严谨的两阶段调研（前期探索与深度研究）、引入人工战略判断，最终生成包含商业合作规划、早期预热方案及执行清单在内的全套 GTM 方案。强调「无调研不规划」，避免凭空编造，是进行业务合作的实用工具。

产研宣发物料生成 / tech-to-marketing-brief

充当产研侧与运营侧的「翻译官」。将冷冰冰的技术特性、算法指标通过痛点关联与风格重塑，转化为高颗粒度的运营 Brief、跨平台社媒宣发案例（小红书/公众号/X）以及配套的研发 Jira Ticket。确保技术卖点能精准转化为用户感知的心智，实现产研与营销的顺畅对接。

笔记库查资料 / obsidian-knowledge-filter

面对庞大 Obsidian 知识库时，通过关键词定位相关笔记，自动提取上下文并综合生成专题报告。支持人工筛选介入，防止误关联。适合周期性复盘、跨笔记主题研究。

待办事项整理 / obsidian-todo-collector

专门用于从 Obsidian 知识库中定期（如每周/每月）提取所有以 🟥 标记的未完成事件和规划性事项。它会自动生成一份结构化的汇总文档，追踪事项来源，并支持在后续处理中自动更新状态。

标准化笔记编写 / cafe3310-obsidian-writer

指导 Agent 编写符合个人知识库风格的文档。要求包含 YAML 元数据、标准化标签、溯源说明以及特定的 Emoji 语意规范，确保知识库的长期整洁与可检索性。

内容语气调整 / content-tone-adjuster

深度调整文本风格。内置用于消除 AI 刻板表达的「去模型味儿」模式和去除浮夸大词与宏大叙事的「平实务实化」模式。适用于将 AI 初稿转化为更自然、更务实的沟通文案或博客。

写周报 / weekly-report-writer

自动化起草周报。通过综合指定日期范围内的每日日志、项目文档和上一份周报，自动识别进展、待办继承（未完成事项自动滚动到下周）和风险卡点，生成兼顾个人存档与团队汇报的分层报告。

二、在线平台 Agent 化

部署到 ModelScope / deploy-folder-to-modelscope

自动化 ModelScope 仓库发布流程：克隆目标仓库 → 复制指定子目录 → 提交带语义化信息的 commit → 推送远程。支持环境变量配置访问令牌。降低从实验到社区共享的发布成本。

Hugging Face 数据查询 / hugging-face-stat

专门用于获取 Hugging Face 上的模型、数据集和 Space 的详细统计信息。最核心的功能是能查询到网页端不直接展示的历史总下载量，并能分析 Space 的运行硬件规格，辅助进行竞品调研或热度评估。

Twitter 数据观察 / twitter-watch

收集一系列指定推文的互动数据。

三、项目管理与开发协作范式

定义可重复执行的开发流程与协作规范，提升模型在代码库中开发的效率和长期一致性。

可以按不同项目选择不同的范式。

设计理念整理 / project-design-concept-organizer

专门用来提炼项目中的隐性知识。把分散的代码变更抽象为设计模式或协议规范，确保项目在复杂化过程中保持设计的一致性。

文档模板提供 / doc-template-provider

提供一系列标准化文档模板，涵盖项目基础规范 (GEMINI.md)、需求文档、缺陷跟踪、待办列表以及 Jira/Dima 需求单等，确保项目文档从起步阶段就具备专业且一致的结构。

Git 安全回退 / git-snapshot-rollback

在执行 git reset --hard 前自动将当前状态快照到存档分支，并在 ARCHIVE.md 中记录双向链接。确保回退操作安全且决策流可追溯。

轻量版项目管理范式 / doc-todo-log-loop

作为轻量级默认开发循环，适用于无复杂流程的中小型项目。要求每项任务始于文档分析 → 生成 TODO 清单 → 开发后附加执行日志 → 提交前验证闭环。强调人的确认，最小化「想到哪做到哪」的不可控性，也防止自己忘掉。

跨会话任务交接 / handoff

编写或更新交接文档，以便拥有全新上下文的下一个 Agent 可以继续此项工作。它会基于当前进展、目标（包括当前 TODO 文件）、近期尝试（已生效/未生效方案）、推荐技能以及后续步骤，在项目根目录下生成或更新 HANDOFF.md。支持根据传入参数定制任务焦点，并生成一段可供用户在全新 Agent 对话中一键粘贴的交接指令，实现快速交接与断点续传。

模型发布演示管理 / release-showcase-manager

针对 AI 模型发布的大规模演示项目管理框架。采用 doc-todo-log-loop 驱动，涵盖从模型能力研究、Scenario 设计、开发实施到录制笔记与性能评价的全生命周期。它是端到端的工程管理体系，不只是简单的素材整理。

技能创造者 / skill-creator

用于自动化地创建、测试和优化 Agent Skill 本身。它涵盖了从意图捕捉、SKILL.md 编写到并行测试、自动评分和描述优化（提升触发准确率）的全生命周期。当你发现自己在重复某种复杂的指令流时，用它将其「固化」为技能。

四、辅助工具

针对特定高频率、低创造性但易出错的机械性任务提供的专用解决方案。

联系人/群组整理 / im-contact-sorter

针对缺少分类功能的 IM 软件。通过「截图-OCR-合并-分析」的流水线，识别未分类的项目并生成报告，辅助进行清理和资产归档。

媒体库整理 / media-organizer

处理多媒体资产时的命名与分类工具。基于文件元数据（拍摄时间）或图像内容分析，自动生成 YYYY-MM-DD_项目_描述.png 格式的文件名，并输出带缩略图的索引 README。适用于设计素材归档、用户反馈截图整理等场景。用于维护运营资产库。

发布视频专业加工 / showcase-video-processor

协助制作高质量模型发布视频。通过 FFmpeg 实现无损裁剪（去除系统 UI）、智能变速（加速推理过程）、定格缩放等专业操作，并支持撰写多粒度（微观/中观/宏观）分镜策划文档，打造专业审美的演示集。

做微信表情包 / wx-emoji-maker

微信表情包批量生成工具。自动添加透明边框、调整至 240×240 像素、生成预览图包。

使用本地 Claude 插件 / use-claude-plugin

检索并使用本地目录中的 Claude 插件完成特定任务。它能定位插件库中的专业技能，读取并遵循其 SKILL.md 指令，并模拟该插件的身份来执行任务。

文本水印 / text-watermark-fountain

基于喷泉码与句子长度操纵的文本隐写工具。娱乐向，并不是什么严谨方案。

代码库术语审计 / code-naming-auditor

代码库术语一致性检查器。基于项目 Glossary 文件扫描变量/函数名，识别如 getUserInfo() 与 fetchUserDetails() 的命名冲突，输出重构建议。适合长期维护项目或微服务架构中保持领域语言统一。

浏览器自动化工具 / agent-browser

为 AI Agent 提供的快速浏览器自动化工具。通过 CDP 协议操作 Chrome/Chromium，支持无障碍树快照和紧凑的元素引用。适用于网页交互、导航及 Electron 应用自动化。（来源：https://github.com/vercel-labs/agent-browser）

产研级前端设计迭代 / impeccable

专业的产研级前端界面设计与迭代工具。支持从需求定义到代码实现的流程，专注于高审美的界面打磨、动画添加及优化。（来源：https://github.com/pbakaus/impeccable）

技能快速安装器 / cafe3310-skill-installer

自动化安装和更新本仓库中所有技能的专用工具。支持安全检测（防止覆盖用户自定义的同名技能）和安装后的状态预览。

暂时不用的技能 (Parked Skills) / skills_parked

这里存放一些目前不活跃、由于架构调整或个人工作流程变化而暂时“停靠”的技能。它们依然具有参考价值，但在当前阶段不作为推荐的默认工具。

完整版项目管理范式 / project-management

确立项目级基础规则：Monorepo 目录结构、文档命名规范（YYYYMMDD-type-topic.md）、Git 分支策略（feature/hotfix/release）、任务追踪机制（TODO 标签与状态流转），给项目仓库一个限定完全的开发范式。

TDD 驱动的工作流 / tdd-dev-cycle

对代码质量有明确要求的场景启用。强制要求测试先行：输入/输出 definition → 编写测试用例 → 实现逻辑 → 验证覆盖率 → 修复边界条件。该流程虽增加初期成本，但显著减少后期 Debug 时间，尤其适用于复杂 SQL 或算法模块。

基于浏览器的测试 / browser-testing

定义了一套不依赖重型框架的 E2E 测试流。测试用例写在 Markdown 里，通过截图和人工比对验证功能，结果存放在应用目录中作为凭证。

PMP 式迭代流程 / pmp-dev-process

引入结构化的迭代流程：修订章程 → 规划确认 → 执行 → 验证。适用于开启新功能、进行重大变更或需要严谨记录的场景。

研究报告编写 / content-research-writer

用于撰写深度文章、技术文档或博客时。助手协助梳理大纲、交叉验证资料、管理引用链路，并在保持作者原始语气的基础上优化段落逻辑。与简单生成文本的工具不同，它强调协作式写作，避免“AI腔”泛滥。

PRD 撰写助手 / prd-writer

指导 Agent 以商业分析师和产品经理的角色，通过 7 步结构化工作流引导对话，将模糊的产品想法转化为详尽、可执行的产品需求文档 (PRD)。包含标准模板与现状分析流程。

看看剪贴板图片 / paste-image

打通 macOS 剪贴板与 LLM 分析管道的桥梁。运行后自动将剪贴板中的图片保存为本地 PNG 文件，并返回路径供后续 Skill 调用。适用于「截图给 Coding Agent 看看效果」的场景。