cafe3310's Public Agent Skills
个人常用的 Agent Skill(公开部分)。通过合适的上下文工程,可以将 Agent Skill 用在几乎任何地方。
提醒
Agent Skill 可能非常个性化,很多都是用户个人最佳实践的提炼,不一定对其他人有用。
这玩意儿说穿了是提示词和代码的集合。在当下,提示词也是代码。审核你放进本地 agent 的每一个 skill 的所有文档和代码,不要被人搞啦。
任何 LLM 相关的问题基本都是公开知识,学习如何使用 LLM 或让它协同你工作的方法里,最好的就是问 LLM 自己,最智障的是花钱买课。可以先问问 Gemini / GPT「这是我看到的文档,我希望学习关于 x 的知识。交互式地教教我」。
为了让 Agent 能够正确识别每个 Skill 的依赖,这个仓库中的 SKILL.md Frontmatter 声明了以下扩展属性:
depends_on_skill:这个 Agent Skill 运行依赖的其他 Agent Skill。depends_on_binary:这个 Agent Skill 运行依赖的其他程序(如ffmpeg、python3)。
后续计划
工作和生活中自己不想做的麻烦事情基本会做成 Agent Skill 放在这里。
有计划认真给我猫制作 咩咩和啾啾相册 ...
安装
手动安装
在同时使用 antigravity-cli, opencode, pi 等不同 Agent 工具时,详尽的 skills 安装说明与最佳实践如下:
- 原始文件保持在 git 目录
- 在
~/.agents/skills目录物理拷贝同步(支持差异比对与覆盖提示,供opencode,pi等工具使用) - 在
~/.gemini/antigravity-cli/skills目录物理拷贝同步(供antigravity-cli使用)
你可以克隆项目仓库后,直接运行以下脚本来自动完成安装与同步:
chmod +x link_skills.sh
./link_skills.sh
该脚本会自动探测你系统中的 ~/.agents、~/.claude、~/.gemini/antigravity-cli 和 ~/.gemini 等目录,并在这些已存在的目录下执行物理技能目录的同步与拷贝。若目标目录中已存在且文件有修改,会交互式提示您确认覆盖(若均不存在,则默认在 ~/.agents/skills 和 ~/.gemini/antigravity-cli/skills 中创建并拷贝)。
此外,脚本在执行时,若目标目录下不存在 agents.md,它会自动在该目录下创建一个 agents.md 说明文件,指明这里的 skills 是复制自哪个本地物理仓库路径,提示在该工作区下编辑 skills 时应优先编辑源路径并重新运行 link_skills.sh 脚本;若目标目录下已存在该文件,则跳过生成。
自动安装
向你的 Agent 发以下指令:
请先读取并按此文件的指示进行操作: https://raw.githubusercontent.com/cafe3310/public-agent-skills/main/skills/cafe3310-skill-installer/SKILL.md
记得先审核一下脚本做了什么。
一、创作与知识管理
这类 Skill 解决信息结构化、表达优化与知识复用问题。
适用于内容生产、研究分析及长期知识资产管理。
深度研究 / deep-research
一个具备严谨性的多阶段深度研究方案。通过领域方法论机制,在展开具体研究前自动确立行业标准评估框架。随后,它动态编排多个 Subagent 深入网络挖掘关键数据点与对比指标,避免生成表面化的总结。它内置了基于交叉对比的饱和度测试,确保研究覆盖足够的维度、数据和来源,最终生成一篇有数据支撑的综合研究报告。
语音转写长文处理 / long-audio-transcript-processor
解决超长语音转写稿(如全天会议、深度访谈)无法一次性塞入上下文的难题。通过文件系统记录处理状态,支持分段校对、清洗与结构化,同时动态维护全局勘误和术语表,以确保前后文一致。支持「断点续传」,随时中断工作而不丢失进度,适合整理大规模录音稿。也能随语音处理满足额外的内容提炼、问答获取、角色识别等需求。
方便从自己身上提取知识。
语音整理入库 / long-audio-to-obsidian
专门用于将语音转写项目的复杂文件结构(原始录音、分段脚本、说明文档)整理并合并。它采用「Agent 规划与脚本执行相结合」的模式,产出适合在 Obsidian 归档的 Markdown。
面试记录处理 / interview-processor
处理面试前后的一系列记录。输入面试记录(转写)、面试官笔记、岗位信息、简历;在面试前规划面试大纲,在面试后提取真实提问、规范化问题、生成结构化的面试纪要与专家级面试官自评。它支持配合 memories-off 技能,将生成的数据作为实体沉淀到本地知识图谱。
IM 知识库整理 / im-local-kb
重型 IM 知识整理和分析技能,专注于从聊天记录中提取高价值的知识。它维护一个基于 Markdown 的本地文件系统,支持数据摄入、断档诊断和知识生成。可以处理上万行的大量群聊信息。
方便从网友身上提取知识。
IM Wiki 提取 / im-wiki-extractor
用于从超长 IM 对话中增量提取结构化知识,并沉淀为可持续更新的 Wiki。通过滑动窗口处理、断点续传和来源追踪,避免一次性处理大体量聊天记录时的信息遗漏与上下文漂移。适合做长期群聊沉淀、项目复盘与事实查证。这个 Agent Skill 需要配合 memories-off 工具使用。
聊天记录项目化处理 / long-chat-task-processor
专门用于处理按 Markdown 标题组织的超长聊天记录。它基于文档目录结构 (TOC) 进行分段分析,能够精准提取任务、决策和里程碑,并自动积累实体映射表(人名/概念),将其转化为结构化的项目管理资产,支持断点续传。
网页/视频本地化剪藏 / online-content-collector
扫描 Obsidian 中带有 #Marker-待下载 的链接,用工具下载素材内容,并按 [YYYY-MM-DD-HH] {分类} {描述} 规范整理,实现自动化素材本地化。
项目交互式学习 / project-learner
让 Agent 充当导师,在讲解项目代码或底层技术时,自动将过程记录到持久化的学习日志中。支持断点续学,让学习过程像项目开发一样有据可查。
单文件沉浸式网页生成 / oneshot-website
一键生成高审美、全交互的单文件 HTML 网页。无需外部图片或构建步骤,仅通过 CSS 渐变、SVG 艺术和 Canvas API 提供高质量的视觉效果。适用于成果展示、AI 能力演示或创建令人惊叹的 CodePen 作品。 (来源:github/jpcaparas)
深度调研生态合作规划 / deep-research-partnership-planner
结合深度调研与人工洞察,为生态合作生成商业落地规划与颗粒度的宣发物料。通过严谨的两阶段调研(前期探索与深度研究)、引入人工战略判断,最终生成包含商业合作规划、早期预热方案及执行清单在内的全套 GTM 方案。强调「无调研不规划」,避免凭空编造,是进行业务合作的实用工具。
产研宣发物料生成 / tech-to-marketing-brief
充当产研侧与运营侧的「翻译官」。将冷冰冰的技术特性、算法指标通过痛点关联与风格重塑,转化为高颗粒度的运营 Brief、跨平台社媒宣发案例(小红书/公众号/X)以及配套的研发 Jira Ticket。确保技术卖点能精准转化为用户感知的心智,实现产研与营销的顺畅对接。
笔记库查资料 / obsidian-knowledge-filter
面对庞大 Obsidian 知识库时,通过关键词定位相关笔记,自动提取上下文并综合生成专题报告。支持人工筛选介入,防止误关联。适合周期性复盘、跨笔记主题研究。
待办事项整理 / obsidian-todo-collector
专门用于从 Obsidian 知识库中定期(如每周/每月)提取所有以 🟥 标记的未完成事件和规划性事项。它会自动生成一份结构化的汇总文档,追踪事项来源,并支持在后续处理中自动更新状态。
标准化笔记编写 / cafe3310-obsidian-writer
指导 Agent 编写符合个人知识库风格的文档。要求包含 YAML 元数据、标准化标签、溯源说明以及特定的 Emoji 语意规范,确保知识库的长期整洁与可检索性。
内容语气调整 / content-tone-adjuster
深度调整文本风格。内置用于消除 AI 刻板表达的「去模型味儿」模式和去除浮夸大词与宏大叙事的「平实务实化」模式。适用于将 AI 初稿转化为更自然、更务实的沟通文案或博客。
写周报 / weekly-report-writer
自动化起草周报。通过综合指定日期范围内的每日日志、项目文档和上一份周报,自动识别进展、待办继承(未完成事项自动滚动到下周)和风险卡点,生成兼顾个人存档与团队汇报的分层报告。
二、在线平台 Agent 化
部署到 ModelScope / deploy-folder-to-modelscope
自动化 ModelScope 仓库发布流程:克隆目标仓库 → 复制指定子目录 → 提交带语义化信息的 commit → 推送远程。支持环境变量配置访问令牌。降低从实验到社区共享的发布成本。
Hugging Face 数据查询 / hugging-face-stat
专门用于获取 Hugging Face 上的模型、数据集和 Space 的详细统计信息。最核心的功能是能查询到网页端不直接展示的历史总下载量,并能分析 Space 的运行硬件规格,辅助进行竞品调研或热度评估。
Twitter 数据观察 / twitter-watch
收集一系列指定推文的互动数据。
三、项目管理与开发协作范式
定义可重复执行的开发流程与协作规范,提升模型在代码库中开发的效率和长期一致性。
可以按不同项目选择不同的范式。
设计理念整理 / project-design-concept-organizer
专门用来提炼项目中的隐性知识。把分散的代码变更抽象为设计模式或协议规范,确保项目在复杂化过程中保持设计的一致性。
文档模板提供 / doc-template-provider
提供一系列标准化文档模板,涵盖项目基础规范 (GEMINI.md)、需求文档、缺陷跟踪、待办列表以及 Jira/Dima 需求单等,确保项目文档从起步阶段就具备专业且一致的结构。
Git 安全回退 / git-snapshot-rollback
在执行 git reset --hard 前自动将当前状态快照到存档分支,并在 ARCHIVE.md 中记录双向链接。确保回退操作安全且决策流可追溯。
轻量版项目管理范式 / doc-todo-log-loop
作为轻量级默认开发循环,适用于无复杂流程的中小型项目。要求每项任务始于文档分析 → 生成 TODO 清单 → 开发后附加执行日志 → 提交前验证闭环。强调人的确认,最小化「想到哪做到哪」的不可控性,也防止自己忘掉。
跨会话任务交接 / handoff
编写或更新交接文档,以便拥有全新上下文的下一个 Agent 可以继续此项工作。它会基于当前进展、目标(包括当前 TODO 文件)、近期尝试(已生效/未生效方案)、推荐技能以及后续步骤,在项目根目录下生成或更新 HANDOFF.md。支持根据传入参数定制任务焦点,并生成一段可供用户在全新 Agent 对话中一键粘贴的交接指令,实现快速交接与断点续传。
模型发布演示管理 / release-showcase-manager
针对 AI 模型发布的大规模演示项目管理框架。采用 doc-todo-log-loop 驱动,涵盖从模型能力研究、Scenario 设计、开发实施到录制笔记与性能评价的全生命周期。它是端到端的工程管理体系,不只是简单的素材整理。
技能创造者 / skill-creator
用于自动化地创建、测试和优化 Agent Skill 本身。它涵盖了从意图捕捉、SKILL.md 编写到并行测试、自动评分和描述优化(提升触发准确率)的全生命周期。当你发现自己在重复某种复杂的指令流时,用它将其「固化」为技能。
四、辅助工具
针对特定高频率、低创造性但易出错的机械性任务提供的专用解决方案。
联系人/群组整理 / im-contact-sorter
针对缺少分类功能的 IM 软件。通过「截图-OCR-合并-分析」的流水线,识别未分类的项目并生成报告,辅助进行清理和资产归档。
媒体库整理 / media-organizer
处理多媒体资产时的命名与分类工具。基于文件元数据(拍摄时间)或图像内容分析,自动生成 YYYY-MM-DD_项目_描述.png 格式的文件名,并输出带缩略图的索引 README。适用于设计素材归档、用户反馈截图整理等场景。用于维护运营资产库。
发布视频专业加工 / showcase-video-processor
协助制作高质量模型发布视频。通过 FFmpeg 实现无损裁剪(去除系统 UI)、智能变速(加速推理过程)、定格缩放等专业操作,并支持撰写多粒度(微观/中观/宏观)分镜策划文档,打造专业审美的演示集。
做微信表情包 / wx-emoji-maker
微信表情包批量生成工具。自动添加透明边框、调整至 240×240 像素、生成预览图包。
使用本地 Claude 插件 / use-claude-plugin
检索并使用本地目录中的 Claude 插件完成特定任务。它能定位插件库中的专业技能,读取并遵循其 SKILL.md 指令,并模拟该插件的身份来执行任务。
文本水印 / text-watermark-fountain
基于喷泉码与句子长度操纵的文本隐写工具。娱乐向,并不是什么严谨方案。
代码库术语审计 / code-naming-auditor
代码库术语一致性检查器。基于项目 Glossary 文件扫描变量/函数名,识别如 getUserInfo() 与 fetchUserDetails() 的命名冲突,输出重构建议。适合长期维护项目或微服务架构中保持领域语言统一。
浏览器自动化工具 / agent-browser
为 AI Agent 提供的快速浏览器自动化工具。通过 CDP 协议操作 Chrome/Chromium,支持无障碍树快照和紧凑的元素引用。适用于网页交互、导航及 Electron 应用自动化。 (来源:https://github.com/vercel-labs/agent-browser)
产研级前端设计迭代 / impeccable
专业的产研级前端界面设计与迭代工具。支持从需求定义到代码实现的流程,专注于高审美的界面打磨、动画添加及优化。 (来源:https://github.com/pbakaus/impeccable)
技能快速安装器 / cafe3310-skill-installer
自动化安装和更新本仓库中所有技能的专用工具。支持安全检测(防止覆盖用户自定义的同名技能)和安装后的状态预览。
暂时不用的技能 (Parked Skills) / skills_parked
这里存放一些目前不活跃、由于架构调整或个人工作流程变化而暂时“停靠”的技能。它们依然具有参考价值,但在当前阶段不作为推荐的默认工具。
完整版项目管理范式 / project-management
确立项目级基础规则:Monorepo 目录结构、文档命名规范(YYYYMMDD-type-topic.md)、Git 分支策略(feature/hotfix/release)、任务追踪机制(TODO 标签与状态流转),给项目仓库一个限定完全的开发范式。
TDD 驱动的工作流 / tdd-dev-cycle
对代码质量有明确要求的场景启用。强制要求测试先行:输入/输出 definition → 编写测试用例 → 实现逻辑 → 验证覆盖率 → 修复边界条件。该流程虽增加初期成本,但显著减少后期 Debug 时间,尤其适用于复杂 SQL 或算法模块。
基于浏览器的测试 / browser-testing
定义了一套不依赖重型框架的 E2E 测试流。测试用例写在 Markdown 里,通过截图和人工比对验证功能,结果存放在应用目录中作为凭证。
PMP 式迭代流程 / pmp-dev-process
引入结构化的迭代流程:修订章程 → 规划确认 → 执行 → 验证。适用于开启新功能、进行重大变更或需要严谨记录的场景。
研究报告编写 / content-research-writer
用于撰写深度文章、技术文档或博客时。助手协助梳理大纲、交叉验证资料、管理引用链路,并在保持作者原始语气的基础上优化段落逻辑。与简单生成文本的工具不同,它强调协作式写作,避免“AI腔”泛滥。
PRD 撰写助手 / prd-writer
指导 Agent 以商业分析师和产品经理的角色,通过 7 步结构化工作流引导对话,将模糊的产品想法转化为详尽、可执行的产品需求文档 (PRD)。包含标准模板与现状分析流程。
看看剪贴板图片 / paste-image
打通 macOS 剪贴板与 LLM 分析管道的桥梁。运行后自动将剪贴板中的图片保存为本地 PNG 文件,并返回路径供后续 Skill 调用。适用于「截图给 Coding Agent 看看效果」的场景。