Skip to content
learnspace
Go back

omp 是什么:一个终端里的 AI 编程助手

这是「omp 编程工具使用探讨」专栏的第 1 篇。专栏记录我用 omp 作为主要编程工具的实战经验:架构理解、Rules 与 TTSR、Skill 工程化、多 agent 协作。

一句话定位

omp(Oh My Pi)是一个跑在终端里的 AI 编程助手,fork 自 badlogic/pi-mono,可以理解成 Cursor / Windsurf 的 CLI 版本。你在终端跟 AI 对话,它能读写文件、执行命令、搜索代码、浏览网页——一个把”对话即编程”做到极致的命令行工具。

它在工具坐标里的位置

把它和熟悉的工具摆在一起对比会更清楚:

维度Cursor / WindsurfClaude CodeompGitHub Copilot CLI
形态IDE终端终端终端(一次性)
会话状态项目感知长会话长会话 + session tree无状态
工具调用内嵌内嵌内嵌 + 自定义工具受限
规则系统.cursor/rulesCLAUDE.md多格式兼容 + TTSR 实时中断
多 agent部分(Composer)子任务swarm 扩展
扩展机制插件MCPMCP + 插件 + skill

omp 的差异化主要在三处:TTSR 实时中断(agent 输出到一半能被规则打回)、Skill 工程化(把工作流固化成可复用知识)、多 agent 协作(一个 session 调度多个子 agent)。这三点正是这个专栏后续要展开的主题。

技术栈速览

monorepo 大致结构:

oh-my-pi/
├── packages/
│ ├── coding-agent/ 主包,CLI 入口 (bin: omp)
│ ├── ai/ 统一 LLM 客户端
│ ├── agent/ Agent 运行时
│ ├── tui/ 终端 UI
│ ├── natives/ Node native 绑定
│ └── swarm-extension/ 多 agent 协作扩展
└── crates/
└── pi-natives/ Rust cdylib

记不住没关系——专栏里会按需展开。你只需要记住一个入口:omp 这个命令。所有会话、工具、规则、扩展都从这个命令进入。

为什么我想专门写一个专栏

我已经把这个博客本身做成了”AI-Agent-native”——站点定位里就这么写的。意思是:博客的主要创作者不是我,而是 omp 这个 agent。人类(我)负责方向、判断和品味;agent 负责执行:写代码、改样式、调 bug、部署、写文章。

这种工作方式跑了几个月后,我攒下不少经验值得整理:

这些零散笔记凑成博客文章都太单薄,但串成连载正好。这也是这个专栏的由来——用博客本身验证”AI agent 当主要创作者”是否可行

这个专栏会写什么

预计的文章(顺序可能调整):

  1. omp 是什么(本文)
  2. Session 与会话树:长任务怎么不丢上下文
  3. Rules 入门:把项目约束写成 agent 能读懂的规则
  4. TTSR 实时中断:让 agent 输出到一半自动回头
  5. Skill 工程化:从一次性 prompt 到可复用知识
  6. 多 agent 协作:swarm 扩展的使用与陷阱
  7. Approval modes:auto-edit / full-auto / ask 的选择策略
  8. 与 Cursor/Windsurf 的真实对比

每篇都会带可复现的真实案例——多半就来自这个博客本身的开发记录。

怎么跟上这个专栏


下一篇我们会拆开 omp 的 session 机制:为什么它的会话可以跑几个小时不丢上下文,以及 session tree 怎么让长任务可回溯。


Share this post:

Next Post
omp 的 Session 与会话树:为什么长任务不丢上下文