这不是技术迭代,这是信息载体的人类学转向。在 AI Agent 全面介入工作流之前,我们需要重新思考一个根本问题:什么样的文档格式,能同时被人类和机器高效地阅读、理解和编辑?答案是 Markdown、CSV、HTML。
Part One
为什么是这三兄弟
1.1 Markdown:文本的原子化结构
Markdown 的本质是一个轻量级标记语言。它用极简的符号(#、*、-、>)构建层级结构,用纯文本实现了格式化。这让它具备了几个关键特性:
| 特性 | 对人类 | 对 Agent |
|---|---|---|
| 纯文本存储 | 任何编辑器可打开,无需购买授权 | 直接解析 AST,无需 OLE 解析或 COM 调用 |
| 版本友好 | diff 可视化,Git 历史清晰 | 语义 diff,而非字节级 diff |
| 生态丰富 | Obsidian、Typora、VS Code 百花齐放 | LangChain、LlamaIndex 原生支持 |
| 链接能力 | WikiLink 双向互联 | 关系图谱的天然输入 |
Word 的问题在于它是一个二进制容器。.docx 本质上是一个 ZIP 包,里面塞满了 XML 和资源文件。当你尝试让 Agent 解析一份 Word 文档时,你实际上在要求它理解 Microsoft 的私有规范。而 Markdown?它就是文本,任何大语言模型从第一天就能理解它。
1.2 CSV:数据的本真表达
CSV(Comma-Separated Values)看似原始,但它遵循一个核心哲学:数据的结构应该由数据本身决定,而不是由软件决定。
Excel 是一个应用软件,它有自己的数据类型系统(日期、数字、货币、百分比)、格式化规则、公式引擎、图表引擎。当 Agent 要操作 Excel 时,它需要理解这一整套上下文。
CSV 不同。它只有两个概念:行和列,用分隔符(通常是逗号)连接。每一行是一条记录,每一列是一个字段。这是一种图灵完备的数据表达方式——任何关系型数据库、任何数据分析工具、任何 AI 模型都能无歧义地处理它。
1 name,age,city,score
2 Alice,28,Beijing,92
3 Bob,35,Shanghai,88
4 Charlie,31,Shenzhen,95
这四行文本,任何 Agent 都能在 0.1 秒内理解其结构。
1.3 HTML:结构化展示的标准答案
PPT 的核心功能是展示——把信息以视觉化、结构化的方式呈现给观众。而 HTML 是 Web 的展示标准,它解决的问题和 PPT 一样,但开放得多:
- 语义化结构:
header、section、article、figure这些标签天然就是演示文稿的「标题页」「章节」「内容」「图表」 - 响应式布局:一份 HTML 可以适配手机、平板、投屏,PPT 需要为不同屏幕准备不同设置
- 样式分离:CSS 让内容和样式解耦,Markdown 的理念在这里同样适用
- 超链接能力:PPT 里的「点击跳转」功能,HTML 用
a href原生支持
更重要的是,HTML 是 Agent 唯一能「看到」的展示格式。当 Agent 需要分析一份演示文稿时,它可以渲染 HTML 并理解其视觉结构。但当它面对 PPT 时,它只能读取幻灯片序列——无法理解布局意图。
Part Two
双重可读性:人类和 Agent 的公共语言
2.1 格式即协议
在人类协作场景中,格式是「契约」——我用 Word 发给你,你用 Word 打开,我们心照不宣地约定了一套排版规则。在单人工作流中,这没有问题。
但当 Agent 加入协作时,问题出现了:格式必须是 人类可读 + 机器可解析 的公共语言。
Word 不是公共语言,它是 Microsoft 的私有协议。Agent 可以读取它,但需要额外的解析层,会损失精度,会遇到兼容性问题。
Markdown、CSV、HTML 是公共语言。它们是 RFC 规范的一部分,它们的语法是公开的,它们的解析器存在于每一种编程语言的标准库里。它们是格式即协议理念的最佳实践。
2.2 Agent 工作流的天然友好
考虑一个典型的 Agent 数据处理流程,Markdown/CSV/HTML 的优势贯穿始终:
- 无需格式转换,直接解析
- 语义清晰,结构可预测
- 正则或 AST 提取都高效
- 生成成本极低,无版权问题
- 存储友好,Git/VCS 天然支持
- 调用 COM 接口或第三方库读取
- 处理 OLE 对象、嵌入式字体、样式映射
- 提取时可能丢失格式
- 需要 Office 授权或 LibreOffice 兼容层
- 二进制格式,版本控制噩梦
Part Three
场景论述:从写代码到做生意
开发者场景
程序员的文档工作流早已是 Markdown 的天下
- README:GitHub 官方推荐格式
- API 文档:Swagger/OpenAPI
- 代码评审:diff 就是 Markdown 注释
- 技术博客:Hexo、Hugo、VitePress
数据分析场景
数据分析师的核心产出是报告和数据
- 数据导出:任何数据库都能 COPY TO CSV
- 数据交换:pandas、R、d3 原生支持
- 版本控制:数据变更,Git diff 一目了然
- AI 入口:任何 LLM 都能直接分析 CSV
内容创作场景
内容创作者需要排版、配图、发布
- 写作:Obsidian、Typora、iA Writer
- 发布:Hugo、Next.js、Notion
- 协作:Git 拉取请求进行多人协作
- HTML:现代 CMS 本质是 HTML 生成器
企业办公场景
变革最慢、但也最需要变革的领域
- Agent 读取邮件附件 → 提取信息 → 生成任务
- Agent 读取数据表格 → 分析趋势 → 生成报告
- Agent 读取会议纪要 → 提取待办 → 创建卡片
- 每一步的效率提升都依赖于格式的开放性
一家 100 人的公司,每年在 Office 授权上的支出可能超过 10 万元人民币。这还没算上格式不兼容导致的沟通成本、版本混乱导致的返工成本。
Part Four
生态革命:当前平台的困境与机遇
微信
不支持 Markdown/CSV/HTML 预览,用户被迫使用 Word 和 Excel
锁定效应邮件
大多数邮件客户端无法识别 .md 附件,仅显示纯文本
格式惯性文档格式的「终态」,将从默认格式变成发布格式
已有解法但这个局面正在改变——飞书、钉钉、Notion 已经原生支持 Markdown 预览。GitHub 的 .md 文件预览体验远超 Word。VS Code 的 Markdown Preview 成为事实标准。平台对格式的支持,本质上是对开放的投票。
| 挑战 | 描述 | 解法 |
|---|---|---|
| 格式丢失 | Word 的复杂样式(页眉页脚、域代码、水印)无法完全转换 | 选择性保留,核心内容优先 |
| 批注冲突 | Word 的修订模式和 Markdown 的评论体系不同 | 使用 Git PR 或专门的评论工具 |
| 协作惯性 | 同事坚持用 Word,你被迫妥协 | 从非核心文档开始,逐步推广 |
| 平台锁定 | 客户要求 .docx 格式交付 | 保持双格式输出能力 |
Part Five
AI Native 的新工具链
新一波工具正在围绕 Markdown/CSV/HTML 构建,形成飞轮效应:更多工具支持 → 更多用户使用 → 更多内容产生 → 更多工具支持。
AI Agent 有强烈的格式偏好。当 OpenAI、Anthropic、Google 的 Agent 系统需要处理文档时,它们的默认输入输出格式是:结构化数据用 JSON/CSV,文本内容用 Markdown/纯文本,展示内容用 HTML。这不是巧合,这是 AI 原生设计理念的体现。
Action Guide
普通人行动指南
读到这里,你可能会想:「道理我都懂,但我明天上班还是要用 Word。」没错,没有人要求你一夜之间扔掉 Office。但你可以从一个很小的改变开始——选择一个 Markdown 笔记软件,用它来管理你的第二大脑。
选一个 Markdown 笔记软件,从今天开始写
不要纠结哪个最好,选一个开始用就好。推荐 Obsidian:
- 本地存储:你的笔记就是文件夹里的
.md文件,不存在任何厂商锁定 - 双向链接:用
[[笔记名]]就能把知识串联起来,构建真正的知识图谱 - 插件生态:1500+ 社区插件,尤其 Claudian 插件,给你的知识库加上最强大脑
- AI 原生友好:Obsidian CLI、Obsidian Skills 已完善,Agent 无缝使用
让 Agent 帮你完成格式转换
你用 Markdown 写好内容之后,剩下的工作交给 AI Agent:
- Markdown → CSV:瞬间转换产品对比表,导入数据分析工具
- Markdown → HTML:渲染成带样式的页面,发到公众号或做成在线幻灯片
- Markdown → PDF / Word:Pandoc 一行命令完成转换
- Word → Markdown:markitdown 把 PDF、Word 还原为 Markdown
建立你的 AI-Ready 工作流
核心逻辑:Markdown 作为你的「源文件」格式,其他格式只是「导出」选项。
AI-Ready 工作流
| 类别 | 推荐工具 | 一句话描述 |
|---|---|---|
| 笔记软件 | Obsidian | 本地优先的 Markdown 知识库,插件生态强大 |
| 轻量编辑 | Typora | 所见即所得,适合长文写作 |
| 格式转换 | Pandoc | 万能格式转换器,Markdown ↔ Word/PDF/HTML |
| Word 转 Markdown | markitdown | 微软出品,Word/PDF 还原为 Markdown |
| HTML 幻灯片 | Slidev | 用 Markdown 写演示文稿,开发者友好 |
| 数据交换 | CSV 格式 | 无需额外工具,任何表格数据用 CSV 存储和交换 |
| AI Agent | Claude / ChatGPT / Copilot | 直接读写 Markdown,帮你完成格式转换和内容生成 |