Skip to content

markdown-proxy 项目评测报告

🏆 核心结论(先看这里!)

推荐指数:⭐⭐⭐⭐ (4/5)

一句话总结 Claude Code 专用 URL 转 Markdown 工具,支持微信公众号/飞书文档/通用网页,代理级联保证成功率。

核心价值

多平台支持 - 微信公众号(Playwright)+ 飞书文档(API)+ 通用网页(代理级联) ✅ 代理容错 - r.jina.ai → defuddle.md → agent-fetch 三级降级 ✅ 无 API 依赖 - 默认代理完全免费,无需配置 API key ✅ 中文友好 - 作者中文文档完善,支持飞书生态


📸 产品展示

工作原理

用户发送 URL → markdown-proxy 识别类型

    ┌───────────────┼───────────────┐
    ↓               ↓               ↓
微信公众号        飞书文档         通用网页
Playwright       API调用         代理级联
    ↓               ↓               ↓
    └───────────────┼───────────────┘

              Markdown 输出

代理优先级

1. r.jina.ai     → 内容最完整,保留图片
2. defuddle.md   → 输出更干净,带 YAML frontmatter  
3. agent-fetch   → 本地工具,无网络依赖
4. defuddle CLI  → 本地 CLI,适合普通网页

📌 基本信息

项目信息
GitHubhttps://github.com/joeseesun/markdown-proxy
Stars新项目
LicenseMIT
主要语言Markdown, Shell
创建者joeseesun
类型Claude Code Skill
分类ai-tools

🎯 核心特性

功能矩阵

模块支持平台技术原理
微信公众号mp.weixin.qq.comPlaywright 无头浏览器
飞书文档feishu.cn/docx, feishu.cn/wiki飞书开放 API
通用网页任意 URL代理级联(r.jina.ai → defuddle.md → agent-fetch)

核心能力

1. 公众号抓取方案

使用 Playwright 无头浏览器:

  • 绕过公众号的反爬机制
  • 支持完整内容提取
  • 需要预先安装 chromium

2. 飞书文档支持

通过飞书开放 API 抓取:

  • 新版文档(docx)、旧版文档(doc)、知识库(wiki)
  • 自动解析 blocks 转 Markdown
  • 需要配置飞书开发者账号

3. 代理级联设计

三级降级保证成功率:

  • 第一级失败自动切换下一级
  • 本地 agent-fetch 作为最终兜底
  • 用户无需手动干预

🏗️ 技术架构

技术栈

层级技术选型
Skill 框架Claude Code Skills
公众号抓取Python + Playwright
飞书 API飞书开放平台
代理服务r.jina.ai, defuddle.md, agent-fetch

目录结构

markdown-proxy/
├── SKILL.md              # Skill 主文件
├── README.md             # 说明文档
├── scripts/              # 脚本工具
│   ├── wechat.py         # 公众号抓取
│   └── feishu.py         # 飞书文档
└── templates/            # 输出模板

核心模块

  • URL 识别器:自动判断 URL 类型
  • 代理选择器:根据 URL 类型选择抓取方式
  • Markdown 转换器:统一输出格式
  • 降级处理器:失败时自动切换备选方案

💡 安装与使用

环境要求

  • Claude Code
  • Node.js 18+(可选,用于 agent-fetch)
  • Python 3.8+(可选,用于公众号抓取)
  • Playwright + Chromium(可选,用于公众号抓取)

快速安装

bash
# 1. 安装 Skill
npx skills add joeseesun/markdown-proxy

# 2. (可选)安装公众号支持
pip install playwright beautifulsoup4 lxml
playwright install chromium

# 3. (可选)配置飞书
export FEISHU_APP_ID=your_app_id
export FEISHU_APP_SECRET=your_app_secret

基础使用

bash
# 通用网页
用户:帮我读一下这篇文章:https://example.com/post
Claude:[代理级联,自动选择最佳方式]

# 微信公众号
用户:读一下这篇公众号 https://mp.weixin.qq.com/s/abc123
Claude:[Playwright 抓取,返回 Markdown]

# 飞书文档
用户:把这个飞书文档转成 Markdown:https://xxx.feishu.cn/docx/xxx
Claude:[通过 API 获取,自动转换]

学习曲线:5分钟(基础使用),30分钟(完整配置)


🎯 竞争优势对比

特性markdown-proxyr.jina.aidefuddle.mdagent-fetch
微信公众号✅ Playwright
飞书文档✅ API
通用网页✅ 代理级联
免费使用
容错降级✅ 三级
Claude Code 集成✅ 原生
需要配置⚠️ 公众号需 Python

核心差异化

vs. r.jina.ai

  • ✅ 支持微信公众号
  • ✅ 支持飞书文档
  • ✅ 三级降级保证成功率
  • ❌ 需要额外安装

vs. defuddle.md

  • ✅ 中文生态友好
  • ✅ 代理级联设计
  • ❌ 公众号需要 Python 环境

🎯 适用场景

✅ 强烈推荐

  • Claude Code 用户 - 专为 Claude Code 设计
  • 公众号内容创作者 - 方便收集素材
  • 飞书用户 - 完美支持飞书生态
  • 研究人员 - 方便收集网页内容

⚠️ 可选使用

  • 非 Claude Code 环境 - 可单独使用脚本
  • 仅通用网页 - r.jina.ai 可能足够

❌ 不适合

  • 无 Python 环境 - 公众号抓取无法使用
  • 大规模商业使用 - 代理有频率限制
  • 需要实时监控 - 仅支持一次性抓取

✅ 优势

  1. 免费使用 - 默认代理无需 API key
  2. 中文生态 - 完美支持微信公众号和飞书
  3. 容错设计 - 三级降级保证成功率
  4. 安装简单 - 一行命令安装
  5. 文档完善 - 中英双语 README
  6. 模块化设计 - 易于扩展新平台

❌ 不足

  1. 依赖较多 - 公众号抓取需要 Python + Playwright + Chromium
  2. 飞书配置 - 需要飞书开发者账号和应用配置
  3. 新项目 - Stars 较少,社区验证不足
  4. 平台限制 - 部分网站有严格反爬可能失败
  5. 代理限制 - 第三方代理可能有频率限制
  6. 网络依赖 - 需要网络连接才能使用

🌐 社区活跃度

指标数据
Stars新项目
作者joeseesun
维护状态活跃
文档中英双语

生态支持

  • Claude Code - Anthropic 官方 CLI
  • Skills 系统 - Claude Code 插件生态

📊 综合评分

维度评分说明
技术创新性8/10代理级联设计巧妙
易用性8/10安装简单,但公众号需要额外配置
性能表现7/10依赖第三方代理
功能完整性8/10覆盖公众号/飞书/通用网页
代码质量7/10新项目,待验证
文档完善度9/10中英双语,清晰完善
社区活跃度5/10新项目,社区验证不足
可扩展性8/10模块化设计,易于添加新平台
商业价值7/10解决特定需求,小众市场

总体评分:7.8/10.0 ⭐⭐⭐⭐


📌 推荐建议

核心价值

markdown-proxy 是 Claude Code 用户的内容抓取利器,中文生态友好是其最大亮点。如果你经常需要处理微信公众号或飞书文档,这是必备工具。

最终建议

对于 Claude Code 用户

  • 经常阅读公众号 → 强烈推荐安装
  • 使用飞书文档 → 强烈推荐安装
  • 仅通用网页 → 可用 r.jina.ai 替代

对于 非 Claude Code 用户

  • 可以单独使用脚本部分
  • 但集成体验不如 Claude Code

一句话总结:Claude Code 用户的内容抓取利器,中文生态友好,值得安装备用。


评测时间: 2026-03-22评测版本: v1.0项目链接: https://github.com/joeseesun/markdown-proxy

基于 VitePress 构建, 部署于 Cloudflare Pages