开源精选 DifyAgent可视化RAG工作流低代码
云
云铭
进化之路 · 扫码阅读
微信 · 浏览器扫码
在手机上获得更好的阅读体验
Dify深度解析:生产级可视化AI Agent平台的崛起
如果LangChain是AI Agent的”Linux内核”,那Dify就是”macOS”——把复杂的技术能力封装在优雅的可视化界面下,让非开发者也能构建生产级AI应用。
项目速览
| 维度 | 详情 |
|---|---|
| GitHub | langgenius/dify |
| Stars | ~144K |
| 语言 | TypeScript + Python |
| 许可证 | Apache 2.0 |
| 定位 | 生产就绪的可视化AI应用开发平台 |
核心定位:AI应用的操作系统
一站式能力全景
┌────────────────────────────────────────────┐
│ Dify 平台 │
│ │
│ ┌──────────┐ ┌──────────┐ ┌─────────────┐ │
│ │ 可视化编排│ │ RAG管道 │ │ Agent 构建 │ │
│ │ (拖拽式) │ │ (检索增强)│ │ (工具+推理) │ │
│ └──────────┘ └──────────┘ └─────────────┘ │
│ ┌──────────┐ ┌──────────┐ ┌─────────────┐ │
│ │ 对话应用 │ │ 文本生成 │ │ API 服务 │ │
│ │ (Chatbot) │ │ (Gen) │ │ (RESTful) │ │
│ └──────────┘ └──────────┘ └─────────────┘ │
│ ┌──────────┐ ┌──────────┐ ┌─────────────┐ │
│ │ 模型管理 │ │ 监控分析 │ │ 知识库管理 │ │
│ │ (多模型) │ │ (Dashboard)│ │ (文档解析) │ │
│ └──────────┘ └──────────┘ └─────────────┘ │
└────────────────────────────────────────────┘
Dify vs LangChain
| 维度 | Dify | LangChain |
|---|---|---|
| 使用方式 | 可视化拖拽 + 少量代码 | 纯代码 |
| 目标用户 | 开发者+业务人员 | 开发者 |
| 部署难度 | 一键Docker Compose | 需自己搭建架构 |
| 生产就绪度 | 内置监控/日志/权限 | 需自己实现 |
| 灵活性 | 有限,但够用 | 极高 |
| 学习曲线 | 1-2天 | 1-3周 |
核心功能详解
1. 可视化工作流编排(Chatflow / Workflow)
Dify最强大的功能——用拖拽方式设计AI应用的完整逻辑:
[开始节点] → [LLM推理] → [条件分支]
↓ ↓
[知识库检索] [工具调用]
↓ ↓
[代码处理] [HTTP请求]
↓ ↓
└──→ [LLM总结] ←──┘
↓
[输出节点]
内置节点类型:
- LLM节点:调用GPT-4、Claude、DeepSeek等模型
- 知识检索节点:从私有知识库检索相关内容
- 代码节点:执行Python/JavaScript代码做数据处理
- HTTP请求节点:调用外部API
- 工具节点:使用预置工具(搜索、计算器等)
- 条件分支节点:根据条件路由到不同路径
- 模板节点:结构化处理文本
2. RAG管道
Dify提供了业界最易用的RAG(检索增强生成)可视化配置:
文档导入 → 文档解析 → 文本分块 → 向量化 → 存储
↓ ↓ ↓ ↓ ↓
PDF 自动段落 自定义大小 Embedding 多种
Word 表格提取 重叠窗口 模型选择 向量DB
CSV 图片OCR 分块策略 多语言 (Qdrant/
Web Weaviate/...)
关键特性:
- 支持20+文档格式(PDF、Word、Excel、Markdown、网页等)
- 多种分块策略(固定大小、语义分块、递归分块)
- 混合检索(关键词 + 向量 + 重排序)
- 可视化调优检索参数
3. Agent模式
Dify的Agent支持两种模式:
ReAct模式(推理+行动):
Thought → Action → Observation → Thought → ... → Final Answer
Function Calling模式(函数调用):
用户输入 → LLM判断需要什么工具 → 调用工具 → 整合结果 → 回复
配置方式:
1. 选择Agent策略(ReAct / Function Calling)
2. 添加工具(搜索、计算、API调用等)
3. 设置推理参数(最大迭代次数、温度等)
4. 发布
部署架构
生产级部署
# docker-compose.yml 核心服务
services:
# API服务(Python/Flask)
api:
image: langgenius/dify-api
environment:
- MODE=api
depends_on: [redis, db, weaviate]
# Worker服务(异步任务)
worker:
image: langgenius/dify-api
environment:
- MODE=worker
# Web前端(TypeScript/Next.js)
web:
image: langgenius/dify-web
# 中间件
db: # PostgreSQL - 业务数据
redis: # 缓存和消息队列
weaviate: # 向量数据库
nginx: # 反向代理
sandbox: # 代码执行沙箱
资源规划
| 规模 | 配置建议 | 成本(云服务器/月) |
|---|---|---|
| 小团队(10人) | 2C4G x1 | ~$50 |
| 中型(50人) | 4C8G x2 | ~$200 |
| 企业(200+人) | 8C16G x3 + 专用向量DB | ~$800 |
实战:搭建智能客服Agent
15分钟从零到上线
Step 1: 安装
git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d
# 访问 http://localhost:3000
Step 2: 创建知识库
1. 点击"知识库" → "创建知识库"
2. 上传产品文档(PDF/Word/Markdown)
3. Dify自动解析、分块、向量化
4. 测试检索:输入问题验证召回的片段是否相关
5. 调整参数(分块大小、检索top_k、相似度阈值)
Step 3: 设计Chatflow
[开始] → [知识检索] → [条件判断]
├── 检索到相关文档 → [LLM生成回答]
└── 无相关文档 → [LLM引导用户细化问题]
↓
┌──────────────────┘
↓
[条件:用户满意度]
├── 解决 → [结束]
└── 未解决 → [转人工]
Step 4: 发布
1. 点击"发布" → 获得API端点
2. 嵌入网页:复制iframe代码
3. 或直接使用生成的独立页面URL
多模型支持
Dify支持几乎所有主流模型提供商:
# Dify 支持的模型(2026.06)
## 闭源模型
- OpenAI: GPT-4, GPT-4o, GPT-4-mini
- Anthropic: Claude Opus, Sonnet, Haiku
- Google: Gemini 2.0 系列
- 百度: 文心一言系列
## 开源模型(通过Ollama/LocalAI/vLLM)
- DeepSeek: V3, R1
- Qwen: 2.5 系列
- Llama: 3.3, 4
- Mistral: Medium, Large
## 兼容 OpenAI API 的自定义模型
- 任何提供 /v1/chat/completions 端点的服务
企业级特性
权限体系:
├── 工作空间隔离(不同团队独立空间)
├── 角色管理(管理员/编辑者/查看者)
├── API Key 管理和限流
└── SSO/SAML 集成(企业版)
监控和日志:
├── 对话记录和标注
├── Token消耗追踪
├── 响应延迟监控
├── 用户活跃度分析
└── 模型调用成本Dashboard
数据治理:
├── 数据加密(传输+存储)
├── 审计日志
├── 内容过滤和安全审查
└── GDPR合规支持
应用场景
已落地的典型案例
- 智能客服 — 某电商用Dify + 知识库替代70%人工客服
- 法律文书助手 — 律所基于Dify构建合同审查Agent
- 内部知识库问答 — 企业将制度文档导入Dify,员工自然语言查询
- 教育辅导 — 培训机构用Dify构建学科辅导Bot
- API编排中台 — 将内部多个API通过Dify Agent对外统一暴露
Dify的成功证明了:降低门槛比增加功能更重要。它把LangChain时代”只有工程师能玩”的Agent技术,变成了”一个下午就能上线AI应用”的生产力工具。对于想快速落地AI能力的团队,Dify可能是最好的起点。