🌐 网页抓取配置
Browse节点是工作流的第一个处理环节,负责获取网页内容。本章将指导你完成Browse节点的配置。
🔍 节点概述
📋 主要功能
- ✨ 访问指定URL
- ✨ 提取网页内容
- ✨ 处理不同 类型网页
⚙️ 输出字段
- 🔹 code: 状态码
- 🔹 message: 状态信息
- 🔹 plugin_observation: 网页内容
⚙️ 节点配置
- 基本设置
- 参数配置
- 输出说明
1️⃣ 添加节点
- 在工作流编辑器中点击"+"按钮
- 选择"Browse"节点类型
- 将节点连接到Start节点
2️⃣ 设置参数
// url参数配置
{
"url": "{{input}}",
"enforce_crawl": true
}
参数说明
url
: 使用变量引用输入的URLenforce_crawl
: 设为true确保完整抓取
3️⃣ 输出结构
{
"code": 200,
"message": "success",
"plugin_observation": {
"observation": "网页实际内容",
"natural_language_desc": "内容描述信息"
}
}
🔧 调试技巧
🚫 常见问题
URL无法访问
- 检查URL格式是否正确
- 确认网页是否可以正常访问
- 验证网络连接状态
内容获取不完整
- 检查enforce_crawl设置
- 调整等待时间
- 验证内容加载是否完成
✅ 测试方法
- 使用简单的测试URL进行验证
- 检查输出内容的完整性
- 验证各个字段的格式是否正确
- 测试不同类型的网页
🎉 配置完成!
Browse节点配置已完成,接下来让我们继续配置LLM节点。