Skip to main content

🌐 网页抓取配置

Browse节点是工作流的第一个处理环节,负责获取网页内容。本章将指导你完成Browse节点的配置。

🔍 节点概述

📋 主要功能

  • ✨ 访问指定URL
  • ✨ 提取网页内容
  • ✨ 处理不同类型网页

⚙️ 输出字段

  • 🔹 code: 状态码
  • 🔹 message: 状态信息
  • 🔹 plugin_observation: 网页内容

⚙️ 节点配置

1️⃣ 添加节点

  1. 在工作流编辑器中点击"+"按钮
  2. 选择"Browse"节点类型
  3. 将节点连接到Start节点

🔧 调试技巧

🚫 常见问题

URL无法访问
  • 检查URL格式是否正确
  • 确认网页是否可以正常访问
  • 验证网络连接状态
内容获取不完整
  • 检查enforce_crawl设置
  • 调整等待时间
  • 验证内容加载是否完成

✅ 测试方法

  1. 使用简单的测试URL进行验证
  2. 检查输出内容的完整性
  3. 验证各个字段的格式是否正确
  4. 测试不同类型的网页