网页搜索内容提取服务器

一个基于DuckDuckGo的网页搜索和内容提取服务器,支持多URL并行处理和内存优化。

作者 By pinkpixel-dev
本地部署 网页搜索 内容提取
GitHub

Web Scout MCP Server

npm version License Node.js Version Smithery Badge Verified on MseeP

An MCP server for web search using DuckDuckGo and content extraction, with support for multiple URLs and memory optimizations.

✨ 特点

  • 🔍 看起来像放大镜的符号,通常用于表示搜索、查看细节或调查的意思。 DuckDuckGo 搜索快速且注重隐私的网页搜索功能
  • 📄(文件或纸张的象征,具体翻译需结合上下文,如“文件”、“纸张”等) 内容提取从网页中提取干净、易读的文本
  • 🚀 表情符号“🚀”在中文中通常被翻译为“火箭”或直接用该表情符号表示,它常用来表示快速前进、发展迅速或充满活力和动力的事物。在没有具体上下文的情况下,可以简单地将其理解为“火箭”或保持原样使用该表情符号。 并行处理支持同时从多个URL提取内容
  • 💾 代表软盘的符号,可翻译为“软盘”或在某些语境下简化为“磁盘”。 内存优化智能内存管理,防止应用程序崩溃
  • ⏱️(时钟图标,通常表示时间或倒计时) 速率限制智能请求限速以避免API阻塞
  • 🛡️ 译为中文是“盾牌”。这个符号通常用来表示保护、防御或安全的概念。 错误处理强大的错误处理机制,确保可靠运行

📦 安装

通过Smithery进行安装

通过(某种方式)自动为Claude Desktop安装Web Scout “Smithery”可以翻译为“铁匠铺”或“锻造工坊”。这个词汇来源于对“smith”(铁匠)的扩展,指的是进行金属加工、锻造等工作的场所

BASH``` 1npx -y @smithery/cli install @pinkpixel-dev/web-scout-mcp —client claude


### 全球部署/安装


BASH```
1npm install -g @pinkpixel/web-scout-mcp

本地安装

BASH``` 1npm install @pinkpixel/web-scout-mcp


## 🚀 使用方法


### 命令行


全局安装后,运行:


BASH```
1web-scout-mcp

使用MCP客户端

将此添加到您的MCP客户端中 config.json (Claude Desktop、Cursor 等):

JSON``` 1 2 3 4 5 6 7 8 9 10 11{ “mcpServers”: { “web-scout”: { “command”: “npx”, “args”: [ “-y”, “@pinkpixel/web-scout-mcp@latest” ] } } }


### 环境变量


设定 `WEB_SCOUT_DISABLE_AUTOSTART=1` 在嵌入包并调用时设置环境变量 `createServer()` 你自己。默认情况下,运行已发布的入口点(例如 `node dist/index.js` 或者 `npx @pinkpixel/web-scout-mcp`) 自动启动stdio传输。


## 🧰 工具


服务器提供以下MCP工具:


### 🔍 DuckDuckGo网页搜索


使用DuckDuckGo搜索引擎发起网页搜索查询,并返回结构清晰的搜索结果列表。


**输入:**


- `query` (字符串):搜索查询字符串
- `maxResults` (数字,可选):要返回的最大结果数量(默认:10)


**示例:**


JSON```
1
2
3
4{
  "query": "latest advancements in AI",
  "maxResults": 5
}

输出: 一个包含标题、网址和摘要的格式化搜索结果列表。

📄 UrlContentExtractor(URL内容提取器)

从网页中抓取并提取干净、可读的内容,同时移除脚本、样式和导航等不必要的元素。

输入:

  • url一个单一的URL字符串或URL字符串的数组

示例(单个URL):

JSON``` 1 2 3{ “url”: “https://example.com/article” }


**示例(多个URL):**


JSON```
1
2
3
4
5
6{
  "url": [
    "https://example.com/article1",
    "https://example.com/article2"
  ]
}

输出: 从指定的URL提取文本内容。

🛠️ 开发

BASH``` 1 2 3 4 5 6 7 8 9# Clone the repository git clone https://github.com/pinkpixel-dev/web-scout-mcp.git cd web-scout-mcp

Install dependencies

npm install

Build

npm run build

Run

npm start


## 📚 文档


如需获取有关该项目的更多详细信息,请查阅以下资源:


- `OVERVIEW.md` 翻译成中文是:`概述.md` - 技术概述与架构
- CONTRIBUTING.md 翻译为中文是:“贡献指南/贡献说明文件”。这个文件通常用于说明如何为某个项目或组织做出贡献,包括贡献的流程、规范、要求等 - 对贡献者的指南
- CHANGELOG.md 翻译成中文是“变更日志文件(Markdown 格式)” - 版本历史和更改


## 📋 要求


- Node.js 版本 >= 18.0.0
- npm 或 yarn


## 📄 许可证


这个项目遵循以下许可协议 Apache 2.0 许可证。


Made with ❤️ by [Pink Pixel](https://pinkpixel.dev)
  

  ✨ Dream it, Pixel it ✨