生物医学数据查询工具

BioMCP是一个统一的生物医学数据查询工具,通过单一语法访问多个数据源,适用于研究人员、临床医生和代理进行文献搜索、数据分析和交叉实体查询。

作者 By genomoncology
混合部署 可托管 生物医学数据
GitHub

生物 MCP

一个二进制。一个语法。来自你已经信任的生物医学来源的证据。

描述

BioMCP穿越了通常的生物医学数据迷宫:一个查询到达 通常位于不同API、标识符和搜索后面的源 习惯。研究人员、临床医生和代理人使用相同的命令语法 搜索、聚焦和透视,而无需为每个源重新构建工作流。你 在实时公共数据和本地研究分析中获得紧凑、以证据为导向的结果。

特性

  • 搜索文献: search article PubTator3和 欧洲PMC,消除重复的PMID/PMCID/DOI标识符,并可以添加语义 学者腿,当你的过滤器支持它。
  • 无需返工即可旋转: 从基因、变体、药物、疾病、途径转移, 蛋白质或文章直接进入下一个内置视图,而不是 手工重建过滤器。
  • 分析本地研究: study 命令包括本地查询、队列、生存、, 与本机终端、SVG和PNG进行比较和共现工作流 下载的cBioPortal风格数据集的图表。
  • 遵循文件记录: article citations, article references, article recommendations,以及 article entities 将一篇已知论文转化为 更广泛的证据图。
  • 浓缩和分批: 使用 biomcp enrich 对于顶级g:分析器 丰富和 biomcp batch 最多10个焦点 get 呼叫一 命令。

安装

PyPI工具安装

BASH``` 1 2uv tool install biomcp-cli

or: pip install biomcp-cli


这将安装 `biomcp` PATH上的二进制文件。


### 二进制安装


BASH```
1curl -fsSL https://biomcp.org/install.sh | bash

克劳德桌面扩展(.mcpb)

当路径为时,从Claude Desktop中的Anthropic目录安装BioMCP 适用于您的环境。对于本地/手动设置,请使用JSON MCP 配置如下。

安装技能

将引导式调查工作流安装到您的代理目录中:

BASH``` 1biomcp skill install ~/.claude —force


### MCP客户端


JSON```
1
2
3
4
5
6
7
8{
  "mcpServers": {
    "biomcp": {
      "command": "biomcp",
      "args": ["serve"]
    }
  }
}

远程HTTP服务器

对于共享或远程部署:

BASH``` 1biomcp serve-http —host 127.0.0.1 —port 8080


远程客户端连接到 `http://127.0.0.1:8080/mcp`探测路线如下
`GET /health`, `GET /readyz`,以及 `GET /`.


可运行演示:


BASH```
1uv run --script examples/streamable-http/streamable_http_client.py

远程HTTP服务器 为了 新手指南。

来源

BASH``` 1 2make install “$HOME/.local/bin/biomcp” —version


## 快速启动


30秒内的第一个有用查询:


BASH```
1
2
3
4
5uv tool install biomcp-cli
biomcp health --apis-only
biomcp list gene
biomcp search all --gene BRAF --disease melanoma  # unified cross-entity discovery
biomcp get gene BRAF pathways hpa

命令语法

TEXT``` 1 2 3 4 5 6 7search [filters] → discovery discover → concept resolution before entity selection get [sections] → focused detail → cross-entity pivots enrich <GENE1,GENE2,…> → gene-set enrichment batch <id1,id2,…> → parallel gets search all [slot filters] → counts-first cross-entity orientation


## 实体和来源


| 实体 | BioMCP使用的上游供应商 | 示例 |
| --- | --- | --- |
| 基因 | [MyGene.info](http://MyGene.info)、UniProt、反应组、QuickGO、STRING、GTEx、人类蛋白图谱、DGIdb、ClinGen | `biomcp get gene BRAF pathways hpa` |
| variant | [MyVariant.info](http://MyVariant.info),ClinVar,gnomAD字段,通过MyVariant,CIViC,癌症基因组解释器,OncoKB,cBioPortal,GWAS目录,AlphaGenome | `biomcp get variant "BRAF V600E" clinvar` |
| 文章 | PubMed、PubTator3、欧洲PMC、PMC-OA、NCBI ID转换器、语义学者(可选认证; `S2_API_KEY` 推荐) | `biomcp search article -g BRAF --limit 5` |
| 试验 | [ClinicalTrials.gov](http://ClinicalTrials.gov) API v2,NCI CTS API | `biomcp search trial -c melanoma -s recruiting` |
| 药物 | [MyChem.info](http://MyChem.info)、EMA本地批次、ChEMBL、OpenTargets、,Drugs@FDA、美国食品药品监督管理局、CIViC | `biomcp get drug Keytruda regulatory --region eu` |
| 疾病 | [MyDisease.info](http://MyDisease.info)、君主倡议、MONDO、OpenTargets、Reactome、CIViC | `biomcp get disease "Lynch syndrome" genes` |
| 途径 | Reactome、KEGG、g:Profiler、Enrich支持的富集段 | `biomcp get pathway hsa05200 genes` |
| 蛋白质 | UniProt、InterPro、STRING、ComplexPortal、PDB、AlphaFold | `biomcp get protein P15056 complexes` |
| 不良事件 | OpenFDA FAERS、MAUDE、召回 | `biomcp search adverse-event --drug pembrolizumab` |
| pgx | CPIC,Pharma GKB | `biomcp get pgx CYP2D6 recommendations` |
| gwas | gwas目录 | `biomcp search gwas --trait "type 2 diabetes"` |
| 表型 | 君主倡议(HPO语义相似性) | `biomcp search phenotype "HP:0001250"` |


## 跨实体助手


在相关实体之间进行枢轴转换,而无需重建过滤器。


请参阅 跨实体枢轴指南 什么时间的
使用助手而不是重新搜索。


BASH```
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20biomcp variant trials "BRAF V600E" --limit 5
biomcp variant articles "BRAF V600E"
biomcp drug adverse-events pembrolizumab
biomcp drug trials pembrolizumab
biomcp disease trials melanoma
biomcp disease drugs melanoma
biomcp disease articles "Lynch syndrome"
biomcp gene trials BRAF
biomcp gene drugs BRAF
biomcp gene articles BRCA1
biomcp gene pathways BRAF
biomcp pathway drugs R-HSA-5673001
biomcp pathway drugs hsa05200
biomcp pathway articles R-HSA-5673001
biomcp pathway trials R-HSA-5673001
biomcp protein structures P15056
biomcp article entities 22663011
biomcp article citations 22663011 --limit 3
biomcp article references 22663011 --limit 3
biomcp article recommendations 22663011 --limit 3

基因集富集

BASH``` 1biomcp enrich BRAF,KRAS,NRAS —limit 10


顶层 `biomcp enrich` 用途 **g: 分析器**内部基因富集区
其他实体视图仍在引用 **Enrichr** 那是什么支持
来源。


## 章节和渐进式披露


每 `get` 命令支持用于集中输出的可选部分:


BASH```
1
2
3
4
5
6
7
8
9
10
11biomcp get gene BRAF                    # summary card
biomcp get gene BRAF pathways           # add pathway section
biomcp get gene BRAF hpa                # protein tissue expression + localization
biomcp get gene BRAF civic interactions # multiple sections
biomcp get gene BRAF all                # everything
biomcp get variant "BRAF V600E" clinvar population conservation
biomcp get article 22663011 tldr
biomcp get drug pembrolizumab label targets civic approvals
biomcp get drug Keytruda regulatory --region eu
biomcp get disease "Lynch syndrome" genes phenotypes variants
biomcp get trial NCT02576665 eligibility locations outcomes

在JSON模式下, get 反应暴露 _meta.next_commands 对于下一个可能 跟进和 _meta.section_sources 用于分段级来源。 batch ... --json 返回具有相同元数据形状的每个实体对象。

API密钥

大多数命令在没有凭据的情况下工作。可选按键可提高速率限制或 解锁可选丰富功能:

BASH``` 1 2 3 4 5 6export NCBI_API_KEY=”…” # PubTator, PMC OA, NCBI ID converter export S2_API_KEY=”…” # Optional Semantic Scholar auth; dedicated quota at 1 req/sec export OPENFDA_API_KEY=”…” # OpenFDA rate limits export NCI_API_KEY=”…” # NCI CTS trial search (—source nci) export ONCOKB_TOKEN=”…” # OncoKB variant helper export ALPHAGENOME_API_KEY=”…” # AlphaGenome variant effect prediction


`search article`, `get article`, `article batch`, `get article ... tldr`,以及
明确的语义学者助手都没有 `S2_API_KEY`.随着
密钥,BioMCP发送经过身份验证的请求,并使用专用速率限制
1请求/秒。如果没有它,BioMCP将以1请求/2秒的速度使用共享的未经身份验证的池。
`search article --source` 支持 `all`, `pubtator`, `europepmc`,以及
`pubmed`The
默认兼容文章联盟使用PubTator3、Europe PMC和PubMed,
而S2腿保持自动而不是直接可选。参考文献
由于出版商的原因,付费墙论文的推荐可能是空的
语义学者上游覆盖中的省略。


## 配置


### Claude桌面扩展设置


目录捆绑包仅公开第一个所需的可选设置
面向审阅者的构建:


| Claude桌面字段 | 运行时环境变量 | 目的 |
| --- | --- | --- |
| OncoKB代币 | `ONCOKB_TOKEN` | 启用 `biomcp variant oncokb "<gene> <variant>"` 治疗和水平证据 |
| DisGeNET API密钥 | `DISGENET_API_KEY` | 启用基因和疾病查找的DisGeNET评分部分 |
| 语义学者API密钥 | `S2_API_KEY` | 提高文章TLDR、引用、参考和推荐助手的可靠性 |


第一个目录构建只公开了这三个可选设置。高级
仅CLI环境变量仍记录在
API密钥 对于一般的BioMCP CLI路径。


## 用法示例


### 公共跨实体概述


**用户提示:** 给我一个关于黑色素瘤BRAF的低噪音概述。


**预期工具调用:** `biomcp search all --gene BRAF --disease melanoma --counts-only`


**预期行为:** 返回一个跨实体计数摘要,用于确定
下一个命令,而不是转储长的详细信息表。


**预期产量:** 统计第一个摘要和建议的下一个命令
最高收益实体跟进。


### 公共变体证据


**用户提示:** 总结BRAF V600E的临床意义和人群频率。


**预期工具调用:** `biomcp get variant "BRAF V600E" clinvar population`


**预期行为:** 检索聚焦的变体卡,ClinVar部分,以及
一次只读调用中的人口频率数据。


**预期产量:** 变体摘要、ClinVar意义细节和gnomAD
人口频率。


### OncoKB认证示例


**用户提示:** 显示BRAF V600E的OncoKB治疗证据。


**预期工具调用:** `biomcp variant oncokb "BRAF V600E"`


**预期行为:** 用途 `ONCOKB_TOKEN` 配置时和其他情况
返回有关丢失凭据的有用指导。


**预期产量:** 治疗和水平证据 `ONCOKB_TOKEN` 已设置,或
如果没有,则会给出明确的设置提示。


### DisGeNET认证示例


**用户提示:** 显示得分为TP53的DisGeNET关联。


**预期工具调用:** `biomcp get gene TP53 disgenet`


**预期行为:** 用途 `DISGENET_API_KEY` 检索得分
基因疾病关联科。


**预期产量:** 疾病关联表,包括证据计数和
得分时 `DISGENET_API_KEY` 已配置。


## 隐私政策


BioMCP不添加遥测、分析或远程日志上传。回顾
完整隐私声明 [https://biomcp.org/policies/](https://biomcp.org/policies/).


## 多工人部署


生物MCP速率限制是局部过程。对于许多并发工作者,运行一个共享
可流式传输的HTTP `biomcp serve-http` 端点,因此所有工作人员共享一个
预算限制:


BASH```
1biomcp serve-http --host 0.0.0.0 --port 8080

远程客户端应连接到 http://<host>:8080/mcp.轻量化工艺 探头可在 GET /health, GET /readyz,以及 GET /.

技能

BioMCP附带了嵌入式代理指南,而不是可浏览的二进制目录。 使用 biomcp skill 阅读嵌入式BioMCP指南,然后将其安装到 当您需要工作流引用的本地副本时,请访问您的代理目录:

BASH``` 1 2biomcp skill biomcp skill install ~/.claude —force


看 技能 对于支持的安装目标,
已安装的文件和旧版兼容性说明。


## 本地研究分析


`study` 是BioMCP的本地分析系列,用于下载cBioPortal风格的数据集。
12个远程实体命令查询上游API以获取发现和详细信息; `study`
当您需要按研究查询、队列、生存期、,
例如搜索、比较或共现工作流。


使用 `study download` 将数据集提取到本地研究根中。集
`BIOMCP_STUDY_DIR` 当您需要一个显式的数据集位置以进行可复制时
脚本和演示;如果未设置,BioMCP将回退到其默认的研究根。


BASH```
1
2
3export BIOMCP_STUDY_DIR="$HOME/.local/share/biomcp/studies"
biomcp study download msk_impact_2017
biomcp study query --study msk_impact_2017 --gene TP53 --type mutations --chart bar --theme dark --palette wong -o docs/blog/images/tp53-mutation-bar.svg

请参阅 CLI参考 对于完整 study 命令族和数据集的先决条件。

运维

BASH``` 1 2 3 4 5biomcp version # show version and build info biomcp health # inspect API connectivity plus local EMA/cache readiness biomcp update # self-update to latest release biomcp update —check # check for updates without installing biomcp uninstall # remove biomcp from ~/.local/bin


## 支持


- GitHub问题: [https://github.com/genomoncology/biomcp/issues](https://github.com/genomoncology/biomcp/issues)
- 故障排除: docs/故障排除.md
- 完整文档: [https://biomcp.org/](https://biomcp.org/)


## 文档


- 入门指南
- 搜索所有工作流
- 生物ASQ基准
- 跨实体枢轴指南
- 隐私政策
- 源许可和条款
- 数据源
- 快速参考
- 故障排除


## 引用


如果您在研究中使用BioMCP,请通过以下方式引用 CITATION.cff.
GitHub也公开了 `Cite this repository` 当该文件存在时,在存储库侧栏中。


## 数据来源和许可


BioMCP获得了麻省理工学院的许可。它对上游提供者执行按需查询,而不是出售或镜像他们的数据集,但上游术语控制着检索结果的重用。


一些提供商是完全开放的,一些BioMCP功能需要注册或API密钥,一些可查询的源仍然存在显著的重用限制。两个最大的警告是KEGG,它区分了学术和非学术用途,以及COSMIC,BioMCP之所以保持间接使用,只是因为其许可模式与直接的开放集成不兼容。


使用 源许可和条款 对于每个来源的细分 API密钥 有关设置步骤和注册链接。


## 许可证


麻省理工学院