词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 来源 | 内置(默认安装) |
| 路径 | skills/research/arxiv |
| 版本 | 1.0.0 |
| 作者 | Hermes Agent |
| 许可证 | MIT |
| 平台 | linux, macos, windows |
| 标签 | Research, Arxiv, Papers, Academic, Science, API |
| 相关 skill | ocr-and-documents |
| 操作 | 命令 |
|---|---|
| 搜索论文 | curl "https://export.arxiv.org/api/query?search_query=all:QUERY&max_results=5" |
| 获取指定论文 | curl "https://export.arxiv.org/api/query?id_list=2402.03300" |
| 阅读摘要(网页) | web_extract(urls=["https://arxiv.org/abs/2402.03300"]) |
| 阅读完整论文(PDF) | web_extract(urls=["https://arxiv.org/pdf/2402.03300"]) |
grep/sed 解析,或通过管道传给 python3 获得整洁输出。| 前缀 | 搜索范围 | 示例 |
|---|---|---|
all: | 所有字段 | all:transformer+attention |
ti: | 标题 | ti:large+language+models |
au: | 作者 | au:vaswani |
abs: | 摘要 | abs:reinforcement+learning |
cat: | 分类 | cat:cs.AI |
co: | 备注 | co:accepted+NeurIPS |
# AND(使用 + 时的默认行为)
search_query=all:transformer+attention
# OR
search_query=all:GPT+OR+all:BERT
# AND NOT
search_query=all:language+model+ANDNOT+all:vision
# 精确短语
search_query=ti:"chain+of+thought"
# 组合使用
search_query=au:hinton+AND+cat:cs.LG| 参数 | 选项 |
|---|---|
sortBy | relevance, lastUpdatedDate, submittedDate |
sortOrder | ascending, descending |
start | 结果偏移量(从 0 开始) |
max_results | 结果数量(默认 10,最大 30000) |
# 摘要页(速度快,包含元数据和摘要)
web_extract(urls=["https://arxiv.org/abs/2402.03300"])
# 完整论文(PDF → 通过 Firecrawl 转为 markdown)
web_extract(urls=["https://arxiv.org/pdf/2402.03300"])ocr-and-documents skill。| 分类 | 领域 |
|---|---|
cs.AI | 人工智能 |
cs.CL | 计算与语言(NLP) |
cs.CV | 计算机视觉 |
cs.LG | 机器学习 |
cs.CR | 密码学与安全 |
stat.ML | 机器学习(统计) |
math.OC | 优化与控制 |
physics.comp-ph | 计算物理 |
scripts/search_arxiv.py 脚本负责处理 XML 解析并提供整洁输出:title、authors、year、abstract、citationCount、referenceCount、influentialCitationCount、isOpenAccess、openAccessPdf、fieldsOfStudy、publicationVenue、externalIds(包含 arXiv ID、DOI 等)python scripts/search_arxiv.py "your topic" --sort date --max 10curl -s "https://api.semanticscholar.org/graph/v1/paper/arXiv:ID?fields=citationCount,influentialCitationCount"web_extract(urls=["https://arxiv.org/abs/ID"])web_extract(urls=["https://arxiv.org/pdf/ID"])curl -s "https://api.semanticscholar.org/graph/v1/paper/arXiv:ID/references?fields=title,citationCount&limit=20"curl -s "https://api.semanticscholar.org/graph/v1/author/search?query=NAME"| API | 速率 | 认证 |
|---|---|---|
| arXiv | 约 1 次请求 / 3 秒 | 无需认证 |
| Semantic Scholar | 1 次请求 / 秒 | 无需认证(有 API key 可达 100 次/秒) |
python3 -m json.tool 提升可读性hep-th/0601001)与新格式(2402.03300)https://arxiv.org/pdf/{id} — 摘要:https://arxiv.org/abs/{id}https://arxiv.org/html/{id}ocr-and-documents skillarxiv.org/abs/1706.03762 始终解析为最新版本arxiv.org/abs/1706.03762v1 指向某个特定不可变版本<id> 字段返回带版本号的 URL(例如 http://arxiv.org/abs/1706.03762v7)<summary> 字段会包含撤回声明(注意查找 "withdrawn" 或 "retracted" 字样)