Cursor索引pdf文件
2025-12-25
| 2025-12-25
字数 981阅读时长 3 分钟
type
status
date
slug
summary
tags
category
icon
password
Cursor 具有强大的上下文理解能力,会对整个项目进行索引。虽然 Cursor 的代码库索引(Codebase Indexing)在处理各种编程语言和文本文件(如 .md, .txt)方面非常强大,但它目前并不能直接原生索引(Index)本地的 PDF 文件。如何将pdf文件加到cursor的索引库呢?
  1. 将 PDF 转换为 Markdown
  1. 使用第三方插件/MCP (Model Context Protocol)
  1. 在线 PDF可以通过@Docs引用,Cursor 会爬取该链接并将其内容索引到你的当前对话背景中。
如果是本地的pdf文件,如论文,我们只能通过前两种方式引用。

首先来探索一下第二种方法“使用MCP”。

在Cursor中点击”Settings”-“Tools & MCP”-“New MCP Server”, 在打开的JSON文件中输入(以常用的 pdf-reader-mcp 为例):
参数说明
  • pdf-reader: 这是服务名,你可以随便改,比如叫 "my-pdf-tool"
  • command: 这里填主命令,通常是 npx(Node.js 的包执行器)。
  • args: 这是一个列表,放的是命令后面的参数。
    • "-y": 这个参数很重要,它的意思是“自动安装”,防止 npx 在后台询问你“是否安装该包”,如果没加这个,Cursor 可能会因为等不到你的确认而卡死。
    • "@sylphx/pdf-reader-mcp": 这是具体的工具包名。
保存,回到 Cursor 的设置界面,你应该能看到 pdf-reader 下面出现一个绿色的圆点(显示为 Connected)。
⚠️需要 Node.js: 使用这种方法电脑必须安装了 Node.js(建议 v18 或更高版本)。
因为我的电脑是被学校管理的,没有管理员权限,我无法安装node.js,所以暂时无法使用这个方案。
下面我尝试了免管理员权限的替代方案:

PDF 批量转 Markdown

下面这个脚本运行后可以把当前目录下的所有pdf文件批量转换为markdown文件,使用Docling 这个库。
把这个文件放到你的project文件夹,运行将所有pdf文件转为markdown文件就可以被cursor索引了。
但是这种方法非常不美,我想让cursor每次遇到poject中有pdf file时都把它们自动转换成markdown files然后自动索引。

这是一个存档,还需要继续探索,比如是否可以使用cursor rules?
播客笔记:在学术界谋生存读书笔记:Zen and the art of motorcycle maintenance
Loading...