Linkly AI 如何实现本地优先?

在上一篇文章中,我们介绍了 Linkly AI 是什么以及它能做什么。今天,我们想和大家聊聊背后的技术原理:Linkly AI 是如何做到"本地优先"的?
这篇文章面向所有对隐私和数据安全感兴趣的用户,我们会尽量用通俗的语言来解释技术细节。
#你的文档是如何变成"知识"的?
当你把一个文件夹添加到 Linkly AI 的知识库后,应用会在后台默默完成四件事。
- 扫描: Linkly AI 会持续监控你指定的文件夹。新增的文件会被自动发现,修改过的文件会被重新处理,删除的文件也会从索引中移除。这一切都在后台静默完成,你无需手动干预。
- 解析:不同格式的文档就像不同语言的书籍。Linkly AI 需要把 PDF、Word、Markdown 等各种格式"翻译"成统一的文本格式,并解析出文档的结构元数据,比如标题层级、页码信息等。
- 切分:一篇很长的文档不能直接整个塞给 AI,会占满模型的上下文窗口,也会分散模型的注意力。Linkly AI 会把文档智能地按照语义切成片段,每个片段保持相对完整的意义单元。
- 索引:Linkly AI 会把每个文本片段连同它的元数据(比如来源文件、页码等)一起存储到本地数据库。这就像建立了一个"索引",可以快速定位到任何你需要的信息。
一篇很长的文档不能直接整个塞给 AI,会占满模型的上下文窗口,也会分散模型的注意力。Linkly AI 会把文档智能地按照语义切成片段,每个片段保持相对完整的意义单元。
第四步:索引
这是最神奇的一步。AI 模型会把每段文字转换成一串数字(专业术语叫"向量"),就像给每段文字在一个巨大的"意义空间"里标注坐标。意思相近的文字,它们的坐标也会很接近。
完成这四个步骤后,当你向 AI 提问时,Linkly AI 就能快速检索到意思最相关的那些段落,并附上来源引用。
#数据存在哪里?
答案是:全部在你自己的电脑上。
Linkly AI 使用本地数据库存储所有信息:文档的元数据、切分后的文本块、以及每个文本块的向量表示。没有任何数据会被自动上传到云端。这意味着,即使你断开网络,知识库依然可以正常工作(前提是你使用本地 AI 模型进行检索和嵌入)。
#在线 AI 怎么访问本地知识?
这是一个很好的问题。Claude.ai、ChatGPT.com 这些在线 AI 服务运行在云端,它们没办法直接"看到"你电脑里的文件。但很多时候,我们确实需要在这些功能更强大的在线 AI 中使用本地知识。Linkly AI 通过一个创新的"远程连接器"解决了这个问题。
#远程连接的工作原理
想象这样一个场景:你在 Claude.ai 上提问,Claude 发现需要查询你的知识库。整个流程是这样的:
- Claude.ai 把查询请求发送到 Linkly AI 的中转服务器
- 中转服务器通过一条安全的"隧道",把请求转发给你电脑上运行的 Linkly AI
- Linkly AI 在本地知识库中检索相关内容
- 检索结果原路返回给 Claude.ai
- Claude 基于这些信息回答你的问题
这个过程通常在一两秒内无感完成。
#数据安全吗?
关键点在于:发送给在线 AI 的只是检索片段,而不是你的完整文档。
打个比方:就像你请秘书帮你查资料,秘书只会把与问题相关的几段摘录发给专家,而不是把整个档案室搬过去。具体来说:
- 会发送的内容:你的提问、与问题相关的文本片段(通常只有几千字)、引用来源信息
- 绝不会发送的内容:你的完整文档、你的数据库文件、与提问无关的任何内容
#更高的安全选项
如果你对安全有更高要求,Linkly AI 提供了几种方案:
- 纯本地模式:使用 Ollama 等本地模型,所有计算都在你电脑上完成,数据完全不出本机。这是最高安全级别。
- 自部署中转服务:我们提供了开源的远程连接器,你可以将其部署在自己的 Cloudflare 账户中,完全掌控数据流向。
#为什么选择本地优先?
在我们开发 Linkly AI 的初衷这篇文章中,我们提到过:市面上大多数 AI 知识库产品都需要把数据上传到云端,这让很多注重隐私的用户望而却步。
我们选择"本地优先"的设计理念,是因为我们相信:
你的知识属于你自己。无论是工作文档、学习笔记,还是个人日记,这些都是你花时间积累的知识资产。它们应该存储在你能完全掌控的地方。
隐私不应该是奢侈品。保护个人数据不应该需要付出高昂的代价或复杂的操作。本地存储是最简单、最可靠的隐私保护方式。
灵活性很重要。有些场景需要完全离线,有些场景需要远程访问。本地优先的架构让你可以根据实际需求灵活选择。
#总结
Linkly AI 的本地优先设计确保了:
- 数据主权:所有原始文档和知识库数据都存储在你的电脑上
- 可控的连接:远程访问是可选的,你可以随时关闭
- 最小化数据传输:即使启用远程连接,也只传输与查询相关的片段
- 多级安全选项:从纯本地到自部署中转,满足不同安全需求
如果你还没有尝试过 Linkly AI,欢迎访问 linkly.ai 下载体验。有任何问题,也欢迎查阅我们的文档或在社区中交流。