全文检索

在您的个人知识库中,信息会不断增长。DoCube 强大而智能的搜索功能,旨在帮助您在海量笔记、书籍、网页和文档中,瞬间找到所需内容,无论您记得的是确切的字词,还是模糊的概念。DoCube 的全文检索功能具备以下特点:

  • 支持多种文件格式: 包括 MinerU、Markdown、PDF、EPUB、HTML。
  • 全局搜索: 搜索您知识库的所有文档、笔记, 搜索结果按相关度排序。
  • 多维度过滤: 可以按照标签、文档名称、文档类型、文字来源来快速筛选结果
  • 实时预览: 带有关键字高亮的实时预览,用户可以快速浏览内容,决定是否打开完整文档。

建立索引

为了实现高效的全文检索, DoCube 需要先对导入的文档进行索引建立. 索引建立在后台自动进行, 您无需手动操作, 当文档的内容发生变化, DoCube 也会定期为发生变化的文档重建索引. 文档库页面中每个文档标题右侧的状态图标 指示了该 文档的索引状态: 灰色表示尚未建立索引, 蓝色表示索引建立完成. 如果搜索结果中未出现您所预期的文档, 可以查看索引状态并等待索引建立完成后再次搜索.

发起全文检索

在 DoCube 中开始搜索非常便捷, 您只需点击任意 Tab 页的标题栏, 例如下面的首页标题栏, 即可立即调出搜索框开始新的搜索.

在 DoCube 中搜索

搜索完成后,您可以随时点击导航栏中的 图标,返回到刚才正在阅读的文档,流程丝滑流畅。

过滤搜索结果

首次搜索完成后, 可以点击搜索页面顶部工具栏中的 图标, 打开过滤器面板. 过滤器中各种选项说明如下:

扩展查询
首次查询后, DoCube 会从已经搜索出的内容中提取一些相关的、同义的扩展词. 你可以在原始查询词的基础上,点击一个或多个这些扩展词,构成一个新的、更丰富的查询,以便从文档集合中检索出更多相关的文档。

按词项过滤
只显示一定包含选中词项的搜索结果. 可以选择多个词项进行过滤.

按内容来源过滤
只显示搜索词出现在指定来源的搜索结果. 例如只显示标题中出现某个搜索词的结果, 可以多选

按类型过滤
只显示指定文档类型的搜索结果. 例如只显示 PDF 文档中的搜索结果, 可以多选

按文档过滤
只显示来自指定名称的文档中的搜索结果. 可以多选

按标签过滤
只显示包含指定标签的搜索结果, 即搜索出的文档必须包含指定标签, 可以多选

快速获取精确搜索结果

面对庞大的文档库, 一次搜索可能会返回大量结果. DoCube 只显示了与搜索语句最相关的前 40 条结果, 以帮助您快速筛选内容。搜索结果页面右上方有关于本次搜索的统计信息, 包括总结果数和相关结果数, 如下所示

找到 40 条相关结果, 一共 1767 条结果

如果前 40 条结果里没有预期的内容, 您可以通过上一节介绍的过滤器, 进一步缩小搜索范围, 当总结果数减少到 500 条以内时, 统计信息中总结果数会变为蓝色且带有下划线, 此时您可以点击总结果数字切换到显示全部搜索结果, 通过搜索页面底部的翻页按钮依次查看全部搜索结果.

找到 40 条相关结果, 一共 309 条结果

当然, 在将近 500 条结果中查找所需内容依然不够高效. 更高效的方式是继续使用过滤器缩小搜索范围. 直到相关结果数量与总结果数量一致, 则表示当前搜索结果已经非常精确, 如果里面还是没有预期的内容则表明知识库中没有相关内容.

找到 36 条相关结果, 一共 36 条结果