加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程 > 正文

搜索 – 像关系数据库一样使用Lucene

发布时间:2021-04-03 19:34:07 所属栏目:编程 来源:网络整理
导读:我只是想知道我们是否可以在lucene中实现一些RDBMS成果. 例: 1)我有10,000个项目文档(pdf文件),必需将其内容编入索引以使其可供搜刮. 2)每份文件都与单一项目有关.项目可以包括项目名称,编号,开始日期,竣事日期,位置,范例等具体信息. 我必需在pdf文件的内容

我只是想知道我们是否可以在lucene中实现一些RDBMS成果.

例:
1)我有10,000个项目文档(pdf文件),必需将其内容编入索引以使其可供搜刮.
2)每份文件都与单一项目有关.项目可以包括项目名称,编号,开始日期,竣事日期,位置,范例等具体信息.

我必需在pdf文件的内容中搜刮给定的要害字,但在表现功效时,我想表现项目元数据,如第(2)点所述.

我的设法是在索引时将名为projectId的字段与每个pdf文件相干联.一旦我们获得了,我们将再次触发搜刮以获取项目元数据.

这样我们就可以停止一再数据.另外,假如我们想要更新项目元数据,我们最终只能在SINGLE PLACE更新.不然,假如我们行使全部pdf doument索引存储这个元数据,我们将最终更新全部文档,这不是我想要的方法.

请指教.

办理要领

假如我领略正确,你有两个题目:

>我可以在Lucene中存储项目ID并将其用于进一步搜刮吗?是的你可以.这是一种常见的做法.>我可以行使此项目ID来搜刮Lucene的项目元数据吗?是的你可以.我不知道这是不是一个好主意.这取决于元数据更新的频率和会见模式.假如元数据是相对静态的,而且您只能通过id会见它,Lucene也许是存储它的甜头所.不然,您可以将项目ID用作数据库表的主键,这也许更得当.

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读