Text Search_Text Search With Basis Technology Rosette Linguistics Platform


  • 註冊用戶

    概述
    除了MongoDB文本搜索中的语言外,MongoDB 企业版还提供对以下附加语言的支持:阿拉伯语,波斯语(特别是Dari和伊朗波斯语),乌尔都语,简体中文和繁体中文。
    为了实现对这六种额外语言的支持,MongoDB 企业版集成了Basis Technology Rosette Linguistics Platform(RLP),使用它来针对具体语言进行规范化、分词、断句、词干或标记化等操作。

    MongoDB 企业版在Red Hat Enterprise Linux 6.x上支持RLP SDK 7.11.1。 更多关于在其他平台上已提供支持的信息,请与销售代表联系。

    先决条件
    要将MongoDB与RLP一起使用,MongoDB需要安装用于RLP的基本语言学组件和上文指定的一种或多种语言的许可证,但并不需要上面所列出的六种语言全部的许可证。
    对任何指定语言的支持都取决于是否有为该语言提供有效的RLP许可证。 例如,如果只有为阿拉伯语提供的RLP许可证,则MongoDB将只支持阿拉伯语,而不支持任何其他基于RLP的语言。 对于缺少有效许可证的任何语言,MongoDB日志将包含警告消息。 此外,您可以将MongoDB日志级别设置为2,以记录标识每种支持的语言的调试消息。

    您不需要语言扩展包,因为MongoDB目前不支持这些RLP语言。

    本帖下載内容已隐藏,请登入以查看隐藏内容!

    使用步骤

    • 1 从Basis Technology处下载Rosette Linguistics Platform(RLP)
      从Basis Technology处获取用于下载RLP C++ SDK包文件、文档包文件和Linux x64的许可证文件(rlp-license.xml)的链接。Basis Technology在邮件中提供了下载地址。使用这些链接,下载RLP C++ SDK包文件,文档包文件和Linux x64的许可证文件(rlp-license.xml)。
      注意:这些链接会在30天后自动失效
    • 2 安装RLP二进制文件
      解压RLP二进制文件并将它们置于指定目录中; 此目录称为BEETROOT的安装目录。 针对该例,我们将使用/ opt / basis作为BT_ROOT
    tar zxvC /opt/basis rlp-7.11.1-sdk-amd64-glibc25-gcc41.tar.gz
    
    • 3 将RLP许可证移到RLP许可证根目录中
      将RLP许可证文件rlp-license.xml移动到 / rlp / rlp / licenses目录中; 在我们的示例中,将文件移动到/ opt / basis / rlp / rlp / licenses /目录中。
    mv rlp-license.xml /opt/basis/rlp/rlp/licenses/
    
    • 4 在RLP支持下运行Mongodb
      要启用对RLP的支持,请使用--basisTe chRootDirectory选项指定BT_ROOT目录。
      请根据需要对你的部署选择是否需要其他额外设定。
    mongod --basisTechRootDirectory=/opt/basis
    

    附加信息
    相关的安装帮助,请参阅RLP快速入门手册或语言学平台应用程序开发人员指南第二章。
    为了调试有关RLP特定问题,您可以将rlp Verbose参数设置为true(即--setParameter rlp Verbose = true)以查看来自RLP的INFO消息。
    警告
    由于Verbose服务会加大性能开销。请仅在旨与解决安装问题时再启用该服务。


  • 註冊用戶

    原文网址:https://docs.mongodb.com/manual/tutorial/text-search-with-rlp/


登录后回复
 

与 萌阔论坛 的连接断开,我们正在尝试重连,请耐心等待