本文展示如何利用 Milvus 向量搜索引擎搭建一个化学式检索系统。

CPU

Intel® Core™ i7-7700K CPU @ 4.20GHz

Memory

32GB

OS

Ubuntu 18.04

Software

Milvus 0.10.0
mols-search-webserver 0.7.0
mols-search-webclient 0.3.0

以上配置已经通过测试,并且 Windows 系统也可以运行本次实验,以下步骤 Windows 系统通用。

本次实验数据来源:ftp://ftp.ncbi.nlm.nih.gov/pubchem/Compound/CURRENT-Full/SDF,该数据集是压缩的 SDF 文件,需要使用工具将其转换为 SMILES 文件,我们准备了转换后的一万条 SMILES 化学式文件 test_1w.smi,下载该文件到本地:

$ wget https://raw.githubusercontent.com/milvus-io/bootcamp/0.10.0/solutions/mols_search/smiles-data/test_1w.smi

1. 启动 Milvus v0.10.0

本次实验使用 Milvus 0.10.0CPU 版,安装启动方法参考https://milvus.io/cn/docs/v0.10.0/guides/get_started/install_milvus/cpu_milvus_docker.md 。

2. 启动 mols-search-webserver docker

$ docker run -d -v <DATAPATH>:/tmp/data -p 35001:5000 -e "MILVUS_HOST=192.168.1.25" -e "MILVUS_PORT=19530" milvusbootcamp/mols-search-webserver:0.7.0

上述启动命令相关参数说明:

-v DATAPATH:/tmp/data

-v 表示宿主机和 image 之间的目录映射
请将 DATAPATH 修改为你本机存放 test_1w.smi 数据的目录。

-p 35001:5000

-p 表示宿主机和 image 之间的端口映射

-e "MILVUS_HOST=192.168.1.25"

-e 表示宿主机和 image 之间的系统参数映射
请修改192.168.1.25为启动 Milvus docker 的服务器 IP 地址

-e "MILVUS_PORT=19530"

请修改19530为启动 Milvus docker 的服务器端口号

3. 启动 mols-search-webclient docker

$ docker run -d -p 8001:80 -e API_URL=http://192.168.1.25:35001 milvusbootcamp/mols-search-webclient:0.3.0

参数 -e API_URL=http://192.168.1.25:35001 与本节第二部分相对应,请修改192.168.1.25为启动 Milvus docker 的服务器 IP 地址。

4. 打开浏览器

# 请根据以上步骤修改 192.168.1.25 地址和 8001 端口
http://192.168.1.25:8001

点击CLEAR ALL按钮,将清除所有化学式数据