Skip to main content
Huỳnh Minh
💬
0 discussions

Hướng dẫn cập nhật index data cho Algolia

I. Điều kiện tiên quyết:

Lưu ý: Trong quá trình thực hiện cần phải thao tác với việc tạm thời tắt bảo mật xác minh danh tính trên docs.gcalls.vn và xóa dữ liệu index cũ trên Algolia.

II. Đối tượng đọc:

  • Customer Success Engineer (CSE) Có liên quan tới:
    • DevOps
    • Dev
    • SEO
    • Database
    • Cloud DNS

III. Chuẩn bị, Cài đặt - cấu hình và thực thi:

1. Chuẩn bị Cloudflares Zero Trust:

  • Truy cập Cloudflares dashboard
  • Truy cập Zero Trust
  • Truy cập gcalls-doc

algolia-guide

algolia-guide

algolia-guide

algolia-guide

  • Tạm thời đổi subdomain cần được bảo vệ từ docs.gcalls.vn thành subdomain khác (để thuận tiện cho việc crawl dữ liệu index cho search bar)
  • Sau khi cập nhật được index cho Algolia, đổi lại subdomain cũ. algolia-guide

2. Chuẩn bị Algolia:

  • Truy cập Algolia dashboard algolia-guide
  • Clear index trong dev_gcalls để chuẩn bị nhập dữ liệu index mới. algolia-guidealgolia-guide

3. Cài đặt, cấu hình:

  • Tạo 1 file .env với các biến sau:
APPLICATION_ID=YOUR_APP_ID
API_KEY=YOUR_API_KEY
  • Trong đó, YOUR_APP_ID là appId, YOUR_API_KEY là api trên Algolia cần crawl

4. Thực thi

  • Truy cập gcallsbash/algolia/
cd gcallsbash/algolia
  • Chạy script crawler Algolia:
sh algolia-docker.sh

hoặc lệnh chạy docker crawler của Algolias

docker run -it --env-file=.env -e "CONFIG=$(cat config.json | jq -r tostring)" algolia/docsearch-scraper

algolia-guide

IV. Kết luận:

  • Sau khi crawl xong dữ liệu, dữ liệu tìm kiếm metadata của trang docs sẽ được index lại trên Algolia.
  • Trong gcallsbash/algolia/ có file config.json để config domain và các vị trí cần index trên mỗi bài viết. Có thể tùy chỉnh theo nhu cầu truy vấn docs.