Hướng dẫn cập nhật index data cho Algolia
I. Điều kiện tiên quyết:
- Có quyền truy cập vào dashboard Algolia của Gcalls
- Có quyền truy cập dashboard Cloudflares của Gcalls
- Có quyền truy cập gcallsbash và tải gcallsbash về.
- Tham khảo bài hướng dẫn cài crawler ở local của Algolia
Lưu ý: Trong quá trình thực hiện cần phải thao tác với việc tạm thời tắt bảo mật xác minh danh tính trên docs.gcalls.vn và xóa dữ liệu index cũ trên Algolia.
II. Đối tượng đọc:
- Customer Success Engineer (CSE)
Có liên quan tới:
- DevOps
- Dev
- SEO
- Database
- Cloud DNS
III. Chuẩn bị, Cài đặt - cấu hình và thực thi:
1. Chuẩn bị Cloudflares Zero Trust:
- Truy cập Cloudflares dashboard
- Truy cập Zero Trust
- Truy cập gcalls-doc




- Tạm thời đổi subdomain cần được bảo vệ từ docs.gcalls.vn thành subdomain khác (để thuận tiện cho việc crawl dữ liệu index cho search bar)
- Sau khi cập nhật được index cho Algolia, đổi lại subdomain cũ.

2. Chuẩn bị Algolia:
- Truy cập Algolia dashboard

- Clear index trong dev_gcalls để chuẩn bị nhập dữ liệu index mới.


3. Cài đặt, cấu hình:
- Tạo 1 file
.envvới các biến sau:
APPLICATION_ID=YOUR_APP_ID
API_KEY=YOUR_API_KEY
- Trong đó, YOUR_APP_ID là appId, YOUR_API_KEY là api trên Algolia cần crawl
4. Thực thi
- Truy cập
gcallsbash/algolia/
cd gcallsbash/algolia
- Chạy script crawler Algolia:
sh algolia-docker.sh
hoặc lệnh chạy docker crawler của Algolias
docker run -it --env-file=.env -e "CONFIG=$(cat config.json | jq -r tostring)" algolia/docsearch-scraper

IV. Kết luận:
- Sau khi crawl xong dữ liệu, dữ liệu tìm kiếm metadata của trang docs sẽ được index lại trên Algolia.
- Trong
gcallsbash/algolia/có file config.json để config domain và các vị trí cần index trên mỗi bài viết. Có thể tùy chỉnh theo nhu cầu truy vấn docs.