skip to Main Content
Welcome to Gimasys!
Hotline: +84 974 417 099 (HCM) | +84 987 682 505 (HN) gcp@gimasys.com

Hướng dẫn Scaling Google Cloud Platform lên tới hàng triệu người dùng

Google Cloud Platform (GCP) là nền tảng điện toán đám mây có độ mở rộng và linh hoạt cao cho phép đáp ứng mọi nhu cầu tăng trưởng người dùng ứng dụng doanh nghiệp. Cùng tìm hiểu cách thức mở rộng (scale) từ 1k người dùng tới hàng triệu người dùng trong bài viết dưới đây nhé.  

Hướng dẫn Scaling Google Cloud từ 1 – 1k người dùng

Ở giai đoạn đầu khi mới go live ứng dụng, doanh nghiệp chỉ cần có một máy chủ và cơ sở dữ liệu như MySQL để lưu trữ tất cả dữ liệu. Trong giai đoạn này, chỉ cần sử dụng dịch vụ Cloud DNS để phân giải các External IP thuộc về máy chủ ảo (VM) mà server và database đang chạy. Cài đặt này khá đơn giản và tiết kiệm chi phí nhưng khi người dùng truy cập ứng dụng tăng lên, doanh nghiệp cần phải cân nhắc mở rộng quy mô hạ tầng để đáp ứng nhu cầu tải trọng. 

Hướng dẫn Scaling Google Cloud từ 1 - 1k người dùngViệc đăng ký sử dụng một instance duy nhất để chạy ứng dụng và cơ sở dữ liệu có thể giúp tiết kiệm chi phí trong giai đoạn phát triển ban đầu nhưng nó cũng gây ra rủi ro đáng kể về tính khả dụng và độ tin cậy hệ thống. Nếu xảy ra lỗi thì toàn bộ ứng dụng web và cơ sở dữ liệu của bạn sẽ không khả dụng, gây ra hiện tượng downtime cho người dùng ứng dụng.

Hơn nữa, việc này cũng hạn chế khả năng mở rộng cơ sở hạ tầng khi cơ sở dữ liệu người dùng tăng lên. Với một instance duy nhất, việc bổ sung các tài nguyên để đáp ứng nhu cầu ngày càng tăng cũng không hề dễ dàng đồng thời còn gây khó khăn cho việc duy trì hiệu suất và tính khả dụng khi cơ sở người dùng tăng lên đáng kể.

Hướng dẫn Scaling ứng dụng trên Google Cloud cho 10k người dùng

Đối với ứng dụng đã có lượng người dùng trên 10K, chúng ta sẽ làm quen với khái niệm Autoscaling

Auto scaling (Tự động mở rộng quy mô) là quá trình tự động thêm hoặc xóa tài nguyên dựa trên thay đổi demand, cho phép cơ sở hạ tầng có thể mở rộng hoặc thu hẹp khi cần. Với Google Cloud Platform (GCP), Auto Scaling thường được thực hiện bằng cách sử dụng các managed instance groups (MIG).

 Managed instance groups là một nhóm gồm các phiên bản máy ảo (VM) giống hệt nhau được quản lý dưới dạng một thực thể duy nhất. Với MIG, bạn có thể chỉ định số lượng instance muốn chạy và GCP sẽ tự động tạo và xóa các instance nếu cần để đáp ứng mục tiêu đề ra. Điều này cho phép xử lý các thay đổi nhu cầu đối với ứng dụng mà không cần phải thêm hoặc xóa instance theo cách thủ công.

Auto Scaling trong MIG có thể được kích hoạt bởi nhiều yếu tố khác nhau, bao gồm những thay đổi về mức độ sử dụng CPU, lưu lượng truy cập hoặc số liệu tùy chỉnh mà bạn thiết lập. Ví dụ: bạn có thể thiết lập quy tắc tự động thêm các phiên bản bổ sung khi mức sử dụng CPU đạt đến một ngưỡng nhất định hoặc tự động xóa các phiên bản khi lưu lượng truy cập giảm xuống dưới một mức nhất định.

Hướng dẫn Scaling ứng dụng trên Google Cloud cho 10k người dùng

Phân tách các phần ứng dụng

Bạn có thể phân ứng dụng thành các phần riêng biệt chẳng hạn như frontend managed instance group, backend managed instance group và multi-zone deployment (triển khai đa vùng), đây là cách tiếp cận phổ biến để mở rộng quy mô ứng dụng web trong Google Cloud Platform (GCP). Bằng cách tách ứng dụng thành các phần riêng biệt, bạn có thể quản lý và mở rộng quy mô từng phần một cách hiệu quả hơn dựa trên các yêu cầu cụ thể của chúng.

  • Nhóm frontend managed instance group sẽ chịu trách nhiệm phục vụ các phần tương tác với người dùng ứng dụng, chẳng hạn như trang web hoặc API. Thông qua đó, bạn có thể dễ dàng thêm hoặc xóa instance dựa trên những thay đổi về nhu cầu, đảm bảo giao diện người dùng luôn có thể xử lý tốt tải trọng người dùng. Ngoài ra, bạn có thể sử dụng địa chỉ IP bên ngoài trên bộ load balancer để phân phối lưu lượng truy cập đến trên nhiều instance, qua đó cải thiện hiệu suất và tính khả dụng.
  • Nhóm backend managed instance group chịu trách nhiệm xử lý các tác vụ tiêu tốn nhiều tài nguyên hơn, chẳng hạn như xử lý dữ liệu hoặc chạy các tác vụ nền. Bằng cách tách phần backend khỏi frontend, bạn có thể đảm bảo rằng những thay đổi về nhu cầu đối với frontend sẽ không ảnh hưởng đến hiệu suất của phần backend và ngược lại.
  • Multi-zone deployment (triển khai đa vùng) liên quan đến việc triển khai ứng dụng trên nhiều vùng trong một khu vực. Điều này giúp đảm bảo độ sẵn sàng cao vì ứng dụng vẫn sẽ tiếp tục hoạt động ngay cả khi một vùng bị ngừng hoạt động. Ngoài ra, bằng cách triển khai các instance ở nhiều vùng, bạn có thể cải thiện hiệu suất bằng cách giảm độ trễ và cung cấp thời gian phản hồi nhanh hơn cho người dùng.
  • Việc tách các máy chủ dữ liệu và sử dụng chế độ chờ giữa các vùng là một cách tiếp cận mạnh mẽ và hiệu quả để mở rộng dịch vụ MySQL tự quản lý trong GCP. Phương pháp này có thể đảm bảo rằng cơ sở dữ liệu luôn sẵn sàng, đáng tin cậy và đạt hiệu suất cao.

Phân tách các phần ứng dụng

Hướng dẫn Scaling ứng dụng trên Google Cloud cho 100k+ người dùng

Mở rộng quy mô cơ sở dữ liệu MySQL như thế nào? 

Khi lượng người dùng ứng dụng ngày càng tăng lên, việc scaling hệ quản trị cơ sở dữ liệu như MySQL cần được quan tâm, vậy cách thức hoạt động như thế nào với Google Cloud. 

Bằng cách sử dụng dịch vụ Managed MySQL như Cloud SQL của Google, bạn có thể đơn giản hóa quy trình quản lý và mở rộng quy mô cơ sở dữ liệu của doanh nghiệp. Cloud SQL sẽ đảm nhiệm các nhiệm vụ như sao lưu,phục hồi, sao chép và bảo trì, qua đó cho phép bạn tập trung vào ứng dụng và tối ưu hiệu suất của nó.

Mở rộng quy mô cơ sở dữ liệu MySQL như thế nào

Giảm tải cơ sở dữ liệu với Memorystore

Giảm tải cơ sở dữ liệu với MemorystoreSử dụng bộ nhớ đệm (caching) sẽ hỗ trợ cải thiện hiệu suất ứng dụng của bạn bằng cách giảm số lượng request cần thực hiện đối với backend. GCP cung cấp nhiều giải pháp bộ nhớ đệm, bao gồm:

Google Cloud Memorystore: Dịch vụ bộ nhớ đệm được quản lý có thể được sử dụng để lưu trữ dữ liệu được truy cập thường xuyên và giảm tải cho backend. 

Giảm tải cơ sở dữ liệu với Memorystore 2

Hướng dẫn Scaling ứng dụng trên Google Cloud cho 1M+ người dùng

1M+ users

Để phục vụ việc mở rộng ứng dụng khi số lượng khách truy cập vượt mức trên 1M+, một số dịch vụ Google Cloud có thể kể đến bao gồm Global load balancing, Google Cloud Spanner, CDN.

Global load balancing: scale app global with multi-region

Global load balancing là một tính năng trong Google Cloud Platform (GCP) cho phép bạn phân phối lưu lượng truy cập đến cho nhiều instance thuộc nhiều khu vực khác nhau. Điều này giúp cải thiện hiệu suất và đảm bảo tính sẵn sàng cao cho ứng dụng của bạn, vì người dùng được chuyển hướng đến instance khả dụng gần nhất, giảm độ trễ và cung cấp thời gian phản hồi nhanh hơn.

Global load balancing: scale app global with multi-regionBằng cách sử dụng global load balancing, bạn có thể đảm bảo rằng ứng dụng của mình luôn có tính sẵn sàng cao, ngay cả khi một khu vực bị ngừng hoạt động. Ngoài ra, global load balancing cũng giúp cải thiện hiệu suất bằng cách phân phối lưu lượng trên nhiều instance, giảm tải cho từng instance và ngăn chặn bất kỳ instance đơn lẻ nào trở thành nút thắt cổ chai làm tắt nghẽn quy trình hiện có.

Google Cloud Spanner

Google Cloud Spanner là dịch vụ cơ sở dữ liệu quan hệ được phân phối toàn cầu, có thể mở rộng theo chiều ngang, được cung cấp bởi Google Cloud Platform (GCP). Bạn nên cân nhắc sử dụng Cloud Spanner trong các trường hợp sau:

  1. Yêu cầu về tính sẵn sàng và khả năng mở rộng cao: Nếu ứng dụng của bạn yêu cầu quyền truy cập vào cơ sở dữ liệu một cách nhất quán và có độ trễ thấp bất kể số lượng người dùng hoặc truy vấn thì Cloud Spanner sẽ đảm bảo được điều này với tính năng sao chép đa vùng tự động để chắc chắn rằng dữ liệu của bạn vẫn có tính khả dụng ngay cả khi sự cố xảy ra.
  2. Lưu trữ và truy xuất dữ liệu trên quy mô lớn: Cloud Spanner được thiết kế để xử lý việc lưu trữ và truy xuất dữ liệu trên quy mô lớn với tính năng phân chia và điều chỉnh quy mô tự động để phù hợp với sự phát triển dữ liệu của bạn.
  3. Đảm bảo tính nhất quán mạnh mẽ: Cloud Spanner hỗ trợ đảm bảo tính nhất quán mạnh mẽ, nghĩa là tất cả các nodes trong cơ sở dữ liệu đều có thể xem cùng một lúc, điều này rất quan trọng đối với các ứng dụng yêu cầu tính nhất quán và độ chính xác cao. 
  4. Ứng dụng kết hợp xử lý giao dịch/phân tích (HTAP): Nếu ứng dụng của bạn yêu cầu kết hợp xử lý giao dịch (OLTP) và phân tích (OLAP), Cloud Spanner có thể cung cấp một cơ sở dữ liệu phân tán toàn cầu duy nhất để xử lý cả hai.
  5. Nhu cầu về cơ sở dữ liệu quan hệ: Nếu ứng dụng của bạn yêu cầu cơ sở dữ liệu quan hệ, với khả năng thực thi mối quan hệ giữa các dữ liệu, Cloud Spanner cung cấp giải pháp có thể mở rộng được quản lý hoàn toàn với sự đảm bảo tính nhất quán mạnh mẽ.

Content Delivery Network (CDN): Phân phối nội dung tĩnh nhanh hơn

Content Delivery Network (CDN): Sử dụng CDN có thể giúp phân phối nội dung tĩnh nhanh hơn bằng cách lưu vào bộ nhớ đệm ở nhiều địa điểm trên khắp thế giới, cho phép người dùng truy cập nội dung từ máy chủ gần nhất hiện có. Điều này có thể giảm đáng kể thời gian để nội dung đến tay người dùng, hỗ trợ tải trang nhanh hơn.

1M+ Users architecture

Trên đây là thông tin hướng dẫn cách thức mở rộng quy mô (scaling) cho ứng dụng doanh nghiệp từ khi bắt đầu đến khi tăng trưởng về số lượng người dùng. Các thông tin chi tiết phù hợp nhu cầu hiện trạng doanh nghiệp, hãy kết nối với các chuyên gia của Gimasys nhé. 

 

 

Là đối tác cấp cao của Google tại Việt Nam, Gimasys có hơn 10+ năm kinh nghiệm, tư vấn triển khai chuyển đối số cho 2000+ doanh nghiệp tập đoàn trong nước. Một số khách hàng tiêu biểu Jetstar, Điền Quân Media, Heineken, Jollibee, Vietnam Airline, HSC, SSI…

Gimasys is currently a strategic partner of many major technology companies in the world such as Salesforce, Oracle Netsuite, Tableau, Mulesoft.

Liên hệ Gimasys – Google Cloud Premier Partner để được tư vấn các giải pháp chiến lược phù hợp nhu cầu riêng của doanh nghiệp: 

  •   Email: gcp@gimasys.com
  •   Hotline: 0974 417 099
Back To Top
0974 417 099