bỏ qua Nội dung chính
Chào mừng bạn đến với Gimasys!
Hotline: +84 974 417 099 (HCM) | +84 987 682 505 (HN) gcp@gimasys.com

Cách thức tối ưu hóa hoạt động, giảm thiểu chi phí cho Google Kubernetes Workloads

Bạn có biết mình có thể tiết kiệm được bao nhiêu tiền bằng cách điều chỉnh các workload requests để thể hiện tốt hơn mức sử dụng thực tế của chúng không? Nếu bạn không định lượng đúng cho workloads của mình, thì bạn có thể phải chi trả quá cao cho các tài nguyên mà workloads của bạn thậm chí không sử dụng hoặc tệ hơn, khiến workloads của bạn gặp rủi ro khi gặp các vấn đề về độ tin cậy do cung cấp tài nguyên dưới mức cần thiết.

Như chúng ta đã thảo luận trước đây, việc đặt đúng tài nguyên là điều quan trọng nhất bạn có thể làm để tăng độ tin cậy cho Kubernetes workloads của mình. Trong blog này, Gimasys sẽ giúp bạn tìm second key từ báo cáo State of Kubernetes Cost Optimization!

Tối đa hóa độ tin cậy, giảm thiểu chi phí: Định lượng kích cỡ Kubernetes Workloads phù hợp 1“Nghiên cứu … nhận thấy rằng Định lượng Workload mở ra cơ hội lớn nhất để giảm lãng phí tài nguyên.”

Báo cáo State of Kubernetes Cost Optimization

Theo kết quả nghiên cứu của Google, định lượng đúng workload là tín hiệu vàng quan trọng nhất. Định lượng workload đo lường khả năng của các nhà phát triển sử dụng đúng CPU và bộ nhớ mà họ đã yêu cầu cho các ứng dụng của họ.

Định lượng là một thách thức

Có thể khá khó để dự đoán nhu cầu tài nguyên của các ứng dụng của bạn, điều mà trước đây không phải là mối quan tâm của các nhà phát triển trong môi trường trung tâm dữ liệu truyền thống. Trong môi trường trung tâm dữ liệu truyền thống, tài nguyên thường được cung cấp trước để đảm bảo khả năng đáp ứng nhu cầu cao nhất và tăng trưởng trong tương lai, vì vậy các nhà phát triển không cần tập trung vào việc dự đoán chính xác nhu cầu tài nguyên vì chúng đã được bao phủ bởi dung lượng dư thừa, trong khi trong môi trường đám mây, tài nguyên được tiêu thụ theo yêu cầu. Tìm kiếm sự cân bằng giữa hiệu quả và độ tin cậy thường có thể giống như một hành động cân bằng tinh tế.

Tools sử dụng cho định lượng workload 

Có các tools trong Cloud Monitoring và Giao diện người dùng GKE mà bạn có thể sử dụng để định lượng workloads của mình chạy trên GKE Google Kubernetes Engine.

Định lượng trên giao diện Console

Workload Cost Optimization giúp bạn xác định được workloads có thể được tối ưu hóa bằng cách hiển thị các tài nguyên đang được sử dụng so với những gì được yêu cầu.

Tối đa hóa độ tin cậy, giảm thiểu chi phí: Định lượng kích cỡ Kubernetes Workloads phù hợp 2Để tận dụng khả năng tiết kiệm chi phí, bạn có thể đi sâu vào các cluster để xem các đề xuất hợp lý về workload ở cấp độ tài nguyên.

Để chỉ xem các workload resource được đề xuất cho các đối tượng được Deployment:

  1. Trong GKE Cost Optimization.
  2. Chọn một cluster.
  3. Click Workloads > Cost Optimization.
  4. Chọn một Deployment workloads
  5. Trong trang Workload’s detail, hãy chọn Actions > Scale > Edit Resource Requests

Rightsizing với Cloud Monitoring

Cloud Monitoring cung cấp các chỉ số đề xuất built-in VPA scale mà bạn có thể sử dụng để theo dõi hiệu suất workloads của mình và xác định các cơ hội để định lượng phù hợp cho chúng mà không cần tạo VPA objects.

Tối đa hóa độ tin cậy, giảm thiểu chi phí: Định lượng kích cỡ Kubernetes Workloads phù hợp 3Để xem các chỉ số này:

  1. Chuyển đến Cloud Monitoring > Metric Explore console.
  2. Trong trình Metric dropdown, hãy chọn các metric:
  • Đề xuất bộ nhớ:
    Kubernetes Scale > autoscaler > Recommended per replica request bytes
  • Đề xuất CPU:
    Kubernetes Scale > autoscaler > Recommended per replica request cores

Định lượng để tối ưu

Nếu bạn quan tâm đến việc xem các đề xuất trên các clusters và projects, Google đã tạo một hướng dẫn mà bạn có thể sử dụng ngay hôm nay để giúp bạn right-size your GKE workloads at scale. Giải pháp này tận dụng metric data của cluster ở thực tế và đề xuất tích hợp các built-in workload do Cloud Monitoring cung cấp. Bạn có thể xác định các yêu cầu về tài nguyên cho tất cả workload của mình mà không cần phải tạo thêm các đối tượng VPA autoscaler trong mỗi cluster của mình. Hướng dẫn này sẽ định hướng cho bạn cách triển khai giải pháp.

Tối đa hóa độ tin cậy, giảm thiểu chi phí: Định lượng kích cỡ Kubernetes Workloads phù hợp 4

Tổng kết

Tóm lại, việc định lượng kích cỡ cho workloads của bạn là cần thiết để vừa tiết kiệm chi phí vừa đảm bảo độ tin cậy. Bằng cách làm theo các mẹo trong blog này, bạn có thể đảm bảo rằng workloads của mình đang sử dụng đúng lượng tài nguyên, điều này sẽ giúp bạn tiết kiệm chi phí và tăng độ tin cậy cho workloads của bạn.

Liên kết đến giải pháp được trình bày trong blog này và các tools hữu ích khác để giúp bạn tối ưu hóa cluster của mình được liệt kê bên dưới:

Tải về báo cáo State of Kubernetes Optimization, xem xét các giải pháp chính và theo dõi bài đăng blog tiếp theo của Gimasys & Google!

Trở lại đầu trang
0974 417 099