Dữ liệu đang tăng trưởng với tốc độ chóng mặt, nhưng làm thế nào để…
Cách thức tối ưu hóa chi phí và giá trị trên Google Cloud
Trong bối cảnh không ngừng phát triển ngày nay, mặc dù lợi ích của cloud rất dễ nhận ra, nhưng bản chất việc kiểm soát chi phí cho nền tảng cloud có thể là một thách thức. Nền tảng cloud từ Google hỗ trợ kiểm soát chi phí sử dụng một cách linh hoạt nhưng không phải ai cũng có thể tối ưu chi phí sử dụng một cách hiệu quả. Vì lý do đó, doanh nghiệp cần nắm vững cách tối ưu hóa chi phí sử dụng Google Cloud để mở ra các cơ hội kinh doanh có giá trị và hiệu quả để thúc đẩy các tổ chức phát triển.
Vì sao lại cần tối ưu hóa chi phí sử dụng Google Cloud?
Google cung cấp một loạt các công cụ gốc trên nền tảng để giúp doanh nghiệp theo dõi, quản lý và tối ưu hóa chi tiêu của Google Cloud Platform. Các công cụ gốc của Google có thể quản lý việc triển khai, cảnh báo bạn về các lỗi cơ sở hạ tầng và cung cấp khả năng hiển thị các yếu tố làm tăng chi phí. Thậm chí nó còn cho bạn biết khi nào một phiên bản VM đang được sử dụng kém hiệu quả để bạn có thể lựa chọn một cấu hình phù hợp hơn.
Tuy nhiên, nhiều doanh nghiệp gặp khó khăn trong việc tối ưu hóa môi trường Google Cloud của họ do mọi thứ thay đổi rất nhanh trên cloud. Vì vậy, mặc dù môi trường Google Cloud của bạn có thể ở trạng thái được tối ưu hóa sau khi bạn đã sử dụng tất cả các công cụ có sẵn để tối ưu hóa chi phí sử dụng Google Cloud Platform, nhưng khả năng là một tuần, tháng hoặc quý sau, chi phí sẽ lại một lần nữa tăng lên đến mức vượt kiểm soát và bạn sẽ phải thực hiện lại quá trình tối ưu hóa.
Cách tối ưu chi phí khi sử dụng Google Cloud là gì?
1. Tìm hiểu các công cụ lập hóa đơn và quản lý chi phí
Do tính chất thay đổi theo yêu cầu của việc sử dụng cloud, chi phí có khả năng tăng lên nếu bạn không theo dõi chúng chặt chẽ. Khi bạn hiểu chi phí của mình, bạn có thể bắt đầu thực hiện các biện pháp kiểm soát và tối ưu hóa chi tiêu của mình. Để trợ giúp việc này, Google Cloud cung cấp một bộ công cụ quản lý chi phí và lập hóa đơn miễn phí mạnh mẽ có thể mang đến cho bạn khả năng hiển thị và thông tin chi tiết cần thiết để theo kịp việc triển khai cloud của mình.
Để bắt đầu, tổ chức và cấu trúc chi phí của bạn phù hợp với nhu cầu kinh doanh của doanh nghiệp. Sau đó, đi sâu vào các dịch vụ sử dụng tính năng Billing reports để xem nhanh chi phí của bạn. Bạn cũng nên tìm hiểu cách phân bổ chi phí lại cho các phòng ban hoặc nhóm bằng cách sử dụng labels và tạo custom dashboards của riêng bạn để có thể xem chi phí chi tiết hơn. Bạn cũng có thể sử dụng quotas, budgets, and alerts để giám sát chặt chẽ xu hướng chi phí hiện tại của bạn và dự báo chúng theo thời gian, để giảm nguy cơ tăng ngân sách chi.
2. Chỉ trả tiền cho tài nguyên bạn cần
Hiện tại khi bạn đã có khả năng hiển thị chi tiết các chi phí trên cloud của mình, đã đến lúc đánh giá lại các dự án tốn kém nhất của bạn để xác định các tài nguyên tính toán không cung cấp đúng giá trị kinh doanh.
Xác định các VM (và các ổ đĩa) không sử dụng:
Cách dễ nhất để giảm chi phí vận hành Google Cloud Platform (GCP) là loại bỏ các tài nguyên không còn được sử dụng. Hãy nghĩ về những dự án proof-of-concept (POC) đã bị tước quyền sử dụng, hoặc những VM bị lãng quên khi không còn cần thiết mà chẳng ai thèm xóa. Google Cloud cung cấp một số Recommenders có thể giúp bạn tối ưu hóa các tài nguyên này, bao gồm một idle VM recommender xác định các máy ảo không hoạt động (VM) và các persistent disks dựa trên các chỉ số sử dụng.
Tuy nhiên, hãy luôn cẩn thận khi xóa VM. Trước khi xóa một tài nguyên, hãy tự hỏi, “việc xóa tài nguyên này sẽ có tác động tiềm ẩn gì và tôi có thể tạo lại nó như thế nào nếu cần?” Xóa các instances sẽ loại bỏ các disks bên dưới và tất cả dữ liệu của nó. Một phương pháp hay nhất là snapshot instances trước khi xóa nó. Ngoài ra, đơn giản hơn bạn có thể chọn dừng VM, thao tác này kết thúc instance, nhưng vẫn giữ các tài nguyên như các disks hoặc địa chỉ IP cho đến khi bạn tách hoặc xóa chúng.
Lên lịch để các VM tự động khởi động và dừng hoạt động:
Lợi ích của một nền tảng như Compute Engine là bạn chỉ phải trả tiền cho các tài nguyên máy tính mà bạn sử dụng. Hệ thống sản xuất (Production systems) có xu hướng chạy 24/7; tuy nhiên, VMs trong môi trường phát triển, thử nghiệm hoặc cá nhân có xu hướng chỉ được sử dụng trong giờ làm việc và việc tắt chúng đi có thể giúp bạn tiết kiệm rất nhiều tiền! Ví dụ: một VM chạy trong 10 giờ mỗi ngày, từ Thứ Hai đến Thứ Sáu, chi phí chạy mỗi tháng ít hơn 75% so với để nó chạy xuyên suốt.
Rightsize VMs:
Trên Google Cloud, bạn đã có thể tiết kiệm đáng kể bằng cách tạo custom machine type với số lượng CPU và RAM phù hợp để đáp ứng nhu cầu của mình. Nhưng yêu cầu về khối lượng công việc có thể thay đổi theo thời gian. Các phiên bản trước đây từng được tối ưu hóa giờ đây có thể phục vụ ít người dùng và lưu lượng truy cập hơn. Để tối ưu, rightsizing recommendations có thể chỉ cho bạn cách giảm kích thước machine type một cách hiệu quả dựa trên những thay đổi về vCPU và mức sử dụng RAM. Quá trình này được tạo bằng cách sử dụng các chỉ số hệ thống do Cloud Giám sát thu thập trong 8 ngày trước đó.
Tận dụng preemptible VMs:
Preemptible VMs là các phiên bản máy tính có giá cả phải chăng, hoạt động đến 24 giờ và rẻ hơn đến 80% so với các phiên bản thông thường. Preemptible VMs phù hợp cho các khối lượng công việc có khả năng tiếp tục hoạt động mà không bị gián đoạn khi một hoặc nhiều thành phần của nó gặp sự cố. Ví dụ như dữ liệu lớn, hệ gen, chuyển mã media, mô hình tài chính và mô phỏng. Bạn cũng có thể sử dụng kết hợp các phiên bản thường và phiên bản preemptible để hoàn thành khối lượng công việc đòi hỏi nhiều tính toán nhanh hơn và tiết kiệm chi phí, bằng cách thiết lập một nhóm phiên bản được quản lý chuyên biệt.
Tối ưu hóa chi phí và hiệu suất Cloud Storage
Khi bạn chạy hệ thống quản lý dữ liệu truyền thống, dung lượng lưu trữ có xu hướng bị mất đi trong tổng thể chi phí cơ sở hạ tầng, khiến việc quản lý chi phí phù hợp trở nên khó khăn hơn. Nhưng trong cloud, nơi bộ lưu trữ được lập hóa đơn như một hạng mục riêng biệt, và khi bạn chú ý đến việc sử dụng và cấu hình dung lượng có thể giúp tiết kiệm đáng kể chi phí.
Và nhu cầu lưu trữ cũng luôn thay đổi. Lớp lưu trữ mà bạn đã chọn khi thiết lập môi trường lần đầu có thể không còn phù hợp với khối lượng công việc nhất định. Ngoài ra, Storage Storage đã được sử dụng từ lâu và hiện tại đang cung cấp rất nhiều tính năng mới chưa từng có so với cách đây một năm.
Nếu bạn đang muốn tiết kiệm bộ nhớ, thì đây là một số phần cần xem xét.
Các lớp lưu trữ:
Cloud Storage cung cấp nhiều lớp lưu trữ — standard, nearline, coldline và archival, tất cả đều có chi phí khác nhau và các trường hợp sử dụng phù hợp nhất của riêng chúng. Nếu bạn chỉ sử dụng lớp standard, có thể đã đến lúc xem xét khối lượng công việc của bạn và đánh giá lại tần suất dữ liệu của bạn đang được truy cập. Nhiều công ty sử dụng lưu trữ lớp standard cho mục đích archival và có thể giảm chi tiêu của họ bằng cách tận dụng lưu trữ lớp nearline hoặc coldline. Và trong một số trường hợp, nếu bạn đang giữ các đối tượng cho các trường hợp sử dụng cold-storage như legal discovery, thì lớp archival mới có thể tiết kiệm hơn nữa.
Lifecycle policies
Bạn không chỉ tiết kiệm tiền bằng cách sử dụng các lớp lưu trữ khác nhau mà còn có thể làm cho nó diễn ra tự động với tính năng quản lý vòng đời đối tượng. Bằng cách định cấu hình lifecycle policy, bạn có thể lập trình thiết lập một đối tượng để điều chỉnh lớp lưu trữ của nó dựa trên một tập hợp các điều kiện — hoặc thậm chí xóa hoàn toàn nếu không còn cần thiết. Ví dụ: hãy tưởng tượng bạn và nhóm của mình phân tích dữ liệu trong tháng đầu tiên khi dữ liệu được tạo; ngoài ra, bạn chỉ cần nó cho các mục đích quy định. Trong trường hợp đó, chỉ cần đặt một chính sách điều chỉnh bộ nhớ của bạn thành coldline hoặc archive sau khi đối tượng đạt 31 ngày.
Deduplication:
Một nguồn lãng phí phổ biến khác trong môi trường lưu trữ là dữ liệu bị trùng lặp. Tất nhiên, có những lúc cần thiết. Ví dụ: bạn có thể muốn sao chép một tập dữ liệu trên nhiều vùng địa lý để các nhóm có thể truy cập nó một cách nhanh chóng. Tuy nhiên, theo kinh nghiệm khi làm việc với khách hàng, rất nhiều dữ liệu trùng lặp là kết quả của việc kiểm soát phiên bản lỏng lẻo. Kết quả là các bản sao có thể chiếm dung lượng và tốn kém để quản lý.
May mắn là có rất nhiều cách để ngăn dữ liệu trùng lặp, cũng như các công cụ để ngăn dữ liệu bị xóa do nhầm lẫn.
- Nếu bạn đang cố gắng duy trì khả năng phục hồi dữ liệu, bạn có thể sử dụng multi-region bucket hơn là tạo nhiều bản sao trong các nhóm khác nhau. Với tính năng này, bạn sẽ kích hoạt chức năng sao lưu dự phòng (Geo-redundant) cho các đối tượng được lưu trữ. Điều này sẽ đảm bảo dữ liệu của bạn được sao chép một cách không đồng bộ trên hai hoặc nhiều vị trí.
- Bạn có thể thiết lập object versioning policies để đảm bảo bạn có số lượng bản sao thích hợp. Nếu vẫn lo lắng một bản sao là không đủ để lưu trữ phòng trường hợp bị mất, bạn có thể cân nhắc sử dụng tính năng bucket lock, giúp đảm bảo rằng các mục không bị xóa trước một ngày hoặc giờ cụ thể.
Điều chỉnh kho dữ liệu của bạn
Các doanh nghiệp thuộc mọi quy mô đều tìm đến BigQuery để có phương pháp phân tích dữ liệu hiện đại. Tuy nhiên, một số cấu hình đắt hơn những cấu hình khác. Hãy kiểm tra nhanh môi trường BigQuery của bạn và thiết lập một số bảo vệ để giúp bạn giảm chi phí.
Thực thi kiểm soát:
Để giới hạn chi phí query, hãy sử dụng cài đặt maximum bytes billed. Vượt quá giới hạn sẽ khiến truy vấn không thành công, nhưng bạn cũng sẽ không bị tính phí cho điều đó, như hình minh họa bên dưới.
Cùng với việc bật kiểm soát chi phí ở cấp độ query, bạn cũng có thể áp dụng logic tương tự cho người dùng và dự án.
Sử dụng phân vùng và phân cụm:
Một lợi ích của phân vùng là BigQuery tự động giảm giá dữ liệu được lưu trữ xuống 50% cho mỗi phân vùng hoặc bảng chưa được chỉnh sửa trong 90 ngày, bằng cách chuyển dữ liệu đó vào bộ nhớ lâu dài. Việc lưu giữ dữ liệu của bạn trong BigQuery sẽ tiết kiệm chi phí và thuận tiện hơn thay vì phải di chuyển dữ liệu vào bộ nhớ cấp thấp hơn. Không có sự suy giảm về hiệu suất, độ bền, tính khả dụng hoặc bất kỳ chức năng nào khác khi bảng hoặc phân vùng được chuyển đến nơi lưu trữ lâu dài.
Kiểm tra các streaming inserts:
Bạn có thể tải dữ liệu vào BigQuery theo hai cách: dưới dạng batch load hoặc phát trực tuyến theo thời gian thực, sử dụng streaming inserts. Khi tối ưu hóa chi phí BigQuery, điều đầu tiên cần làm là kiểm tra hóa đơn của bạn và xem liệu bạn có bị tính phí cho các lần streaming inserts hay không. Và nếu có, hãy tự hỏi: “Tôi có cần dữ liệu có sẵn ngay lập tức (giây thay vì hàng giờ) trong BigQuery không?” và “Tôi có đang sử dụng dữ liệu này cho bất kỳ trường hợp sử dụng thời gian thực nào sau khi dữ liệu có sẵn trong BigQuery không?” Nếu câu trả lời cho một trong hai câu hỏi này là không, thì chúng tôi khuyên bạn nên chuyển sang dữ liệu batch load, và nó miễn phí.
Sử dụng Flex Slots:
Do các yêu cầu kinh doanh thay đổi nhanh chóng, Google đã giới thiệu Flex Slots, một cách mới để mua các vị trí BigQuery với thời lượng ngắn nhất là 60 giây, bên cạnh các cam kết tỷ lệ cố định hàng tháng và hàng năm. Với sự kết hợp giữa định giá theo yêu cầu và tỷ lệ cố định này, bạn có thể đáp ứng nhanh chóng và tiết kiệm chi phí trước sự thay đổi của nhu cầu phân tích.
Lọc gói mạng
Trên thực tế, Google Cloud đi kèm với một số công cụ có thể cung cấp cho bạn khả năng hiển thị về lưu lượng mạng của mình (và theo đó là chi phí). Ngoài ra, bạn có thể thực hiện một số thay đổi cấu hình nhanh chóng để giảm chi phí mạng của mình.
Các cấp dịch vụ mạng:
Google Cloud cho phép bạn chọn giữa hai cấp dịch vụ mạng: cao cấp và tiêu chuẩn. Để có hiệu suất tuyệt vời trên toàn cầu, bạn có thể chọn cấp cao cấp, đây vẫn luôn là cấp mà Google Network chọn. Bậc tiêu chuẩn cung cấp hiệu suất thấp hơn, nhưng có thể là sự thay thế phù hợp cho một số khối lượng công việc ưu tiên về chi phí.
- Cloud Logging: Có thể bạn không biết, nhưng bạn có quyền kiểm soát khả năng hiển thị lưu lượng mạng bằng cách lọc ra các nhật ký mà bạn không cần nữa. Kiểm tra một số ví dụ phổ biến về nhật ký mà bạn có thể loại trừ một cách an toàn. Điều tương tự cũng áp dụng cho Data Access audit logs, thứ mà có thể khá lớn và phải chịu thêm chi phí.
Qua các cách nhằm tối ưu hoá chi phí sử dụng Google Cloud, doanh nghiệp có thể tự trang bị cho mình những cấu hình tùy chỉnh theo nhu cầu kinh doanh và mục đích sử dụng. Việc tối ưu hóa chi phí sử dụng có thể giúp chủ động phân bổ chi phí đầu tư để sở hữu những tài nguyên phục vụ hiệu quả cho việc phát triển doanh nghiệp mình.
Liên hệ Gimasys – Google Cloud Premier Partner tài Việt Nam để được tư vấn chiến lược chuyển đổi lên Cloud phù hợp,tối ưu chi phí nhất với tình hình thực tế doanh nghiệp của bạn và trải nghiệm miễn phí dịch vụ Google Cloud Platform:
- Hotline: Hà Nội: 0987 682 505 – Hồ Chí Minh: 0974 417 099
- Email: gcp@gimasys.com