Dữ liệu đang tăng trưởng với tốc độ chóng mặt, nhưng làm thế nào để…
Google Kubernetes Engine là dịch vụ Kubernetes hàng đầu có khả năng mở rộng cao nhất hiện nay
Google Cloud đang thực hiện sứ mệnh tạo ra nơi tốt nhất để chạy containerized workloads. Điều này bắt đầu từ năm 2014, khi được lấy cảm hứng từ hệ thống quản lý cluster nội bộ của Google,Borg, Google đã phát minh ra Kubernetes và giới thiệu Công cụ Kubernetes của Google (GKE), dịch vụ Kubernetes được quản lý đầu tiên trên thế giới. GKE là dịch vụ Kubernetes hàng đầu có khả năng mở rộng cao nhất hiện tại. Năm 2019, Google đã ra mắt Cloud Run, nền tảng serverless đầu tiên kết hợp lợi ích của container và serverless. Ngày nay, Cloud Run cung cấp một trong những trải nghiệm hàng đầu cho nhà phát triển trong số tất cả các nhà cung cấp đám mây. Google cũng đã mở rộng GKE sang môi trường hybrid và multi-cloud với Anthos vào năm 2019 và giới thiệu chế độ Autopilot trong GKE vào năm 2021. Cuối cùng, năm nay, Google đã mở rộng phạm vi tiếp cận của Anthos với Google Distributed Cloud. Tiếp tục sứ mệnh của mình, năm nay tại Next, Google sẽ công bố ba cải tiến cho các sản phẩm quản lý container của mình:
- Đầu tiên, chúng tôi ra mắt GKE Enterprise, phiên bản cao cấp hơn của GKE. Với GKE Enterprise, các công ty có thể tăng tốc độ giữa nhiều teams, chạy các workloads quan trọng một cách dễ dàng và an toàn, đồng thời giảm tổng chi phí sở hữu bằng các giải pháp được quản lý và tích hợp hoàn toàn từ Google Cloud.
- Thứ hai, đối với các tổ chức đang phát triển các thế hệ ứng dụng AI, GKE hiện hỗ trợ giải pháp tối ưu hóa AI Cloud TPU v5e. Ngoài ra, hỗ trợ cho cả máy ảo A3 với GPU NVIDIA H100 cũng như Cloud Storage FUSE hiện đã có sẵn cho GKE.
- Thứ ba, đối với các teams muốn tận dụng sức mạnh của generative AI để tăng năng suất, Duet AI trong GKE và Cloud Run cung cấp gen AI được đào tạo đặc biệt trên tài liệu của Google để giảm thời gian khởi chạy các ứng dụng trong containerized.
GKE Enterprise: sự phát triển tiếp theo của Kubernetes
GKE Enterprise xây dựng dựa trên sự dẫn đầu của Google Cloud về containers và Kubernetes, kết hợp những ưu điểm tốt nhất của GKE và Anthos vào một container platform được tích hợp và trực quan, với trải nghiệm trên một giao diện console hợp nhất.
Phiên bản GKE Enterprise bao gồm tính năng multi-cluster mới (“fleets”) cho phép các platform engineers dễ dàng nhóm các workloads tương tự thành các clusters chuyên dụng, áp dụng custom cấu hình và rào cản policy cho mỗi fleet, tách biệt workloads nhạy cảm và thậm chí ủy quyền quản lý cluster cho các team khác. GKE Enterprise đi kèm với các tính năng bảo mật được quản lý, bao gồm thông tin chi tiết về lỗ hổng workload nâng cao, kiểm soát policy và quản trị cũng như managed service mesh — tất cả đều dựa trên những gì tốt nhất của hệ sinh thái mã nguồn mở Kubernetes. Và bởi vì GKE Enterprise là một nền tảng được tích hợp đầy đủ và được quản lý hoàn toàn, với bảng điều khiển đơn giản, trực quan, có khả năng quan sát trong ngữ cảnh, khách hàng sẽ tốn ít thời gian và công sức hơn để quản lý nền tảng và có nhiều thời gian hơn để tạo ra các ứng dụng và trải nghiệm tuyệt vời cho khách hàng của mình. Ngoài ra, GKE Enterprise còn bao gồm hybrid và multi-cloud support để bạn có thể chạy container workloads ở mọi nơi – trên GKE, trong các public clouds khác hoặc on-premises với Google Distributed Cloud.
Nói tóm lại, GKE Enterprise giúp các distributed teams chạy nhanh hơn và an toàn hơn ngay cả với business-critical workloads trên quy mô lớn mà không tăng chi phí hoặc số lượng nhân viên. Trong thực tế, GKE Enterprise đang mang lại những kết quả đáng kinh ngạc với khách hàng, cải thiện năng suất của họ lên 45%, đồng thời giảm hơn 70% thời gian triển khai phần mềm.
Nhà cung cấp báo cáo tín dụng Equifax có 14.000 nhân viên trên khắp thế giới và sử dụng GKE để chạy các ứng dụng phân tích và chạy dữ liệu quan trọng đối với hoạt động của mình. Là người đầu tiên áp dụng các khả năng multi-cluster và multi-team mới trong GKE Enterprise, Equifax rất vui mừng về tình trạng bảo mật và cải thiện hiệu quả mà nó mang lại cho họ.
“Google Kubernetes Engine là nền tảng cơ cấu dữ liệu toàn cầu của Equifax và giúp khách hàng Equifax trên toàn thế giới có được nguồn tài chính tốt nhất. Với phiên bản GKE Enterprise, chúng tôi có thể quản lý hiệu quả hàng trăm cluster bằng cách sử dụng fleets để đảm bảo tính nhất quán trong hoạt động ở mọi nơi. Phiên bản GKE Enterprise đã cho phép chúng tôi mở rộng quy mô nhanh chóng với các biện pháp kiểm soát quản trị và bảo mật mạnh mẽ, đồng thời đáp ứng các yêu cầu về cấp độ dịch vụ của khách hàng trong khi vẫn giảm chi phí.” -Vipul Mapara, Thành viên Equachus và Lãnh đạo SRE, Equachus
Phiên bản GKE Enterprise sẽ có bản preview vào đầu tháng 9. Để enable các khả năng của nó, vui lòng liên hệ với account manager của bạn. Ngoài ra, bạn có thể làm việc với các partners là Accenture, CDW, Deloitte, DoiT International, SADA, Searce, và 66 degrees để bắt đầu.
Hỗ trợ TPU trong GKE: chất xúc tác cho sự thành công của AI
Hầu hết mọi tổ chức đều đã sử dụng hoặc có kế hoạch sử dụng AI để tăng tốc hoạt động kinh doanh của họ. Sự phát triển vượt bậc trong lĩnh vực machine learning được phản ánh qua cách khách hàng sử dụng sản phẩm của chúng tôi: Ngày nay, 15 khách hàng GKE lớn nhất đã sử dụng nó để hỗ trợ AI workloads của họ. Trên thực tế, trong năm qua, việc sử dụng GPU với GKE đã tăng gấp đôi.
Khi các tổ chức phát triển và triển khai các mô hình AI lớn hơn, họ cần nhiều sức mạnh compute hơn và các bộ AI accelerators tiết kiệm chi phí hơn. Các new Cloud TPU v5e có thể mở rộng tới hàng chục nghìn con chip, khiến nó trở nên lý tưởng để phát triển các mô hình AI phức tạp hơn. Cloud TPU v5e đạt được hiệu suất training cao hơn tới 2 lần và hiệu suất inference trên mỗi đô la cao hơn tới 2,5 lần đối với Large Language Models (LLMs) và gen AI models so với Cloud TPU v4. Việc chạy Cloud TPU workloads trên GKE cho phép bạn tận dụng các tính năng mạnh mẽ mà nhiều khách hàng thành công nhất của chúng tôi tin dùng, chẳng hạn như tự động điều chỉnh quy mô, điều phối workload và hỗ trợ lên tới 15.000 cụm nút.
Grammarly cung cấp AI writing assistance miễn phí do Google Cloud cung cấp và đã bắt đầu thử nghiệm TPU cùng với GKE.
“Trong nghiên cứu của chúng tôi về large language model alignment, Grammarly đã sử dụng sức mạnh của Google Cloud, TPU và JAX. Chúng tôi rất ấn tượng bởi hiệu suất vượt trội, sự mạnh mẽ và độ tin cậy của nền tảng, vượt trội so với nhiều dịch vụ tương tự mà chúng tôi đã đánh giá.” -Max Gubin Engineering Director, Intelligence, Grammarly
Việc chạy workloads của bạn trong GKE giúp save on valuable compute cycles bằng cách mở rộng quy mô khi nhu cầu tăng và giảm quy mô khi nhu cầu giảm. Bạn chỉ trả tiền cho các tài nguyên TPU mà bạn đã cung cấp, vì vậy GKE giúp bạn dễ dàng trì hoãn việc phải sử dụng TPU được cung cấp cho đến khi cần và tắt chúng một cách dễ dàng.
Ngoài việc hỗ trợ TPU, GKE còn bổ sung hỗ trợ GA cho máy ảo A3 với GPU NVIDIA H100, điều này có thể hoàn hảo nếu bạn đang training cho các models lớn.
Cuối cùng, Google Cloud Storage FUSE có sẵn trên GKE. Vì vậy, nếu workloads của bạn tìm nạp dữ liệu phi cấu trúc – có thể là workloads TensorFlow, PyTorch, Ray hoặc Spark – thì giờ đây bạn có thể chuyển những workloads đó sang GKE mà không thay đổi cách bạn truy cập dữ liệu của mình.
Duet AI trong GKE và Cloud Run: làm việc năng suất và hiệu quả hơn
Nhu cầu về cloud skills vượt xa tài năng sẵn có. Tại Google Cloud, chúng tôi mong muốn giúp operations và platform engineering team đạt được mức tăng năng suất và thực hiện những ý tưởng có sức ảnh hưởng lớn nhất. Đầu năm nay, chúng tôi đã giới thiệu Duet AI in Google Cloud – cộng tác viên always-on AI của bạn được hỗ trợ bởi các mô hình nền tảng AI thế hệ hiện đại của Google – để giúp người dùng Google Cloud hoàn thành nhiệm vụ một cách hiệu quả và năng suất hơn. Và hôm nay, chúng tôi rất vui mừng được giới thiệu Duet AI trong runtimes của chúng tôi, bao gồm GKE và Cloud Run. Duet AI giúp platform teams chạy containers của họ trên Google Cloud giảm phần lớn công việc thủ công, các công việc lặp đi lặp lại mà họ gặp phải hàng ngày. Duet AI trong GKE và Cloud Run hiện có sẵn ở bản preview.
Enabling a container-first world
Chúng tôi cam kết cung cấp nơi tốt nhất để vận hành container. Những bổ sung mới này được xây dựng dựa trên những cải tiến gần đây giúp khách hàng dễ dàng mở rộng quy mô workloads bằng containers, cho dù bằng Cloud Run hay GKE hay cả hai. Ví dụ: với những cải tiến gần đây như tích hợp Cloud Run-Eventarc, các phương tiện truyền thông tin tức như BBC sử dụng Cloud Run để xử lý lưu lượng truy cập tăng đột biến, mở rộng quy mô từ 150 – 200 container instances lên hơn 1.000 trong vòng chưa đầy một phút và phục vụ cho hơn 498 triệu người lớn mỗi tuần. Chúng tôi cũng tập trung vào việc cung cấp cho khách hàng những lựa chọn. Một số tổ chức di chuyển workloads giữa GKE và Cloud Run. Các tổ chức khác như Carrefour tận dụng cả GKE và Cloud Run cùng nhau để chạy các ứng dụng thương mại điện tử mới. Cuối cùng, đối với các công ty viễn thông như Orange với các yêu cầu về quy định và chủ quyền, chúng tôi đã mở rộng GKE sang các môi trường hybrid với Google Distributed Cloud.
Chúng tôi đã đi được một chặng đường dài kể từ năm 2014, từ việc hỗ trợ các ứng dụng web đến cho phép khách hàng tận dụng cloud và containers để chạy các ứng dụng quan trọng trong kinh doanh, do AI điều khiển nhằm chuyển đổi hoạt động kinh doanh của họ. Ngày nay, hơn bao giờ hết, workloads của bạn có vô số khả năng và chúng tôi rất mong được hợp tác với bạn trên hành trình chuyển đổi số của bạn.
Để biết thêm thông tin chi tiết về sản phẩm hoặc cần hỗ trợ về mặt chuyên môn kỹ thuật, bạn có thể liên hệ Gimasys – Premier Partner của Google tại Việt Nam theo thông tin:
- Hotline: 0974 417 099 (HCM) | 0987 682 505 (HN)
- Email: gcp@gimasys.com
Nguồn: Gimasys