SRE は、信頼性の高い本番環境システムを実行するための職務、マインドセット、エンジニアリング手法のセットです。Google Cloud では、ツールやプロフェッショナル サービスなどのリソースを通じて、SRE の原則を実装できるよう支援しています。
利点
スピードのメリットを引き出す
コードの記述から本番環境でのサービスの実行まで、エンドツーエンドの自動化を実現します。開発と運用を共通の目標に合わせて調整し、高速化します。卜イルを最小限に抑えながら、インシデント管理などの使い慣れたツールに接続できます。
実績のある SRE の原則に従って信頼性を向上
Google が開発し、大規模な運用が実証された SRE の原則を利用できます。Google Cloud のオブザーバビリティで SRE のベスト プラクティスを簡単に実装して、問題解決の迅速と信頼性の向上を実現できます。
SRE 導入のどの段階にいても Google が支援
会社の規模や業種、また VM、Kubernetes、サーバーレスのいずれを使用しているかにかかわらず、ソフトウェア デリバリーを向上させます。無料ツールや有料サービスから選択して、SRE の構築をすぐに開始できます。
主な機能
使い慣れたツールとの統合機能が組み込まれているため、インシデントを迅速にトラブルシューティングできます。段階的なロールアウトを実装し、変更を安全にロールバックします。Cloud Build との事前構築された統合を利用して、アーティファクトを Google Kubernetes Engine、App Engine、Cloud Functions、Firebase、Cloud Run に対して、CI / CD の一部として構築、テスト、デプロイできます。
ログ、イベント、指標、SLO をまとめた 1 つのビューを表示できます。Google Kubernetes Engine、Cloud Run、Compute Engine、Anthos、その他のランタイムのサービス コンソール内で、インコンテキスト オブザーバビリティ データを取得できます。設定なしで指標、トレース、ログを収集できます。1 秒未満の取り込みレイテンシと 1 秒あ���りテラバイトの取り込み速度により、リアルタイムのログ管理と大規模な分析を実行できます。
プロセス全体を通じて実践的なサポートを受けたい場合は、Google コンサルティング サービスなどの追加サービスをご検討ください。お客様の組織に適したオプションについては、営業担当者にお問い合わせください。Google の CRE チームとお客様の成功事例から、Google Cloud のツールとプラクティスが他の企業における SRE の実装にどのように役立っているかをご確認ください。
OpenTelemetry(OT)パッケージと Google エクスポータを使用することで、デベロッパーはトレースデータを Cloud Trace にインストゥルメント化してエクスポートできます。新しい統合 Ops エージェント(プレビュー中)は、指標とログを収集するとともに、OpenTelemetry をサポートして、指標の取得と転送を行います。Google では、多くのクラウド プロダクトに、OT ライブラリをすぐに使用できる機能として実装する作業を進めています。Cloud SQL Insights はこの取り組みの一例です。
導入事例
ドキュメント
サービスをモニタリングするには、サービスレベル目標(SLO)が少なくとも 1 つ必要です。 Cloud Monitoring で最初の SLO を作成する方法を順を追って確認します。
Google Cloud のオブザーバビリティで SLO を定義して保護し、Google Cloud で実行されているアプリケーションのオブザーバビリティを向上させる方法を学習します。
このコースでは、サービスレベル目標(SLO)の理論について説明します。SLO とは、目標とするサービスの信頼性を記述および測定するための、原則的な方法です。
このコースでは、Google の SRE の主な手法を紹介し、SRE の組織的な導入を成功させるうえで IT リーダーとビジネス リーダーが果たす重要な役割について説明します。
最新情報
Google Cloud のニュースレターにご登録いただくと、プロダクトの最新情報、イベント情報、特典のお知らせなどが配信されます。