よくわかるAWS・クラウド

  • よくわかるクラウド
  • AWS
  • 運用

インフラ担当者の業務負荷軽減のためにAWSで活用すべき運用自動化機能

システムインフラをオンプレミスからAmazon Web Services(AWS)へ移行したものの、運用管理の業務負荷は一向に軽減しない――そんな悩みを抱えるインフラ運用管理担当エンジニアは少なくありません。そこで検討したいのが、インフラ運用の自動化です。AWSには、複数の運用自動化機能が用意されており、それらを有効に活用することが課題解決の近道です。今回は、AWSの運用自動化機能を紹介するとともに、導入前にどのようなことに注意すべきかお話します。

インフラ担当の悩みの種とは?

インフラの運用管理を担当するエンジニアは、日々さまざまな業務をこなしています。ネットワークのトラフィック量やサーバーのCPU/メモリ使用率、ストレージのデータ容量などの稼働監視をはじめ、許容範囲を超えた際の負荷分散・拡張、性能が低下した際のチューニング、回線/機器の障害対応・調査・復旧、ストレージ/データベースのバックアップ、バッチ処理など定型業務のジョブ管理といったように、ネットワークやサーバー周辺の業務だけでもたくさんあります。場合によっては、ユーザー/デバイスのID管理、ハードウェア/ソフトウェアの資産管理、クライアントPC/モバイルデバイスのライフサイクル管理、さらにはシステム/ネットワークのセキュリティ運用管理を担当することもあります。

これらをすべて手作業でこなしていたのでは、インフラ担当エンジニアの業務負荷は増えるばかりです。負荷が限界を超えてしまうと、監視の目が行き届かなくなって障害の発見が遅れたり、オペレーションミスなどのヒューマンエラーが発生したりといった不慮の事態を招くことも考えられます。

実はこうしたインフラ担当者の業務負荷は、オンプレミスもクラウドも大きな差はありません。もちろんクラウドであれば、ハードウェアインフラの稼働監視や老朽化に伴う定期的な更改が不要になり、ある程度の業務負荷軽減が見込めます。しかしクラウド上で提供されているネットワーク、仮想サーバー、ストレージでも稼働監視は欠かせないなど、日常的にやるべき作業はほとんど変わらないのです。

自動化で得られるメリットと注意すべきポイント

こうしたインフラ担当者の業務負荷を軽減するには、運用業務の「自動化」が欠かせません。
自動化で人の手から離れることによりヒューマンエラーを軽減させることができます。例えば設定ミスやサーバーの操作ミスなど、ほとんどのインシデントは人が起因しているといっても過言ではないため、運用自動化を実現することで、これらの人的ミスを限りなく減らせます。さらには工数も削減されるためインフラ担当者の業務負担軽減も実現します。

また運用自動化によって削減できたリソースをキャリアアップや本業への集中に回せるようになります。そのためビジネスの成長を考えたうえでは、自動化できる業務をどんどん増やしていくのが良いでしょう。加えて、定例オペレーションに従事していた人員の削減も可能となるため、コストメリットの追及にもアプローチできるようになります。このように運用自動化によって、運用リソースとコストが最小化されることで、「攻めのIT」を推進しやすくなるのです。

運用を自動化する前にはオペレーションの自動化が可能かどうかを検証する必要があります。もちろん、機械的に判断できるものは、業務負担軽減のためにも自動化に置き換えるべきです。ただし、部署によって判断が変わってくる、時期によって判断が変わってくるなど、機械的な判断が難しいタスクには自動化を適用すべきではありません。また、自動化が失敗した場合にリカバリー可能かどうかというセーフティーネットも検討する必要があります。
これらのポイントを踏まえつつ、運用自動化を実現することでさまざまなメリットを享受できるようになります。

インフラ担当の業務負荷軽減を実現するAWSの機能群とは

Amazon Web Services(AWS)では、システム運用管理を自動化する数多くの機能が提供されています。今回は主にAmazon EC2を利用している場合に活用してほしい機能をご紹介します。

その代表的な機能が「AWS Systems Manager(SSM)」です。SSMは、EC2インスタンスをはじめ、AWS全体を対象にした運用管理機能を豊富に備えたツールセットです。アプリケーションなどさまざまな単位のリソースをグループ化して可視化し、AWSクラウドの定型処理を自動実行したりスケジュール制御したりする機能を提供します。AWSだけでなく、オンプレミス環境のシステムインフラもまとめて統合管理できるという特長もあります。

AWSの稼働状況を監視するモニタリングサービス「Amazon CloudWatch」にも、障害対応・復旧を自動化する機能が含まれています。その一つに「Auto Recovery(インスタンス復旧)」と呼ばれる機能があり、これは、AWS基盤側の障害によってEC2インスタンスが起動できなくなった場合に自動復旧するというものです。また、CloudWatch上で定義したEC2メトリックス情報(ステータスやCPU使用率など)のしきい値を超えた際のアクション(インスタンス操作や通知など)を自動化できる「CloudWatch Alarm」という機能も用意されています。

関連記事:Amazon CloudWatch入門、logs、events、アラームの機能や料金について解説

このほか、AWSリソースを評価・監査する「AWS Config」というサービスもあります。これを利用すると、AWSリソースが継続的にモニタリング・記録され、正常な設定かどうかを自動的に評価してくれます。さらに、AWS Configの一機能であるAWS Configルールを利用することで、AWSリソースの設定がルールに準拠しているかどうかをチェックでき、さらにAWS Systems Managerを利用することでAWS Configルールで評価されている非準拠リソースの自動修復が可能になります。

加えて、AWSリソースに対する操作を記録するイベント監視ツール「AWS CloudTrail」と統合することで、AWS Configで変更が検知されたときに、それが「いつ」「誰に」よって変更されたのかを追えるようになるため、セキュリティインシデントの特定ができるようになります。

関連記事:【AWS入門】AWS ConfigとはAWSリソース管理のルールを設定し、評価・監査・審査できるサービス

一方、AWSリソース内のデータ保護を一元化・自動化するのに有効なのが「AWS Backup」です。このサービスはあらかじめ設定したポリシーにより、EC2インスタンス、EBSボリューム、RDSデータベースなどのデータをバックアップします。バックアップスケジュール、保存管理、ライフサイクル管理などが自動化できるので、自社の要件に合わせたBCP対策に有効です。

アプリケーションの可用性を維持するという観点で役立つのが「AWS Auto Scaling」です。このサービスは、Webアプリケーションをモニタリングし、需要に応じてEC2 インスタンスを自動的に追加または削除するものです。普段はサーバーの数を減らしてコストを抑え、Webサービスへのアクセス集中などがあったときには自動的にサーバーの数を増やしてサービス提供を継続するといった使い方ができます。これにより、耐障害性や可用性の向上が実現します。

NHNテコラスの知識とノウハウを生かした導入・運用支援サービス

AWSの運用自動化機能を適切に導入して利用するには、AWS運用に関する専門的な知識が求められます。そこで検討したいのが、AWSに関する知識とノウハウが豊富なシステムインテグレーターによる導入・運用支援サービスです。
NHNテコラスのAWS活用支援サービス「C-Chorus」では、AWSの運用自動化機能を取り入れた導入・運用支援を行っています。EC2の運用自動化に特化した「監視・自動復旧サービス」を利用すれば、24時間365日体制でEC2インスタンスを監視し、障害検知から復旧対応までの作業を自動化します。監視設定や変更をNHNテコラスが代行することも可能です。インフラ担当エンジニアが夜間や休日に監視する必要もなくなり、運用負荷とコストを大幅に削減するという効果が得られます。1インスタンスあたり月額5,000円というリーズナブルな料金で提供しているので、AWSの運用自動化の入口として導入を検討してみてはいかがでしょうか。

AWSの導入、運用、コスト削減でお困りですか?

AWSの活用支援サービスC-Chorus

オススメのAWS代行サービス C-Chorus
・自社に合わせた最適な代行サービスが選択できる
・豊富な運用実績
・AWSの認定資格をもったエンジニアが対応

おすすめのサービス

おすすめの記事

おすすめのカテゴリ