クラウドで見過ごされがちな 可用性の課題と事業継続の勘所

7-E
クラウドで見過ごされがちな
可用性の課題と事業継続の勘所
~海外の災害対策事例付き~
2013/11/14
日本電気株式会社
システムソフトウェア事業部
佐藤 陽一
クラウドのメリットと課題
Page 2
クラウド環境の利用目的




Page 3
コスト削減
ビジネスの変動に素早く対応
ECO(省電力化)
評価/テスト環境用途
前提
クラウドで見過ごされがちな留意点
クラウドであっても、物理サーバは存在する
DBサーバ
メールサーバ
ゲストOS
ゲストOS
仮想マシン
仮想マシン
物理サーバ
ヒトが作った機械が介在する以上、絶対落ちないシステムはあり得ません!
Page 4
可用性への考慮が足りないと・・・
▐ システム停止による影響例
企業活動への影響例
業種
システム停止による影響例
金融業
•市場経済活動の停止による、大きな社会的影響
•社会的信用の失墜
製造業
•生産活動の停止に伴う経済的損失
•元請・下請企業への影響とそれにともなう信用の失墜
•機会損失
流通業
•販売活動の停止による経済的損失
•社会的信用の失墜
業務別に見る影響例
業務
システム停止による影響例
メールシステム
•社内・顧客との情報伝達の効率低下による
営業活動への影響
生産システム
•生産活動停止による、期間損失
•納期遅延による、CS低下
受発注システム
•生産活動の停止による機会損失
•受注作業の停止による機会損失・顧客からの信用失墜
ファイルサーバ
•共有ファイルへのアクセスができないことによる作業等の停
滞
▐ 最悪の事態
 顧客への損害賠償
 政府による行政指導
・・・
情報システムの停止は、自社ビジネスへの影響はもちろん、他企業や
社会へも影響を与え、経営へのダメージは計り知れません。
Page 5
クラウド事業者が提供する解決策
ハード障害時に仮想マシンごと切り替える
DBサーバ
メールサーバ
DBサーバ
メールサーバ
ゲストOS
ゲストOS
ゲストOS
ゲストOS
仮想マシン
仮想マシン
仮想マシン
仮想マシン
サーバダウン
物理サーバ
Page 6
物理サーバ
クラウドを利用するときの考慮点
仮想マシン内のソフト障害は
検知できない
サービスダウン
計画メンテナンス時には
業務が停止する
OSのホットフィックス適用時、アプリ
ケーションリビジョンアップ時など
DBサーバ
メールサーバ
Windows
Linux
仮想マシン
仮想ハードウェア
切断
仮想マシン
移動せず
DBサーバ
Windows
仮想マシン
ゲストOS再起動
Page 7
単体サーバシステムにおけるシステム停止要因
単体サーバシステム停止要因から可用性を検討する
障害発生による停止
①
24%
②
③
④
Ⓐ
Ⓔ
計画保守停止
76%
(内訳)
37%:Ⓐ
13%:Ⓑ
12%:Ⓒ
7%:Ⓓ
7%:Ⓔ
(内訳)
9%:①
6%:②
5%:③
4%:④
OS/ドライバのパニック
アプリケーションエラー
ハードウェア障害
その他の障害
Ⓓ
Ⓑ
Ⓒ
OSアップグレード/サービスパック・ホットフィクス適用によるOS再起動
アプリケーションインストール/アプリケーション保守
OS設定変更を反映するためのOS再起動
新しいハードウェアの接続と設定を有効にするためのOS再起動
その他によるOS再起動
出典元:マイクロソフト社調べ2005/6、「Windows Server 2003, EEの信頼性」資料
Page 8
クラウドのHAによるシステム停止要因のカバー範囲
クラウドのHA機能ではシステム停止要因の21%しかカバーできない
単体サーバシステム停止要因
①
②
③
④
Ⓐ
Ⓔ
Ⓓ
Ⓑ
クラウドのHA機能に
よるカバー範囲
21%
(内訳)
9%:① OS/ドライバのパニック
5%:③ ハードウェア障害
7%:Ⓓ 新しいハードウェアの接続と
設定を有効にするためのOS再起動
Ⓒ
可用性にはまだまだ課題が多いことが否めない
Page 9
CLUSTERPRO X による障害対策
Page 10
障害発生時に業務を継続
システム異常を確実に検知し、業務をフェイルオーバ
シングルサーバの場合
クラスタリングサーバの場合
フェイルオーバ
障害発生
業務停止
障害発生
業務継続
アクセスする宛先
はそのままでよい
・ 保守担当が駆けつけるまで業務停止
・ 別のサーバが自動的に業務継続
・ ビジネス機会損失
・ ビジネス機会の損失を最小限に抑える
・ 企業としての「信用」失墜
・ 導入した企業は安心してビジネスに臨める
Page 11
計画メンテナンスでも業務継続
待機系よりメンテナンスして、フロント業務を止めない*
①
システム停止要因
業務
(内訳)
障害発生による停止
9%:OS/ドライバのパニック発生
6%:アプリケーションエラー発生
5%:ハードウェア障害発生
4%:その他の障害
計画保守停止
76%
(内訳)
24%
保守
④
単体
サーバ
37%:OSアップグレード/サービスパック・
ホットフィクス適用によるOS再起動
13%:アプリケーションインストール/
アプリケーション保守
12%:OS設定変更を反映するためのOS再起動
7%:新しいハードウェアの接続と設定を有効にするためのOS再起動
7%:その他によるOS再起動
(出典元:マイクロソフト社調べ2005/6、「Windows Server 2003, EEの信頼性」資料
②
業務
業務
③
業務
保守
*:クラスタ化で、保守による業務停止時間を業務移行時間だけでOK!
Page 12
異常発生を素早く察知
現用系サーバが業務継続できる状態なのか?を広範囲に監視
ルータ、その他のネットワーク機器
現用系
アプリケーション層
アプリケーション層
アプリケーション
正常応答監視
存在監視
監視エージェント
OS層
★待機系も常に監視!
ハングアップ監視 OS層
ハングアップ監視
OS空間
ハードウェア層
アクセスチェック
アクセスチェック
NICリンクダウン監視NIC
システム
ディスク
NIC
HBA
システム
ディスク
NIC
HBA
クラスタパーティション
ユーザデータ
Page 13
待機系
Ping応答監視
OS空間
ハードウェア層
検出可能な特定アプリケーション障害
監視Agent(オプション)の導入によりハングアップ・異常状態まで監視可能
単なるアプリケーションの存在監視だけでなく、定期的に正常応答が返るか確認します。
もしもハングアップや異常を検知した場合、フェイルオーバして業務継続できます。
Agent(オプション)なしの場合
障
害
発
生
プロセスが消滅すると
異常と判定
アプリケー
ション起動
Agent(オプション)ありの場合
ハング
アップ
アプリケーションの
ハングアップは
検出しない
アプリケー
ション起動
Agentが定期的に対象の
アプリケーションをチェック
アプリケーションの
ハングアップを
検出できる。
Agent
Agent
× アプリケーションのハングアップ検出
○ アプリケーションのハングアップ検出
× アプリケーションからのレスポンス異常検出
○ アプリケーションからのレスポンス異常検出
○ アプリケーションの異常終了(要:存在監視設定)
○ アプリケーションの異常終了 (要:存在監視設定)
Page 14
CLUSTERPRO X 監視Agent
大切なアプリケーションのハングアップや異常状態まで詳細に監視します!
▌ 利用ケースの多い、6つのカテゴリーに対応
データベース
(Database Agent)
Oracle, SQL Server, DB2, ODBC, PowerGresなど
Linux
Oracle, DB2, Sybase, PostgreSQL, PowerGresPlus,
MySQL
Solaris
Oracle, MySQL, PostgreSQL
(File Server Agent)
Linux
Solaris
アンチウイルスソフト
IIS, SMTP/POP/IMAP4, HTTP,HTTPSなど
Linux
apache, httpd, sendmail, postfix, popdなど
アプリケーションサーバ
(Application Server Agent)
Windows
Linux
Samba, NFS
Tuxedo, WebLogic, WebSphere, Oracle ASなど
(Anti-Virus Agent)
Windows
ウイルスバスター コーポレートエディション
Page 15
(Internet Server Agent)
Windows
Windows
ファイルサーバ
インターネットサーバ
OS、JavaVMのリソース監視
(System Resource Agent / Java Resource Agent)
Windows
Linux
・OSのシステムリソース
・Java実行基盤の監視
障害検出後の業務切替(フェイルオーバ)のフロー
だいたい1分前後でサーバは切り換わる
①障害検出
③切替ディスク ④フローティング
②アプリ停止 非活性
IP非活性
①障害検出
アクティブ
フェイルオーバグループ非活性
ここまでの目安1分前後
⑤フローティング ⑥切替ディスク
⑦アプリ開始
IP活性
活性
スタンバイ
フェイルオーバグループ活性
②アプリケーション停止
⑦アプリケーション開始
③共有ディスク(ミラーディスク)非活性
⑥共有ディスク(ミラーディスク)活性
④仮想(フローティング)IPアドレス非活性
⑤仮想(フローティング)IPアドレス活性
OSシステムログに記録、AlertServiceによる通報
Page 16
●フェイルオーバグループ
クラスタサーバが利用するリソースの集ま
りです。フェイルオーバグループがノード間
を移動します。同一グループに属するリ
ソースは必ず一緒にノード間を移動しま
す。
主流のクラスタ構成
業務のデータ容量に応じてクラスタ構成(ディスク構成)を選択可能
SAN接続 共有ディスク型
データミラー型
パブリックLAN
パブリックLAN
G
インターコネクトLAN
G
インターコネクトLAN
兼
ミラーコネクトLAN
サーバダウン監視経路
G 業務のグループ
▐ サーバの内蔵ディスクを業務データ引継ぎに利用
したクラスタ
▐ 内蔵ディスクを使い低コストで高可用なシステム
が構築可能
Page 17
共有ディスク
FC接続
iSCSI接続
▐ 共有ディスクを業務データ引継ぎに利用したクラ
スタ
▐ 共有ディスクの特長である高性能/高信頼/大容
量を活かしたシステムが構築可能
もちろん仮想化にも対応
仮想化環境の可用性を向上する、仮想化環境型構成
▐ 仮想化環境でのクラスタ構成
 物理サーバのクラスタ化と同じように、仮想マシンのクラスタ化が可能
 仮想マシンの中から幅広くシステムを監視
<障害検知範囲>
▐ハードウェア(仮想マシン)観点
業務を
フェイルオーバ
①システムディスクのI/O障害
② 業務データ格納用ディスクのI/O障害
③ ネットワークのI/O障害
障害
業務
VM1
仮想化基盤
業務
▐ソフトウェア観点
VM2
④ ゲストOSのハングアップ
⑤アプリケーションの停止、
またはハングアップ
仮想化基盤
KVM
vSphere
XenServer
IBM
PowerVM
<対応仮想化基盤>
Page 18
Solaris
コンテナ(ゾーン)
Hyper-V
クラウド環境でも自動切換えできる「CLUSTERPRO」
様々なクラウド環境で提供される仮想マシン上で動作確認済み!
NECビッグローブ
伊藤忠
テクノソリュージョンズ様
IDCフロンティア様
Amazon
Web Services LLC 様
NTTコミュニケーションズ様
日本ユニシス様
マイクロソフト 様
ニフティ 様
クラウド環境への対応状況
http://jpn.nec.com/clusterpro/clp/cloud/cloud_sysrep.html
Page 19
(再掲)クラウドを利用するときの考慮点
仮想マシン内のソフト障害は
検知できない
サービスダウン
計画メンテナンス時には
業務が停止する
OSのホットフィックス適用時、アプリ
ケーションリビジョンアップ時など
DBサーバ
メールサーバ
Windows
Linux
仮想マシン
仮想ハードウェア
切断
仮想マシン
移動せず
DBサーバ
Windows
仮想マシン
ゲストOS再起動
Page 20
CLUSTERPROならクラウドでの業務も安心!
仮想マシンの障害対策
仮想マシンの計画メンテナンス
アプリケーションを
切り替え
障
害
アプリケーションを
切り替え
アプリケーション
アプリケーション
計画メンテナンス
ゲストOS
仮想マシン
ゲストOS
仮想マシン
▌ 仮想マシンの中から幅広く監視
▌ 切り替えは業務アプリケーション単位に起動
ゲストOS
仮想マシン
ゲストOS
仮想マシン
▌ 仮想マシンの計画メンテナンスに対応
▌ アプリケーションの停止と起動で切り替え
▌ ゲストOS再起動を伴う際の影響が小さい
Page 21
クラウド化すると・・・仮想マシンの中が業務の本質
クラウド環境であっても業務の継続がサービス提供継続のカギ
Page 22
導入事例(クラウド)
株式会社レストラン・エクスプレス様
クラウド上にOSSを用いて基幹システムを構築。
事業成長や業態の追加へ柔軟に対応できる高可用でスケーラブルな仕組みを実現。
導入の目的
従来のシステムでは、新しい業態が増えたと
きのシステム追加・拡張に大きなコストが掛
かった。事業の成長に合わせてスケーラブル
に拡張できるシステムが必要だった。
導入によるメリット/システム構成
既存のシステムをクラウド化し、柔軟性と拡張性
を確保。さらにクラウド環境の動作をサポートして
いるCLUSTERPROを用いて基幹システムに求め
られる可用性を確保した。
従来のシステムを拡張するのに比べ10分の1の
コストで同機能を実現できた。以下コメント抜粋
『操作性がよく、まるで空気のような存在。』
『全てのサーバを一度で設定変更できて、管理者
が本来の運用管理業務に集中できる。」 事例詳細
仮想OSは CentOS
(IDCフロンティア社のクラウドサービスを利用)
http://www.nec.co.jp/library/jirei/restaurantexpress/
Page 23
導入事例(遠隔クラスタ)
広域/狭域の災害対策にCLUSTERPROの導入事例が増加中
実績リスト
業種
区間
電力系
東京⇔沖縄
部材管理
業務用途
形態
1,500km
データベース
1対1ミラー
千葉⇔神奈川
50km
データベース
1対1ミラー
財務会計
東京⇔名古屋
260km
データベース
1対1ミラー
金融A
東京⇔江ノ島間相当
50km
データベース
ハイブリッド
金融B
千葉⇔神奈川
80km
データベース
ハイブリッド
インフラ
大阪⇔東京
390km
データベース
ハイブリッド
製造A
敷地内
100m
データベース
1対1ミラー
製造B
工場間
5km
データベース
3対1ミラー
自治体
敷地内
500m
データベース
1対1ミラー
事 例 2
距離
事 例 1
・クラスタソフトによるストレージ・ミラーを低価格で実現
・通常はメインサイトで運用、災害時にバックアップサイト
に手動切替
距離 50km
メインサイト
バックアップサイト
建物B (バックアップサイト)
データベース
建物A
(メインサイト)
データミラーリング
データベース
共有ストレージ
・火災対策として工場間でクラスタ化
Page 24
共有ストレージ
遠隔クラスタ、ケーススタディ(海外事例)
ケース 保険A
・扱うデータや業務の性質が非常にクリティカルであるため、災害対策を検討
・運用管理/操作の容易性、費用対効果の高さ、システムの堅牢性が評価され、
CLUSTERPROの遠隔データミラー型クラスタを採用。
ジェッダの洪水(2011)
「我々のテクノロジーパートナーとして NECを選んだのは非常に懸命な判断でした。
ジェッダで洪水が起きた時、他社がシステム停止により多大な被害を受けたのに
対し、我が社は簡単な操作だけで素早く業務再開ができた。 このとき、我々は
NECとNajTechこそが最高のテクノロジーパートナーであると確信しました。」
「我々は20分以内に通常通りの運用に戻すことが出来たのです」
保険A社 IT技術マネージャの言葉
メインサイト
30km
DRサイト
Oracle
Oracle
Windows Server 2003
水害
発生
Windows Server 2003
1. 水害発生時に20分以内
の業務再開を実現
2. 企業スタッフの生産性が
15%増加
3. 主要アプリケーションの
ダウンタイムを90%削減
ミラーリング
Page 25
導入の効果
4. ユーザ満足度が20%上昇
遠隔クラスタ、ケーススタディ(海外事例)
ケース 政府機関
Lenel社のOnGuardを使用したアメリカ連邦政府機関のゲート認証システムにおいて、
FTサーバとCLUSTERPROを使用した遠隔クラスタリングで、災害対策を実現。
導入の目的
2 OnGuard Clients
4 OnGuard Panels
40 Km
ゲート認証システムにおいて、万一の災害
によるサイトダウンに備え、バックアップサ
イトでの業務継続を可能とする災害対策
が求められていた。
New York, NY
Value 3
2分以内の
自動フェイルオーバ
Newark, NJ
LAN
SQL Server 2000
Windows 2000
Corporate Network
T1 WAN (1.5Mbps)
クラスタ Interconnect
EXPRESSCLUSTER
導入によるメリット/システム構成
FTサーバ
LAN
Value 1
99.999%
(現用系)
CLUSTERPROによる遠隔クラスタリングによ
り、災害によるサイトダウンが発生しても「最
小限のダウンタイムで」、「データは完全保障
したまま」バックアップサイトでの業務継続を
可能とするDR(災害対策)ソリューションを
構築。
さらに、メインサイトのサーバにはFTサーバを
採用することにより更なる高可用システムを
実現。
Page 26
SQL Server 2000
Windows 2000
EXPRESSCLUSTER
(待機系)
Value 2
データの同期ミラーリング
iStorage Sシリーズ
NEC Corporation of America
EXPRESSCLUSTER製品ページ(英語)
http://www.necam.com/entsw/ExpressCluster/
(※1)CLUSTERPROは、海外ではEXPRESSCLUSTERの名称で販売しています。
(※2)上記Webページに関するお問い合わせは<[email protected]>まで
お願いいたします。
BIGLOBEクラウドアプリストアで
CLUSTERPROを始めよう!
Page 27
CLUSTERPROで月額利用可能
▌クラウドアプリストア第一弾の対応製品として登場
▌月額利用サービスで必要な時に必要な分だけ利用可能
クラウド
アプリストア
クラスタリングソフトウェア
CLUSTERPRO X
リレーショナルデータベース
Microsoft® SQL Server®
アプリ利用料金
とクラウド料金は
まとめて支払い
便利で
魅力的なアプリ
を拡充
アプリベンダ
パートナーによる
事前検証済み
Page 28
お客様
クラウド上の
サーバに導入しやすい
提供形態
必要なアプリを
ワンストップで入手
クラウドを利用するときの悩み
Page 29
クラウドアプリストアでお悩み解決
問合せ対応も安心!
初期費用ゼロ!
クラスタリングを月額料金で利用できる!
費用もBIGLOBEにまとめて支払い!
問合せはBIGLOBEにすればよい!
障害
OS
仮想サーバ
OS
仮想サーバ
月額サービス
クラウドアプリストアなら、クラスタリング環境をシンプルにご利用いただけます!
Page 30
おわりに
Page 31
転載禁止
IDC調査: 12年連続・国内Windows+Linux 高可用クラスタソフトNo.1
クラウドや遠隔間クラスタなど広いニーズに応え、シェアトップを独走!
2012年 OS別売上
2012年
総合売上No.1
Linuxは大型案件の受注により17.8%増と2桁成長
Windowsは4.4%増、Hyper-V環境の案件も増加
←UNIX+Linux+Windowsの総合
ライセンス売上+メンテナンス
売上が調査対象。
H
C
No.1
2.3%
B 9.0%
売上
41.5%
A 11.4%
H
F
11.5%
売上
45.8%
E 20.2%
D 14.6%
2.6%
5.3%
6.0%
B 9.1%
6,444百万円 (単年)
No.1
I
Linux
Windows
その他
G
12.3%
3.9%
32.1%
F
CLUSTERPRO売上実績の推移
売上
4.3%
E
6.2%
B
D
6.8%
A
14.3%
Windows版とLinux版を合算した市場で
10.5%
12年連続 No.1
C
6.9%
出典:IDC Japan、2013年7月 「国内システムソフトウェア市場
2012年の分析と2013年~2017年の予測」 (J13310103)
Page 32
2001年 2002年
No.1
No.1
2003年 2004年
No.1
No.1
2005年
2006年
No.1
No.1
2007年 2008年 2009年 2010年 2011年
No.1
No.1
No.1
No.1
No.1
2012年
No.1
転載禁止
海外でも高い実績・評価
NECが
No.1
日本を含むアジアにおいて4年連続シェアNo1達成
国内のWindows版とLinux版を合算した市場でも12年連続シェアNo1達成
アジア(日本を含む)
国内
No.1
12.3%
G 3.9%
32.1%
F 4.3%
23.8%
売上
H B
6.5%
7.5%
売上
E 6.2%
D
C
6.8%
E
15.2%
14.3%
10.5%
No.1
H 2.3%
10.4%
A
B
6.9%
Linux
A
No.1
その他
H 2.6%
No.1
Windows
I 5.3%
B 9.0%
C 6.0%
売上
B 9.1%
A 11.4%
D 14.6%
41.5%
F 11.5%
売上
45.8%
E 20.2%
(EXPRESSCLUSTERは、CLUSTERPROの海外名称です)
Source:IDC Japan、2013年7月 「国内システムソフトウェア市場2012年の分析と2013年~2017年の予測」 (J13310103)
IDC AP、2013年8月 「Asia/Pacific (Excluding Japan) Availability and Clustering Software Market Analysisand Forecast Update」 (AP2670321U)
Page 33
構築を安心して任せられる、認定技術者増加中!
全国に技術認定の取得者が多数居ります
最寄の販売店にお声掛けください
200社突破!
合格者 800名
(2013年10月末現在)
▌ CLUSTERPRO技術認定制度は、CLUSTERPROを構築するに
あたり必要な知識・技能を修得いただくための構築パートナー向け
認定制度です。
▌ 既に200社800名が全国に居りますので、
安心して導入をお任せください。
全国各地で開催中!
開催実績
東京
大阪
北海道
名古屋
静岡
愛媛
高知
石川
新潟
長野
大宮
詳しくはこちら→ http://fcc.express.nec.co.jp/clpnintei/
※東京以外の開催日程、および個別開催についてはお問合せください。
Page 34
本日のまとめ
クラウド基盤の障害/災害でも業務継続を実現するCLUSTERPRO X の特長
 クラウドでも業務停止リスクを最小化
 豊富な監視機能により、精確な障害検知が可能
 障害時だけでなく広域災害時にも業務継続が可能
安心の実績No.1 CLUSTERPRO が
お客さまの大切な業務を守ります!
Page 35
製品ご紹介サイト/お問い合わせ先
製品ご紹介サイト http://jpn.nec.com/clusterpro/
(フル機能が使える試用版をダウンロードできます!)
(ドキュメント多数公開中: (随時更新中))
お問い合わせ先
[email protected]
秋葉原でデモをご覧いただけます
サーバ/PC等、こだわりの展示品もご覧になれます
クラサバ市場秋葉原店
http://www.nec.co.jp/products/express/ichiba/
・定休日
月・日・祝
・電話番号
03-5294-9802
・営業時間
11:00~17:00
Page 36
関連展示のご案内
106
70:クラウド基盤の障害/災害でも業務継続する
CLUSTERPRO X
要更新
106:お客様の業務を止めない
高信頼・高可用性プラットフォーム
現在
位置
Page 37
Page 38
Page 39