設定まとめ編では、ログ可視化システムを構成する各ソフトウェアコンポーネントの設定をまとめて示しました。その後、各コンポーネントを起動して本格的な運用を開始しました。Elasticスタックのインストールと、その後の可視化システムの構築の流れを再掲します。(下図)
- Elasticsearch, Elasticsearch X-Packのインストール(済)
- Kibana, Kibana X-Packのインストール、Basicライセンスの取得と投入(済)
- Logstash, Logstash X-Packのインストール(済)
- Beats (Filebeat)のインストール(済)
- Logstashのログ処理ルールの作成とテストデータでの動作確認(済)
- Filebeat→Logstash→Elasticsearchでの運用開始(済)
- Kibanaでの検索、ダッシュボードの作成(本記事)
Elasticスタックを用いたホームゲートウェイのログ可視化シリーズも、本記事で最後となりました。今回は、一連の手順の中のハイライト、一番楽しい部分であるログデータの検索および可視化について説明します。
可視化を進めていくにあたり、以下に挙げる二つの記事を参考にします。一つめの記事は、Elasticsearch社公式のスタートガイドです。また、二つめの記事は、@namutakaさんがQiitaにポストされた記事です。検索式について本記事ではほんの少ししか触れていませんが、二つめの記事には初心者にとって必要十分な説明がありますので、ぜひ参考にしてみてください。
さて、本記事におけるダッシュボード作成までの流れは以下のようになります。
では、以下、一つずつ説明していきます。
インデックスパターンの作成
まず、「インデックスパターン」を作成する必要があります。「インデックス」とは、Elasticsearchにおいてデータセットに与えられた名前のことで、リレーショナルデータベースでいうテーブル名に相当します。Elasticsearchへのデータ投入にLogstashを用いる場合、デフォルトではインデックスとしてlogstash-<日付>
(日付はYYYY.MM.DD
の形式)という名前が用いられます。
Elasticsearchは、ログデータや性能監視データなどの「時系列データ」を扱うことが多いため、所定の時間単位でデータセットを区切って、おのおののデータセットに時間を関連付けるのが、データを管理する上ではわかりやすいのだと思います。今回のログ監視システムにおいても、設定まとめ編の最後で確認したように、logstash-<日付>
という名前のインデックスが一日単位で作られています。
インデックスパターンは、複数のインデックスにマッチするパターンです。一日単位でインデックスが作成されている場合、たとえばlogstash-2018.05.*
というインデックスパターンは、2018年5月分のインデックスにマッチします。蓄積されているすべてのデータを検索対象にする場合は、logstash-*
というインデックスパターンを用います。今回の場合も、ログデータすべてを検索対象にしたいので、このインデックスパターンを用いることにします。
では、ブラウザでKibanaのURL (http://elastic.example.com:5601
)にアクセスしてください。(URL内のホスト名はお使いの環境に合わせて読み替えをお願いします。) そして、画面右上にある”Set up index patterns”ボタンをクリックします。
インデックスパターンを作成する画面が表示されますので、”Index pattern”の欄に、先ほど説明したlogstash-*
を入力します。すると、その下にマッチするインデックス(複数個あるかもしれません)が表示されます。これを確認できたら、右側にある”> Next step”ボタンをクリックします。
次は、タイムスタンプとして用いるフィールドを指定します。先ほども述べましたように、Elasticsearchは基本的に時系列データを扱いますので、データ内のどのフィールドを時刻として扱うかを指定する必要があります。通常は@timestamp
フィールドを用いますので、ここでもこれをリストから選択して、”Create index pattern”ボタンをクリックします。
作成したインデックスパターンの名前とともに、インデックスに含まれているフィールド名のリストが表示されます。インデックスパターンの作成は以上で終了です。
検索式を用いたログデータ検索
インデックスパターンが作成できましたので、さっそくログデータを検索してみましょう。
画面左側にあるメニューの”Discover”をクリックします。すると、インデックスパターンlogstash-*
のデータを検索する画面が現れます。
デフォルトの状態では、現在時刻からさかのぼって15分以内のタイムスタンプを持つデータがすべて表示されています。もし、データが表示されない場合は、右上にあるデータ表示期間を長くしてみてください(例えば過去30日以内)。あまり期間を長くし過ぎると、データの表示に時間がかかりますので注意が必要です。
本記事の場合、Elasticsearchにはホームゲートウェイのログしか格納していませんので、特に検索式を組み立てて検索する必要はないのですが、せっかくなので少しなれておきたいと思います。検索式の詳細については、以下のURL、あるいは先ほど紹介したQiitaの記事にアクセスしてみてください。
検索式を構成する基本単位は、<フィールド名>:<検索条件>
という形を取ります。これによって、「フィールド名で示されるフィールドの値が検索条件にマッチする」データが抽出されます。さらに、AND
, OR
, およびNOT
を用いて、検索条件を組み合わせることができます。
本記事での検索条件は、
Filebeat
という名前を持つBeatから送信されたデータであること、かつfields
のlogtype
フィールドの値がfirewall_hgw
であること
とします。これによって、(複数種類のログが混在すると想定する中で)ホームゲートウェイのログだけをすべて取り出すことができます。本検索条件を式になおすと以下のようになります。
beat.name:Filebeat AND fields.logtype:firewall_hgw
検索式の欄にこれを入力して、右側の虫メガネボタンをクリックしてください。すると、式にマッチするデータが画面下部に表示されます。デフォルトでは検索結果に含まれるデータのすべてのフィールドが表示されており、このままでは少し見にくく感じます。そこで、次は表示するフィールドを選択します。
インデックスパターン名の下にフィールドの一覧(Available Fields)が表示されていますので、表示したいフィールド名をクリックして選択していきましょう(フィールド名の上にマウスポインタを置くと”add”ボタンが表示されます)。上図の場合は、Timestamp (これは必ず表示されます), source_ip
, source_host
, geoip.coutry_name
, source_port
, dest_ip
, およびdest_port
を表示対象として選択しました。”Selected Fields”に選択したフィールド名の一覧が表示されます。
検索条件と結果の表示に満足したら、画面上部にある”Save”をクリックして、名前をつけて検索条件を保存しておきましょう。
検索結果のグラフによる可視化
次は、保存した検索条件にマッチするデータをグラフで可視化してみます。
画面左側にあるメニューの”Visualize”をクリックします。すると、保存されているビジュアライゼーションの一覧画面が表示されます。いまはまだビジュアライゼーションを作成していませんので、”+“ボタンが大きく表示されていると思います。画面中央にある”+ Create a visualization”ボタンをクリックしてください。
すると、可視化の形態(グラフの種類)を選択する画面が現れます。まずは、基本的なところで、ログ数のトレンドを示す折れ線グラフを作ってみましょう。”Basic Charts”の”Area”をクリックします。
可視化のデータソースを選択する画面に遷移しますので、先ほど名前をつけて保存した検索条件を選択します。下方に表示されている”Home Gateway”をクリックします。
すると、グラフのX軸、Y軸を設定する画面が現れます。Y軸はそのままログ数(Count)としておきます。時間経過にともなうログ数の変動を知りたいので、X軸は時刻にします。”Aggregation”から”Date Histogram”を選択し、時刻を表すフィールドとして”@timestamp”を選択します。すると、右側の領域にグラフが表示されます。
本記事では、ここまでで基本的なところしか触れませんが、グラフはカスタマイズ可能ですので、いろいろ試してみると楽しいと思います。
グラフの表示に満足したら、検索条件のときと同様、画面上部にある”Save”をクリックして、名前をつけてグラフを保存しておきましょう。
可視化結果を組み合わせたダッシュボードの作成
最後は、作成したグラフを使ってダッシュボードを作成します。
画面左側にあるメニューの”Dashboard”をクリックします。すると、保存されているダッシュボードの一覧画面が表示されます。いまはまだダッシュボードを作成していませんので、”+“ボタンが大きく表示されていると思います。画面中央にある”+ Create a dashboard”ボタンをクリックして、さっそく作成しましょう。
新しいダッシュボードが作成されましたね。しかし、まだ何もデータが表示されていません。
画面上部の、あるいは空白のダッシュボードの中にある”Add”ボタンをクリックしてください。そうすると、保存されているビジュアライゼーション、あるいは検索条件を選択する画面になります。(上部のタブでビジュアライゼーションと検索条件を切り替えられます。) ここでは、保存しておいたグラフを選択してクリックします。
画面下方(ダッシュボード)に先ほど保存しておいたグラフが追加されました。追加した時は、グラフの横幅がダッシュボード幅のちょうど半分になっていると思いますが、サイズは領域右下のハンドルで変更可能です。また、右上の歯車アイコンをクリックすると、領域のタイトルやグラフの再カスタマイズを行なうことができます。
満足したら、再び、画面上部にある”Save”をクリックして、名前をつけてダッシュボードを保存します。
はい、できあがりです。いまのところ、グラフをひとつ表示しているだけなので少々さびしい感じですが、他のグラフも組み合わせて楽しいダッシュボードを作ってみてください。
参考までに、当方で作成しようと思っていたホームゲートウェイダッシュボードの事前イメージと、このイメージに沿って作成した実際のダッシュボードを載せておきます。
本記事まで、まえがきから数えると8回にわたって、ホームゲートウェイのログ可視化システムを構築してきました。とても長かったですが、ここまで読んでくださった皆さん、お付き合いくださってありがとうございます。では、可視化を楽しんでください!