​性能問題のスピーディーな解決​

問題解決の迅速化/省人化​

性能管理にかかる工数の削減

国内製造業様

Dynatraceで品質管理標準化
クレーム発生前の改善活動を実現クレーム発⽣前の改善活動を実現

サービス品質を向上し、ビジネス革新を加速させるオブザーバビリティプラットフォーム「Dynatrace」導入事例

目的

・ユーザーからのクレームが発⽣する前に問題に気づき、インシデントの事後把握から未然防⽌へシフトする

 

・システムトラブルの原因調査⼯数を削減し、現地開発拠点へのエスカレーションにかかる時間・改善までにかかる時間を短縮す
 
・アプリケーション品質のばらつきを無くすために、開発時のパフォーマンスチェック、リリース後のユーザー体感監視、改修すべきパフォーマンス基準の設定といった品質管理を標準化し、それを各海外開発拠点へグローバル展開する

課題

・ユーザー体感レスポンスとサーバー側の処理時間を紐づける⼿段が無く、ユーザークレームを受けてから、レスポンスの遅い操作のログの調査・対処を⾏っている

 

・膨⼤な量のログ調査を⾏っているため、ユーザー操作の確認やエラー・不具合の原因特定までにかかる時間が⻑期化している

 

・開発時のパフォーマンスチェックルールは、開発拠点毎にムラがあり、予防できたはずのパフォーマンス障害が本番リリース後に発⽣している

効果

・End-to-Endのユーザー体感を定量的に計測、サービスレベル通りのレスポンス時間を満たしていないユーザー操作を⾃動検知することで、ユーザークレーム発⽣前に改善活動を実施

・サーバーログの調査不要でボトルネック箇所を分析出来るようになり、本社IT部⾨から開発拠点へのスムーズな情報共有・エスカレーションによりアプリケーション改修が完了するまでにかかる⼯数・時間を80%削減

・開発フェーズでリクエストごとにレスポンス時間を計測、違反しているリクエストを抽出し被疑箇所を開発者へフィードバックするルールを標準化し、結果的に本番リリース後に発⽣するインシデント件数・ユーザークレームを50%削減

導入経緯

⼤⼿製造業A社様は、国内外合わせて約100社のグループ企業を有しており、海外も含めた各拠点で、スマートホームやヘルスケアなどのBtoCサービスや、産業機器、データセンター向けなどのBtoBサービスを開発されています。
本社IT部⾨では、全拠点の社員が利⽤するアプリケーション基盤の⼀括管理を⾏い、同時に各開発部⾨のサポートを担っています。

A社様はグローバル展開をされているため、各拠点でのシステム管理・監視が必要ですが、拠点の規模や現地採⽤の問題上、各拠点に専⾨のエンジニアを置くことが難しく、トラブルシューティングや品質管理において、国内と同じ⽔準を維持することが困難でした。
そのため、アプリケーションによってパフォーマンス品質にバラつきが発⽣したり、改修すべき箇所の発⾒・改修作業に到るまでに時間がかかっていました。
当該アプリケーションは、A社様の製品管理に関連するサービスが多数存在し、相互に連携しているため、1つのシステムの問題が他のシステムに影響を及ぼしてしまうことがあり、トラブルの原因究明が複雑化していました。そのため、アプリケーションのユーザー体感をキーにした監視体制を実現し、可観測性(オブザーバビリティ)を向上させるために、Dynatraceを導⼊いたしました。

ソリューション詳細

OneAgentでEnd-to-Endのレスポンスを追跡・可視化

DynatraceでEnd-to-Endのレスポンス計測を⾏うために必要なことは、各サーバーに単⼀のエージェント「OneAgent」を導⼊するだけです。
クライアント端末や計測対象のWebページに⼿を加えることなく計測が⾏えます。

⾃動ベースライン学習で異常を検知、AIが根本原因を分析

計測開始後、Dynatraceはすぐにレスポンス時間やエラー発⽣率を学習し、ベースラインを⽣成します。これにより、いつもと違う異常な動きを検知し、同時に根本原因の分析までAIが⾃動で⾏います。
 
d_case_manufacturing industry_1
d_case_manufacturing industry_1

本番環境のすべてのユーザー操作とレスポンス時間の計測

DynatraceによってWebアプリケーションのユーザー操作を全件計測することが出来るようになりました。
 
そのうち、平均レスポンスが5秒を超える操作を抽出し、本社IT部⾨にてDynatraceを使って原因調査まで⾏い、拠点開発者へレスポンス改善サポートを実施できるようになりました。
 
結果として、ユーザークレームに発展する前にパフォーマンス問題を検知・改善できるようになりました。

 

ユーザーの環境・操作履歴の確認を簡易化

各拠点の開発者は、従来サーバーログを⾒て時間をかけて調査を⾏っていました。Dynatraceはユーザー情報やトランザクショントレースを⾃動で情報収集、⾒やすく表⽰してくれるので、ユーザーの環境や操作履歴の確認にかかる⼯数・時間を削減することができました。

 

パフォーマンストラブルの検知・原因切り分け・根本原因分析を⾃動化し、分析にかかる⼯数と時間を短縮

各拠点の開発者が、リリース前のレスポンスチェックでDynatraceを使⽤し、計測されたレスポンスをエビデンスとして本社IT部⾨へ提出することを義務化しました
 
ユーザーの合意なく5秒以上かかる操作があれば、本社IT部⾨から拠点開発者へ改善を促すことで、開発段階での品質向上、本番リリース後のインシデントの削減を実現しました。

 

レスポンス改善活動の分散化

Dynatraceは⼤規模システムの監視においても、論理的なゾーニングや厳密な権限管理が可能です。
 
各拠点の開発者に、⾃拠点のデータのみ閲覧可能な権限を付与することで、本社IT部⾨の管理負担を軽減することが出来ました。

 

 

2024年掲載

関連資料

関連製品

関連事例