オブザーバビリティとは、システムの内部状態を可視化し、障害やパフォーマンス問題の原因を迅速に特定・解決するための概念です。もともとは制御工学の用語ですが、近年ではクラウドネイティブなITシステムにおける監視・運用の高度化に欠かせない要素となっています。
具体的には、ログ、メトリクス、トレース(分散トランザクションの追跡)など複数のデータソースを組み合わせて、システムのふるまいや異常の根本原因を深く分析します。従来のモニタリングが「既知の問題の発見」に強いのに対し、オブザーバビリティは「未知の問題の発見・予測」に強みがあります。
複雑化するマイクロサービス環境やコンテナ基盤(Kubernetesなど)において、運用の安定性やSRE(サイト信頼性エンジニアリング)を支える重要な技術として注目されています。