My External Storage

Jul 18, 2018 - 10 minute read - Comments - report gcp

GCPUG Tokyo gVisor Day July 2018 参加メモ #gcpug #gvisor

GCPUG(Google Cloud Platform User Group)の勉強会に参加してきた。
先日OSSとして公開されて話題となっているgVisorの話を聞いてきたので参加メモ。

URL https://gcpug-tokyo.connpass.com/event/90909/
会場 六本木ヒルズ 森タワー
日時 2018/07/12(木) 19:00 〜 21:30
ハッシュタグ #gcpug

所感

本題のgVisorについてはもちろん、Linuxのセキュリティ機能の知識、企業が公開しているOSSからその企業の戦略を推測する新しい見方を知ることができた。

最初の@yuryuさんの発表では以下を聞くことができた。

  • 信頼性が低いアプリ・プロセスを実行するときに守るべきLinuxのセキュリティ
  • gVisorがどのようにしてセキュアなコンテナランタイムを実現しているか

まさかPaaSの勉強会でLinuxのセキュリティ機能について教えてもらえると思っていなかった。
どんな点に気をつけなければいけないのか、を「非特権ユーザでサービス実行する」というところから丁寧に教えてもらえたのでその後の話の重要性もかなり噛み砕いて納得することができた。自分は雰囲気でLinuxを動かしている(本番はSREの方々がいい感じのAnsibleを流したり、AWSの設定をしてくれているし、ローカルで試すときはまずSELinux切る)ので、ちゃんと知っておかないといけないなと思った。
gVisor自体についても話を聞くのは初めてだった。正直「googleのすごい人たちがGoでLinux作り直しているのかな?」くらいの認識だったので、どんな思想で作られたOSSなのか知ることができて良かった。

  • 不特定多数の任意のアプリを安全に動かせるコンテナランタイムの実現
    • google(GCP)はPaaSとして開発者すら意図してない挙動をする可能性があるアプリをホスティングしないといけない
  • Linuxの再実装をしたいわけではない(gVisorでシステムコール全てを再現するつもりはない)

また、デモでは1月に話題になったメルトダウンを使ったコンテナからホストへのハックを実際に見せてもらい、gVisorがそれを防げることを確認できた。

@apstndbさんの発表ではgVisorがどのようにGCP内で使われているのか知ることができた。
gVisorの動作確認済み言語、アプリからGCPの動きを推測するのは「その発想はなかった!」という感じだった。
たしかにGCPや何らかのサービスに利用するために開発しているはずなので、gVisorの設計やサポートしている機能からgoogleの戦略を考えるのは非常に面白い話だった。

以下自分用メモ。

gVisor 入門: サンドボックス化されたLinuxコンテナランタイム

@yuryu

なぜgVisorが必要だったのか。Dockerなどの既存のコンテナ技術の流れから何が違うのか。

コンテナについて

  • 13年にDockerが公開してからコンテナ技術が世界に広まった
  • googleは自社サービスで40億以上のコンテナを毎週起動している
  • 既存のコンテナ技術では完全にホストOSから隔離されてない

Linux OSとセキュリティ

  • 大昔の各サービスプロセスがroot(特権ユーザー)で動いていた時代
    • なんでもできちゃった。無関係なプロセスを終了させたりもできた
    • 悪意のある行動がしやすい状態になっている
  • 非特権ユーザーでサービスプロセスを実行するようになった
  • capabilitiesを使って更に制約を課すことができるようになった
  • ここまででもまだ各サービスプロセスはCPUやメモリなどの計算資源を際限なく利用できる
  • これでも他のプロセスなどを見れる。
  • これで十分な分離ができたのか?
    • まだだめ。ホストカーネルやデバイスドライバを共有している
      • 単一の脆弱性が特権昇格や情報漏えいが発生してしまう可能性
      • ネットワークスタックにも脆弱性がある。

安全なコンテナを作る

  • 上記のセキュリティの問題をクリアした安全なコンテナを使いたい
    • コンテナ内からホストに影響が及ぼせないこと
    • 通常のコンテナと同じくらい簡単に使えること
      • アプリ側にコンテナの変更に伴う修正が不要なこと

gVisorの設計思想

https://github.com/google/gvisor#how-is-gvisor-different-from-other-container-isolation-mechanisms

  • 参考になる既存世界1: 仮想マシン
    • ハードウェアをエミュレートして完全なOSを実行
    • 優れた分離性、互換性
    • 高いオーバーヘッド、メモリ使用量
    • 固定されたCPU/メモリ割り当て
  • 参考になる既存世界2: ルールに基づいたアクセス制御
  • 2つの世界の良い点をいいところどりする
    • 独立したカーネル
    • ソフトウェアの仮想化
    • 仮想化されたハードウェアインタフェースは柔軟性がない
    • OSをそのまま再現するのはでかすぎる
    • コードが2,0000万行を超えるLinuxカーネルは(抜け穴が多く)安全性が低い
    • サンドボックス化は攻撃面を減らす効果的な手法

gVisorの概要

https://github.com/google/gvisor

  • gVisor上のコンテナランタイムはユーザーモードで動作する小さなカーネル
    • gVisorのカーネル内でアプリからのシステムコールをトラップし実行する
      • gVisorがホストのシステムコールを実行する。アプリはgVisorしか操作してない
  • 通常のプロセスのような柔軟なスレッド、メモリ割当
  • 仮想化と比べて低いオーバーヘッド
  • Linuxシステムコールをユーザー空間内で独立して実装している
    • 現在211のシステムコールを実装している
    • アプリ側はとくに意識することがない
  • 最初からセキュア
  • gVisor上のコンテナひとつひとつが別々のユーザーモードカーネル上で実行される
  • メモリ安全、型安全なGoで書かれている。(Goで実装された理由はGoLoverなのも大いに関係している)

gVisorのアーキテクチャ

https://github.com/google/gvisor#architecture

  • gVisorのコンテナランタイムは2つの別々のプロセスで動く

  • Sentry システムコールをエミュレートしている

  • Gofer ファイルアクセス

  • 2つのプロセスは9Pプロトコルで通信している

  • ネットワークはSentry内のユーザーモードで動いている

  • なぜ2つに分けているか

    • もっとも悪用されるのはsocketopen
    • ファイルシステムをGofer経由でしかアクセスできないようにすることでSentryに何かされても安心
  • システムコールのトラップ

    • ptrace PTRAP_SYSEMUを使ってシステムコールをトラップしている
    • これは全Linuxで動くという点が利点。
    • KVM(試験的)
    • gVisorがVMMM件ゲストOSとして動作
    • ハードウェアによる仮想化サポートが要件

gVisorの性能と用途

  • メモリ使用量15MB
  • 起動時間150ms
  • システムコールに若干のオーバーヘッド(コンテナよりおそい)
  • gVisorが向いていない用途
    • ホストと異なる種類のゲストOSを動作させたいとき
    • 完全に信頼されたバイナリ(だけを実行するなら普通のコンテナでよい)
    • システムコールを多用するアプリ
    • 完全なアプリケーションの互換性を期待する
  • Linuxの再実装をしたいわけではない
    • gVisorでシステムコール全てを再現するつもりはない
  • gVisorで動くアプリ
  • gVisorはクラウドの裏方
    • GAEはgVisorで動作している
  • OSカーネル自体の研究開発に向いているかも?
    • gVisorにGoで変更を加えユーザーモードで実行する
    • gVisorで試してみてLinuxへ移植するとか
    • Cで実装された巨大なLinuxのコードよりはユーザーフレンドリーなはず?
  • gVisorは安全なサンドボックス内でコンテナを実行する新しい手法
    • 裏方の技術を知ることは正しい判断する上で大切

gVisorを実行する方法

まとめ

  • gVisorを使ってサンドボックス内で安全にコンテナを実行できる
  • コンテナのメリットは保たれている
  • コンテナとホストOSの間に厳格な境界をもたらす
  • 信頼されていないバイナリをコンテナ内でより安全に実行できる
  • 裏方の技術を知ることは正しい判断する上で大切
  • 今から5分くらいで試せるよ!

gVisor と GCP

@apstndb

App EngineとgVisor

  • GAEのような任意のプログラムを実行できる環境では悪意あるユーザーの攻撃が多方面に及ぶ
    • 任意のシステムコールが呼べる状態では危険
    • 信頼出来ないプログラムはサンドボックス上で動作させたい
  • 従来のGAEはランタイムごとに実装されていた。例えば魔改造されたJVMとか
  • gVisorで処理系に改造より安全なサンドボックスになる
  • GAE/SEのランタイムがどんどんgVisorによって増大している。Java8やNode.js8、Python、PHP7…

App Engine以外とgVisor

gVisorからみるgoogle, GCPの今後

  • gVisorの対抗となるVMベースコンテナランタイムであるKata Containers側からは批判も出ている
  • Googleの特殊なトレードオフを把握する
    • 互換性
    • リソースフットプリント
    • セキュリティ境界の頑強性
    • パフォーマンス
  • 自社でコントロールできるOSSじゃないといざというとき責任が取れないというのもありそう
    • コミュニティで機能を取捨選択するようだと難しい?
  • googleにとってはリソース効率もかなり重要視されている
  • gooogleによるgVisor動作確認済みテストについて
    • https://github.com/google/gvisor#what-works
    • 動作確認済みのものはGoogle社内かGCPでの優先度が高いのでは?gVisorのシステムコールの実装優先順にも関わるはず
    • nginxは最近まで動かなかった
    • GCEで提供されているDB系統(redis, mongo, mysql)が動作確認済みなのは意味深

関連

関連記事