AWS Casual Talks #3 @ Cookpad
id:myfinder
- 12/12(金)開催
- Zussar力が低くて応募できないので後でどうにかします
- トーク/LTネタがある方はお気軽に^^
いままで Hadoop エンジニアさんたちにお願いしていたログ集計を開発者側でコントロールしたい
でもログ置場や集計基盤の設計構築に悩みたくないというわがままボディ
- (ちゃんと設計すれば)fast
- (ちゃんと設計すれば)cost effective
- (ちゃんと設計すれば)in less ops
- (何も考えずとも)modestly fast
- (何も考えずとも)pay per use
- (何も考えずとも)in less ops
最近 timestamp 型をサポート
fluent-plugin-bigquery も 0.2.4 からサポート
cmp | Redshift | BigQuery |
---|---|---|
speed | fast | modestly |
cost | controlable | uncontorolable |
ops | requeired | free |
import | inefficient | nefficient |
出まくる
とにかく出まくる
時々でる
思い出したように出る
謎のメッセージ
API コールに HTML を返してくる
- 発生しづらいパラメタに調整
- http://qiita.com/najeira/items/74799a67ac21c6b13415
- こうしてから起こりにくくなりました
- 欠落したログを S3 から復帰させる
- そういうスクリプトを書いておく
- ログの重複が許されない用途ではこの対策は不可能
数々のアレな状況を乗り越えて
今は割と不自由なくお気楽ログ集計ライフを送っています