BigQueryってなんぞ? - Togetter
Twitterのつぶやきマッシュアップメディア!
@togetter_jpをフォロー
ホーム
まとめ作成
お知らせ
設定
ログイン
ついに決定!第2回トゥギャッターまとめまとめ!2月25日開催!
トップ
ニュース
社会
地域
芸能・スポーツ
IT・Web
科学・教養
カルチャー
趣味
生活
仕事
ネタ・お笑い
ログ・日記
震災
AKB48
iwj
支援
なりきり武将
支援物資
放射能
ニコニコ動画
速報
国内
アジア
アメリカ
ヨーロッパ
その他
政治
経済
国際
法律
環境
コラム
東京
東京近郊
北海道
東北
関東
北陸・信越
東海
近畿
中国・四国
九州・沖縄
海外
芸能
テレビ
ラジオ
野球
サッカー
ゴルフ
格闘技
競馬
モータースポーツ
その他
Android
Apple
インターネット
パソコン
モバイル
ガジェット
サイト制作
プログラミング
その他
科学
テクノロジー
エネルギー
数学
物理
宇宙
自然
人文
建築
心理
その他
アニメ
ゲーム
マンガ
アイドル
映画
音楽
書籍
演劇
ファッション
社会学
カメラ
車・バイク
電車
旅行
釣り
歴史
アート
デザイン
動物
その他
ハウツー
レシピ
グルメ
恋愛
マネー
節約
健康・医療
教育
ペット
起業・ベンチャー
経営
マーケティング
会計・人事
法務
就職・転職
語学・資格
ネタ
お笑い
大喜利
画像・動画
やってみた
その他
ログ
日記
思い出
雑談
メモ
飲み会
議事録
イベント
セミナー
復興
原発
支援
政府
自治体
トップ
>
トップ
>
AKB48
> BigQueryってなんぞ?
2010/05/27 01:07:33
bigquery
+
BigQueryってなんぞ?
BigQueryってなんぞ?
by
kazunori_279
10 fav
1847 view
お気に入りに登録ならここをクリック!
まとめ
メニューを開く
一括削除
@ashigeru
BigQueryってこんな文法で60B件のcountとかgroup byを数秒でこなしてたんですけど、中身想像づきますか?
http://goo.gl/jtti
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 22:52:23
@kazunori_279
びりおんですか
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 22:53:11
@kazunori_279
や、ぶっちゃけクエリの内容次第かと思いますが
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 22:54:58
@ashigeru
600億件です。group byでcountとか5秒くらいでした。
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 22:55:34
@ashigeru
単純な全件とかなら事前カウントで対応できるけど、先の文法の自由度で「Typical queries execute in seconds.」とうたっているので、どんな仕組みやねん。。と
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:02:06
@kazunori_279
純粋にgroupby countを早くするだけなら、distributed Btree辺りを使えばそのスピードはアドホックに計算しても出せなくはない…かも
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:03:23
@ashigeru
ふ~む。ではjoinなしで、すべてのカラムについて値付きのbtreeを作っておく感じかな。。?
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:06:21
@kazunori_279
ついでに、フィールドごとにdistinctした表とかも持ってそうな印象です
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:11:04
"WHERE word CONTAINS "th"" とか部分一致検索もOKみたい。むぅ
#bigquery
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:12:38
@kazunori_279
そういう意味で、速いクエリと遅いクエリの例が大量にないと推測しづらいですね。
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:16:27
@ashigeru
60B件とかだと、遅いクエリってのは実質実行不可能と思うのですよね。。
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:18:51
@kazunori_279
リアルタイムなのかバッチなのか、その辺りによると思いますよ
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:19:56
@ashigeru
クエリはリアルタイムで、インポートはバッチっぽい印象です(インポート処理についてあまり紹介されなかったのがミソかも)
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:22:07
@kazunori_279
ちなみにここに書いてある構文だと、フィルタ部分はリニアな並列性があると思います
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:28:50
@ashigeru
ふむ。でも並列処理できるとしても、部分一致検索とかは全検索?それとも転置インデックス等?
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:30:30
@kazunori_279
事前計算を前提としないなら、数百万件ごとに分散して、局所性をもってシーケンシャルスキャンする感じです。秒オーダーだからこそ許される大技w
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:32:51
@ashigeru
そんな力業なのかぁ。。それこそMapReduceっぽいなww
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:33:53
@kazunori_279
いや、もちろん想定の上を行く可能性は高いと思いますよ。私がもし同じ制約でアーキテクチャ考えたら…っていうだけです
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:36:46
@ashigeru
googleなら...googleならきっと想像の斜め上を行く仕掛けを使ってくれてるはずだ!
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:38:00
@kazunori_279
そう期待します。とりあえず逆関数がない関数をフィルタに使える時点で、フィルタに関してはある程度手法が限定される気はするんですよね
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:40:22
@ashigeru
逆関数とフィルタの関係...わからんw
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:47:14
@kazunori_279
とりあえずあの資料だけ見て感じるのは、フィルタの局所性が高い(たぶんエンティティに閉じてる)、極端にネットワーク通信を嫌う、って辺りです
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:48:49
@ashigeru
「エンティティに閉じてる」のところをできればkwsk
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:52:37
@kazunori_279
WHERE句に出現する項をすべて並べると、必ず同じエンティティのメンバか、単なる定数、またはそれに何らかの演算をしたものになると思います。サブクエリの深さがnだったとしても、おそらくO(n)で基本O(1)になるはず
返信する
RTする
ふぁぼる
ashigeru
2010/05/26 23:55:34
@ashigeru
ふむ、joinがない、という意味ですか?たしかにjoinはなさそうですね。
返信する
RTする
ふぁぼる
kazunori_279
2010/05/26 23:59:11
Content from Twitter
残りを読む(18)
2011年を振り返ろう!傑作まとめランキングベスト20をこちらで公開中だよ。
みんなのおすすめ商品
商品を編集
おすすめ商品を登録する
設定を変更する
Check
お気に入り
いいね
うーん
ブログ等に貼付ける?
iframe版
拡張版
new
張付けプレビュー
コメント
コメントを入力してください。
Twitterにも投稿する
関連するオススメまとめ
Biglobe ツイッぷるナビの無礼な依頼文について
「稲わら等汚染」疑い牛の現況まとめ by Kontan_Bigcatさん
#appengine EG と Bigtable と ローカリティ
BigHopeClasic さんに聞く、「まおゆう」における「丘の向こう」の先にある不幸
デブサミ2011【17-C-1】Big Dataを扱うアーキテクチャの原則 萩原正義 氏 / 福井厚 氏
powered by Preferred Infrastructure
まとめを作成する
@togetter_jp
プロフィール
まだ自己紹介が設定されていません。
kazunori_279
twitter
rss
マイタグ
: 設定されていません。
このユーザの更新状況や活動をチェック!
フォローしている
0
フォローされている
0
まとめ
13
お気に入り
7
コメント
2
ikeike443さんの非同期とか継続のつぶやきまとめ
#appengine ja night #12
appengine ja night #11
メインフレームのSSDは半端なかった話
BigQueryってなんぞ?
もっと見る
真夜中のSTMトーク
太田さんによる某銀行のバッチについてのまとめ
appengine ja night #14 #ajn14
「属性」と「関係」
NoSQL 時代のデータモデル
もっと見る
ikeike443さんの非同期とか継続のつぶやきまとめ
100万PV/日のmixiアプリモバイルをGoogle App Engineで実装した@gclue_akira氏に直撃インタビュー
注目のまとめリスト
#男子スケーターの変衣装ください
モバイルSNSゲームが儲かる本当の理由。かーずSPはなぜ15万..
第5回九州社協職員合同研究会議『災害と社協』第3部「日常の..
猪飼論文への反論
生活保護は働け~!! うつは甘えだ~!! というテンプレ..
駐日フィンランド大使館公式ツイッターによる、日常フィンラン..
トゥギャッター通信
第64回「ネコストーブとクレカトラブル」
第63回「iPhone爆発と震災の備え」
第62回「byeハドソンとエロ駅弁」
第61回「謎の雲とセンター試験」
第60回「江戸ハックとお雑煮」
トゥギャッターからのお知らせ
とっても簡単!はじめてのトゥギャッター..
まとめへのフィードバック機能がつきました!
まとめ作成画面でつぶやきへの返信の流れ..
トゥギャッターのまとめは「はてなダイア..
t.coやbit.lyなど、短縮された..
過去のアーカイブ
2012-02-09の人気まとめ
2012-02-08の人気まとめ
2012-02-07の人気まとめ
2012-02-06の人気まとめ
2012-02-05の人気まとめ
最近追加された商品
絶対可憐チルドレン 22 (少年サンデーコミックス)
賭けマージャンはいくらから捕まるのか?―賭博罪から見えてくる法の考え方と問題点
《雪だるま/ブルー》パピエシール☆キャラクターグッズ(手帳ステッカー)通販☆
絶対可憐チルドレン 15 (少年サンデーコミックス)
俺のそばから離れるな! (角川ルビー文庫)
絶対可憐チルドレン 27 (少年サンデーコミックス)
コメント