bigqqueryでデータをランダムサンプリングするコードメモです。

SELECT 
  *
FROM
  dataset.table
WHERE 
  -- 以下を指定することでテーブルの10%のデータをランダムに抽出する
  RAND() < 0.1

この記事が気に入ったら『目黒で働く分析担当の作業メモ』ご支援をお願いします!

※OFUSEに飛びます


おすすめの記事