bigqqueryでデータをランダムサンプリングするコードメモです。

SELECT 
  *
FROM
  dataset.table
WHERE 
  -- 以下を指定することでテーブルの10%のデータをランダムに抽出する
  RAND() < 0.1
おすすめの記事