bigqqueryでデータをランダムサンプリングするコードメモです。
SELECT
*
FROM
dataset.table
WHERE
-- 以下を指定することでテーブルの10%のデータをランダムに抽出する
RAND() < 0.1
SELECT
*
FROM
dataset.table
WHERE
-- 以下を指定することでテーブルの10%のデータをランダムに抽出する
RAND() < 0.1
SELECT * FROM dataset.table WHERE -- 以下を指定することでテーブルの10%のデータをランダムに抽出する RAND() < 0.1