技術 SQLbigquery 【bigquery】ランダムサンプリングする方法 PR 2021-11-30 2022-05-09 bigqqueryでデータをランダムサンプリングするコードメモです。 SELECT * FROM dataset.table WHERE -- 以下を指定することでテーブルの10%のデータをランダムに抽出する RAND() < 0.1 この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 【環境】puttyの全角文字が文字化けしてる場合の対処方法 puttyのバー部分を選択し右クリック→「設定の変更」→「ウィンドウの変換」→「リモートの文字セット」のデフォルトが「EUC」になっているが...
技術 [python]データフレームの特定項目でグルーピングして最小値、最大値を算出する方法 ## idでグルーピングし、その中でsalesが最も小さいレコードを抽出する df.loc.idxmin()] なお、上記の、idxminの...
技術 [linux]shellで自動メールに添付ファイルつけて送信する方法 添付するファイルの内部変数を定義する #!/bin/sh export LC_ALL=C export LANG=ja_JP.UTF-8 #...
技術 【mysql】プロシージャーを使った繰返し処理について 繰返し処理でテーブルに何度もレコードを挿入する場合等に使います。 例えば、日別でデータ集計する処理を作った場合、過去3年分同じように集計する...