技術 SQLbigquery 【bigquery】ランダムサンプリングする方法 PR 2021-11-30 2022-05-09 bigqqueryでデータをランダムサンプリングするコードメモです。 SELECT * FROM dataset.table WHERE -- 以下を指定することでテーブルの10%のデータをランダムに抽出する RAND() < 0.1 この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 [linux]CRONジョブの実行履歴の確認方法 grep CRON /var/log/syslog CRONジョブが実行された日付、時間、ユーザーなどの情報を含むエントリが書き込まれたログ...
技術 [python]データフレームの項目名を日本語表記に変換する # ライブラリ読み込み import pandas as pd # カラム名を日本語に変更 df = df.rename(columns={...
技術 git add したファイルを元に戻す方法(ステージング解除) 以下は、 git add してしまったファイルを元に戻す時のコマンドまとめです。 この記事では、「ステージングしたファイルを、なかったことに...
技術 arxiv上の論文を日本語検索して一覧で見れるサイト(abstractの日本語要約あり) 興味のある論文を探すのにめちゃくちゃ便利でしたので紹介させてください。 arxiv上の30ページ以下でCreative Commonsライセ...
技術 [bigquery]変数定義あり、変数設定値なしでも利用可能なクエリの書き方 ## 変数定義 DECLARE _data_number INT64; ## 変数設定 SET _data_number = 10; -- ...