技術 SQLbigquery 【bigquery】ランダムサンプリングする方法 PR 2021-11-30 2022-05-09 bigqqueryでデータをランダムサンプリングするコードメモです。 SELECT * FROM dataset.table WHERE -- 以下を指定することでテーブルの10%のデータをランダムに抽出する RAND() < 0.1 この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 AWS Auroraの大量データをコマンドラインで高速にTSVエクスポートしてスプレッドシートで開く方法 CursorやVS CodeのDB拡張機能を使って、AWS Aurora上のデータをエクスポートしようとして失敗したことはありませんか? 数...
技術 [linux]crontabのバックアップを自動化 crontabを自動でバックアップとっておくことで、誤った削除を防ぐには、shellを利用して、crontab のバックアップコマンドを毎日...
技術 マルコフ連鎖とは?未来を予測するシンプルな考え方 マルコフ連鎖を一言でいうと、「未来の出来事は、現在の状態だけで決まり、過去の経緯は関係ない」という考え方に基づいた、未来を予測するための数学...
技術 [python]データをいろいろな表形式で表示する方法 ## インストール pip install tabulate ## pythonでのコード例 from tabulate import ta...
技術 【スプレッドシート】Query関数でSQLと同じ抽出や変換が出来る これを使えば、スプレッドシートで色々楽ができる。 特に集計関数を使って、同一項目の存在数をCOUNTするのはよく使う。 ここがおすすめ...