技術 SQLbigquery 【bigquery】ランダムサンプリングする方法 PR 2021-11-30 2022-05-09 bigqqueryでデータをランダムサンプリングするコードメモです。 SELECT * FROM dataset.table WHERE -- 以下を指定することでテーブルの10%のデータをランダムに抽出する RAND() < 0.1 この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 【トレジャーデータ】対象レコードの前後のレコードから値を取得する方法 対象レコードより前のレコード値を取得する(LAG関数) SELECT target_date , item_cd , price, -- 第...
技術 【トレジャーデータ】prestoでgroup by時に対象項目以外を抽出する方法 他のSQLでは利用できないが、PRESTOで使えるナイスなUDFです。 -- shohin_idでgroup byしつつ、group by ...
技術 [EXCEL]一番右端のセルにある文字列を取得する方法 Excelで入力値がある一番右端の値をとってくる方法↓ ※INDEX関数と、MATCH関数の組み合わせで取得可能 =INDEX(B5:F5,...
技術 [python]NLTKを使って、2つの自然言語の類似性を確認する方法 以下は、NLTK(Natural Language Toolkit)を利用した自然言語(英語)の類似性を調べるコードです import nl...
技術 [python]google search console apiを使って平均掲載順位(90日平均)を取得する方法 # マネージド機能のインストール(初回のみ実行) pip install --upgrade google-api-python-clien...
技術 GitHubで直接編集した後の push エラー解決法 手動でgithub上のREADMEなどを修正した後、ローカルでgit pull せずに開発進めてしまった時の対策についてメモ 事象 GitH...