技術 プログラムpython [python]dfからランダムサンプリングする方法 PR 2024-11-13 2024-11-13 ## dfから70%のデータをランダムサンプリングする df.sample(frac=0.7) この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 Snowflakeの落とし穴!タイムスタンプ比較で意図せぬ結果になる時の対処法 SnowflakeでSQLを書いていて、「同じ日付なのに、なぜかa_date <= b_dateが期待と違う結果になる…」といった経験...
技術 [bigquery]プロシージャーに引数を入れて実行する 1) プロシージャに引数を設定するコード例 CREATE OR REPLACE PROCEDURE dataset.procedure(ta...
技術 [R]データの集計時のおすすめライブラリ(dplyr) SQLに慣れてる方がR言語を使って、データ集計を行う場合はdplyrが便利です。 qiitaのブログで詳しく書いてる方がいたのでリンクのみ↓...
技術 [python]dfの特定項目の件数と割合を算出する方法 # pandasのimport import pandas as pd # 項目のデータ別件数を取得 result = df.value_c...
技術 【トレジャーデータ】timeを使わない場合での日付操作コマンドメモ ◆特徴 トレジャーデータでパーティションされるのは、デフォルト設定のtimeのみである。それ以外の項目に対して、検索をしてもインデックスがな...