技術 SQLPrestoトレジャーデータ 【トレジャーデータ】Prestoでランダムサンプリングする方法 PR 2019-03-15 2021-12-18 50%のデータをランダムで取得する方法 SELECT * FROM DB.table TABLESAMPLE BERNOULLI(50) この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 [python]データの変換による特徴量の作成方法 データの確認 df.head() apply関数 # 1)datetimeから年を取得して、yearという項目を追加する(spilitで-毎...
技術 [トレジャーデータ]PRESTOで条件分岐して集計を行う -- IFを利用して一つの項目から比率を求める -- 以下では、購入区分 に1(購入者)が入っている顧客とそれ以外の顧客を判定し、日別で購入...
技術 [linux]ファイル名称に日付が入っているものを指定してコピーする方法 # 前日日付を設定 before_ymd=`date --date "1 day ago" "+%Y-%m-%d"` #ファイル名称に日付が...
技術 [python]データフレームの項目を%表示に変えるコード # 0.05などの項目を 5%に変換する import pandas as pd ## データを読込む df = pd.read_csv('...