技術 プログラムpython [python]dfからランダムサンプリングする方法 PR 2024-11-13 2024-11-13 ## dfから70%のデータをランダムサンプリングする df.sample(frac=0.7) この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 [bigquery]テーブルへのレコード挿入方法(insert) -- レコードのinsert処理 INSERT dataset.table(name, num, buy_day) VALUES ('みかん...
技術 [トレジャーデータ]PRESTOでVARCHARの数値項目(区切り文字付き)があった場合に除外して合算する方法 SELECT shohin_cd , SUM(CAST(REPLACE(sales, ',', '') AS INTEGER)) AS sa...
技術 商品マスタ名寄せにおけるNFKC正規化の適用:表記ゆれ対応 商品マスタの管理において、データの均質性を確保することは、集計・分析の正確性およびシステム連携の安定性を維持するために不可欠です。本記事では...
技術 [bigquery]配列項目をグルーピングする方法 bigqueryでは配列をGROUP BYしようとすると、以下のようなエラーになります。 SELECT status, count(1) a...
技術 [bigquery]日付変換(年月情報だけを取得する) - 事前にDECLAREで変数定義 DECLARE created_at TIMESTAMP; -- 変数に値を設定 SET created...