技術 プログラムpython [python]dfからランダムサンプリングする方法 PR 2024-11-13 2024-11-13 ## dfから70%のデータをランダムサンプリングする df.sample(frac=0.7) この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 [python]データの変換による特徴量の作成方法 データの確認 df.head() apply関数 # 1)datetimeから年を取得して、yearという項目を追加する(spilitで-毎...
技術 Pythonで文字列の類似度を測る!jellyfishライブラリ データ分析や自然言語処理(NLP)の世界では、文字列の比較やマッチングが頻繁に登場します。例えば、ユーザーの入力ミスを補正したり、住所や人名...
技術 [Excel]複数のワードを含む文字列をワイルドカード指定して検索する 文面の中から、特定ワードを2個組み合わせて抽出し、その組み合わせ数がどれだけあるか?を抽出する方法。 これは、Excelの"countifs...
技術 git add したファイルを元に戻す方法(ステージング解除) 以下は、 git add してしまったファイルを元に戻す時のコマンドまとめです。 この記事では、「ステージングしたファイルを、なかったことに...
技術 [bigquery]配列を使ってレコード増幅する方法 SELECT DISTINCT -- DISTINCT指定することで配列データからレコードを増幅する id, start_date, end...