技術 R言語 [R]データの個数、平均値、標準偏差算出 PR 2015-11-08 2021-10-23 以下データに関して、 shohin_tbl > SHURUI PRICE YMD > 1 野菜 250 20151010 > 2 米 3000 20151008 > 3 肉 500 20151011 ◆データの個数を求める length(shohin_tbl) > [1] 3 ◆データの平均値を求める mean(shohin_tbl$PRICE) > [1] 1250 ◆データの標準偏差を求める sd(shohin_tbl$PRICE) > [1] 1520.691 この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 Pythonで文字列の類似度を測る!jellyfishライブラリ データ分析や自然言語処理(NLP)の世界では、文字列の比較やマッチングが頻繁に登場します。例えば、ユーザーの入力ミスを補正したり、住所や人名...
技術 [linux]あるディレクトリ以下を再帰的に検索する 現在のディレクトリ以下に存在するファイル全ての中身に、検索文字列を探す処理。 find ./ -name '*' | xargs grep ...
技術 【bigquery】ランダムサンプリングする方法 bigqqueryでデータをランダムサンプリングするコードメモです。 SELECT * FROM dataset.table WHERE -...
技術 [python]NLTKを使って、2つの自然言語の類似性を確認する方法 以下は、NLTK(Natural Language Toolkit)を利用した自然言語(英語)の類似性を調べるコードです import nl...