技術 プログラムpython自然言語処理 [python]NLTKを使って、2つの自然言語の類似性を確認する方法 以下は、NLTK(Natural Language Toolkit)を利用した自然言語(英語)の類似性を調べるコードです import nltk from nltk.corpus import sto... 2024-11-19
技術 プログラムpythonmetabase [python]metabase apiを使って内部SQLで特定文字列の利用状況を調査する方法 metabase(BIツール)で内部に作成したSQL情報はAPI経由で一括抽出できたのでサンプルコードを残します。 用途としては、特定文字列が入ってるmetabaseのカードを洗い出す場合に使います。... 2024-11-19
技術 プログラムpython [python]dfの特定項目の件数と割合を算出する方法 # pandasのimport import pandas as pd # 項目のデータ別件数を取得 result = df.value_counts() # 項目のデータ別件数比率を取得 perce... 2024-11-18
技術 プログラムpython [python]dfの特定項目から4分位数を算出する方法 ## 特定項目から4分位数を算出する ## 以下ではscore項目から0,25%,50%, 75%, 100%の値を算出する df.quantile() > 0.00 0.0000 > 0.25 7.... 2024-11-13
技術 プログラムpython [python]dfからランダムサンプリングする方法 ## dfから70%のデータをランダムサンプリングする df.sample(frac=0.7)... 2024-11-13
技術 プログラムpython [python]dfから数値型の項目のみを表示する方法 ## dfから数値型のみを表示 ## ここではfloat64とint64を指定しているがnumeric型などが必要であればリストの中に追加する df.select_dtypes(include=)... 2024-11-13
技術 プログラムpython [python]dfから文字列型の項目のみを表示する方法 ## dfから文字列型のみを表示 df.select_dtypes(include='object')... 2024-11-13
技術 プログラムpython [python]LangCheckを使って文章評価する手順 文章の有毒性、感情分析、流暢さについてスコア化をpythonでサクッと実行する例 # @title LangCheckのインストール !pip install langcheck # @title ラ... 2024-10-28
技術 プログラムSQLbigquery [bigquery]string項目内にhtml情報が入ってる場合の操作メモ テーブルの中に、以下のようなデータが入っている場合 項目名: string_html <p> 期間限定オリジナルドリンク販売中!<br>世界中で最ものまれている飲料の一つです&... 2024-10-22
技術 プログラムSQLbigquery [bigquery]項目種類=RECORD項目を作成するコード SELECT STRUCT( CAST( 10 AS NUMERIC) AS num01, CAST( 20 AS NUMERIC) AS num02, CAST( 30 AS NUMERIC) AS... 2024-10-03
技術 プログラムスプレッドシート [スプレッドシート]特定の文字列を含むセルの件数を数える関数 以下では、A列のセルに完了という文字列を含むセルの件数をカウントする =COUNTIF(A:A, "*完了*") ダブルクォーテーションで囲むのがポイントです。多分、シングルクォーテーションだとうまく... 2024-09-17