技術 プログラムpython自然言語処理 [python]NLTKを使って、2つの自然言語の類似性を確認する方法 以下は、NLTK(Natural Language Toolkit)を利用した自然言語(英語)の類似性を調べるコードです import nltk from nltk.corpus import sto... 2024-11-19
技術 プログラムpythonmetabase [python]metabase apiを使って内部SQLで特定文字列の利用状況を調査する方法 metabase(BIツール)で内部に作成したSQL情報はAPI経由で一括抽出できたのでサンプルコードを残します。 用途としては、特定文字列が入ってるmetabaseのカードを洗い出す場合に使います。... 2024-11-19
技術 プログラムpython [python]dfの特定項目の件数と割合を算出する方法 # pandasのimport import pandas as pd # 項目のデータ別件数を取得 result = df.value_counts() # 項目のデータ別件数比率を取得 perce... 2024-11-18
技術 プログラムpython [python]dfの特定項目から4分位数を算出する方法 ## 特定項目から4分位数を算出する ## 以下ではscore項目から0,25%,50%, 75%, 100%の値を算出する df.quantile() > 0.00 0.0000 > 0.25 7.... 2024-11-13
技術 プログラムpython [python]dfからランダムサンプリングする方法 ## dfから70%のデータをランダムサンプリングする df.sample(frac=0.7)... 2024-11-13
技術 プログラムpython [python]dfから数値型の項目のみを表示する方法 ## dfから数値型のみを表示 ## ここではfloat64とint64を指定しているがnumeric型などが必要であればリストの中に追加する df.select_dtypes(include=)... 2024-11-13
技術 プログラムpython [python]dfから文字列型の項目のみを表示する方法 ## dfから文字列型のみを表示 df.select_dtypes(include='object')... 2024-11-13
技術 プログラムpython [python]LangCheckを使って文章評価する手順 文章の有毒性、感情分析、流暢さについてスコア化をpythonでサクッと実行する例 # @title LangCheckのインストール !pip install langcheck # @title ラ... 2024-10-28
技術 プログラムpythoncolab統計 [python]google_colab上でZ検定を行う方法 # @title Z検定 import numpy as np from scipy import stats def ab_test_conversion_rate(conversions_a, s... 2024-09-17
技術 プログラムpythongitissue [python]github-issueをapi経由でcsvファイル化する方法 import requests import pandas as pd def fetch_issues(owner, repo, token): url = f"https://api.github... 2024-09-16
技術 プログラムpython [python]文字列の中から数字のみを抽出するコード import re # 文字列の定義 text = '2024年07月28日 15時30分' # 文字列の中から数字のみを抽出 num = re.sub(r'\D', '', text) print(... 2024-07-28