技術 SQLbigquery 【bigquery】ランダムサンプリングする方法 PR 2021-11-30 2022-05-09 bigqqueryでデータをランダムサンプリングするコードメモです。 SELECT * FROM dataset.table WHERE -- 以下を指定することでテーブルの10%のデータをランダムに抽出する RAND() < 0.1 この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 [bigquery]時刻に文字が入っている場合の計算方法 SELECT date_time -- SPLIT関数で date_timeの中に入っている、min(分情報) を取り外す , SPLIT(...
技術 PythonでWEBスクレイピングやってみた(タイトルのみ抽出) ※以下コードはpython ver3.0以降のコードになっています。ver2の場合はいろいろ書き換えが必要 beautiful soupとい...
技術 [bigquery]複数の文字列を組み合わせて曖昧検索を行う select * from dataset.table where -- column_1の後ろ4文字と、columns_2の全文字を組み合...
技術 [openAI]プロンプトのトークン数を数える方法 以下へアクセス https://platform.openai.com/tokenizer Tokenizerの画面が表示されるので、モデル...
技術 [データ可視化]googleスプレッドシートをデータポータル に接続する方法 Googleスプレッドシートにデータを用意すれば、データポータル で無料で可視化できます。(2021/9/25現在) 今回、Googleスプ...
技術 [トレジャーデータ]PRESTOで基準日をベースにして日付操作を行う SELECT target_date , CAST(target_date AS timestamp) -- timestamp型に変換 ,...