技術 SQLPrestoトレジャーデータ 【トレジャーデータ】Prestoでランダムサンプリングする方法 PR 2019-03-15 2021-12-18 50%のデータをランダムで取得する方法 SELECT * FROM DB.table TABLESAMPLE BERNOULLI(50) この記事が気に入ったら『目黒で働く分析担当の作業メモ』にご支援をお願いします! ※OFUSEに飛びます
技術 【トレジャーデータ】PRESTOにおけるパフォーマンスチューニングメモ 大量データの処理を行う場合などで処理効率を上げるのに使うコードを書いていきます。 SMART_DIGEST() : 文字列を短いハッシュ値に...
技術 [slack]カスタム絵文字は「半角英数字登録」したほうがよさそう 2022/8/中ぐらいから、slackに登録したカスタム絵文字で、全角日本語で登録してあったものが、メッセージ投稿できなくなったようです。(...
技術 PythonでWEBスクレイピングやってみた(タイトルのみ抽出) ※以下コードはpython ver3.0以降のコードになっています。ver2の場合はいろいろ書き換えが必要 beautiful soupとい...
技術 [bigquery]平均値と中央値を算出する方法 SELECT AVG(price) as avg_value, -- 平均値 APPROX_QUANTILES(price, 2) as m...