技術 スプレッドシート [スプレッドシート]Excelでよく使っていた機能について【適宜更新】 Excel離れしていて、 スプレッドシートを使ってます。という人が増えてきてる気がするこの頃。 その際、Excelでよく使っていてスプレッドシートではどうやるの? というニーズが増えてきたので、ブログ... 2019-03-22
技術 SQLPrestoトレジャーデータ 【トレジャーデータ】Prestoでランダムサンプリングする方法 50%のデータをランダムで取得する方法 SELECT * FROM DB.table TABLESAMPLE BERNOULLI(50)... 2019-03-15
技術 プログラムpython 【python】Plotlyで綺麗なグラフを描く pythonでデータを綺麗に可視化する対応は以下のブログにて https://qiita.com/takaiyuk/items/e68c493642adfb04310e... 2019-02-27
技術 [R]データの集計時のおすすめライブラリ(dplyr) SQLに慣れてる方がR言語を使って、データ集計を行う場合はdplyrが便利です。 qiitaのブログで詳しく書いてる方がいたのでリンクのみ↓ https://qiita.com/matsuou1/it... 2019-02-20
技術 データサイエンティスト [メモ]日本におけるデータサイエンティストの分業体制における課題点について 日本データサイエンティスト協会によると、 データサイエンティストは以下のように、3つのスキルが必要と言われています。 1:ビジネス力 2:エンジニアリング力 3:データサイエンス力 これらのスキ... 2019-02-13
技術 確定申告 [確定申告]amazonの購入履歴をCSVで取得する手順 確定申告対応用 https://leemanparadise.com/neta/amazon-purchase-history-csv-download/... 2019-02-11
技術 slack [slack]メンバーの削除方法 (2021/9/21時点) slackのメンバー削除方法が結構わかりにくいところにあるので、手順メモ残します。 1. slackの画面左上にあるワークスペース名をクリック 2. 設定と管理をクリック 3. メンバーを管理するをク... 2019-01-26
技術 プログラムpythonPresto [python]トレジャーデータ (presto)にjupyterからアクセスする手順 jupyterでpandas-tdをインストールする !pip install pandas-td 必要なライブラリの読み込み import os import pandas as pd import... 2019-01-16
技術 プログラムpython [python]データの変換による特徴量の作成方法 データの確認 df.head() apply関数 # 1)datetimeから年を取得して、yearという項目を追加する(spilitで-毎に分割して、一番最初) df = df.apply(lamb... 2019-01-06
技術 プログラムpython機械学習 [python]欠損値に関する処理例 分析用に収集したデータに欠損値(null)が入っている場合、そのまま利用すると、正しい分析結果が得られない場合がある。 その為、この欠損値が含まれるデータを除外したり、欠損値を0や対象項目の平均値に変... 2019-01-05
技術 SQLPrestoトレジャーデータ 【トレジャーデータ 】テーブル名称やカラムが存在するテーブルを検索する便利コード information_schemaからいろいろ抽出するときによく使うコード 対象テーブル名が存在するものをすべて抽出する SELECT CONCAT(table_schema, '.', table... 2018-12-21