google colabに初期提供されている(2021/9/21時点)カルフォルニアハウジングのテストデータを使って、AutoVizでサクッとcolab上に可視化してみました。colabの設定が変わらない限りは多分この流れで可視化できるはず。
AutoVizの特徴と用途
・AutoVizはデータの概要(分布や相関など)を一発で可視化する便利ツール
・探索的データ解析(EDA:Exploratory data analysis)を行うことで、データの理解を深めて分析の方向性を探る
・データの特徴を掴む為の調査コストを削減することができるようになった
サンプルコード
# インストール !pip install autoviz # ライブラリのインポート from autoviz.AutoViz_Class import AutoViz_Class # colabにデフォルトで入っているデータを読み込む filename = "/content/sample_data/california_housing_test.csv" # AutoVizでデータを可視化 graph = AutoViz_Class().AutoViz( filename, sep=",", depVar="", dfte=None, header=0, verbose=0, lowess=False, chart_format="svg", max_rows_analyzed=150000, max_cols_analyzed=30, )
出力結果
使ってみて(感想)
とりあえず、いろいろな情報が一発で可視化されるのと、無料で利用できる点が有用と思われます。
ただし、pythonでのデータ可視化に慣れてないと何かすごそう。ぐらいで終わってしまう場合もあるかもしれないので、しばらく業務活用しているデータを同じように見てみて、どう使えるか?は現場単位で考える必要があると思いました。