DuckDB × dbtで始める、クラウド不要のモダンデータエンジニアリング入門

2026-04-20 2026-04-20

はじめに

「dbtを試したいけれど、BigQueryやAWSの設定は面倒…」「まずは自分のPCの中だけで完結させたい」

そんな方に最適なのが DuckDB を使った構成です。

DuckDBは「分析用のSQLite」とも呼ばれる軽量なデータベースで、dbtと組み合わせることで、1円もかけず、ネットワーク環境も気にせずにデータパイプラインを構築できます。

まずは必要なライブラリをインストールします。

pip install dbt-duckdb

dbt init my_duckdb_project

【入力のポイント】

models/sample_model.sql を作成します。

{{ config(materialized='table') }}

select 
    1 as id, 
    'DuckDB' as db_name, 
    current_date as processed_at

dbt run

実行すると、プロジェクトフォルダ内に dev.duckdb というファイルが生成されます。これがデータベース本体です。

DuckDBがdbt練習に最適な最大の理由は、CSVやParquetファイルをそのままテーブルとして扱える点です。

例えば、dataフォルダに置いた users.csv を読み込むモデルはこれだけで書けます：

-- models/stg_users.sql
select * from read_csv_auto('data/users.csv')

DuckDBはファイル形式なので、中身を見るには以下の方法があります。

DuckDBでdbtの基本（ref関数、test、docs）をマスターすれば、接続先をBigQueryやSnowflakeに変えても、書くSQLやdbtの作法は全く同じです。

今回のステップの振り返り: