記事の対象者と解消できるお悩み
【対象者】
初中級データアナリスト
【興味関心】
- 住宅市場の動向
- 地域別の住宅価格
- 住宅不足問題
- 不動産投資
- データに基づいた事業展開
【解消できるお悩み】
- 住宅価格の高騰が続いているけど、今後どうなるの?
- どの地域で住宅価格が上昇しているのか、あるいは下落しているのか知りたい
- 住宅不足が深刻な地域はどこか?
- 不動産投資に適した地域を見つけたい
- データ分析を基に、新規事業展開を検討したい
記事作成者
【人物】株式会社志庵 代表取締役 佐藤 光 起業6年目
【経歴】株式会社光通信➜光通信同期と起業➜データアナリスト転職➜SaaSで2度目起業
【会社実績】
SaaS 資金調達無しARR2億円
SaaS GMV200億円
【内容】自社AaaSであるStruccle、webスクレイピング、BigQueryに関する記事を作成
各種用語
- ARR(Annual Recurring Revenue)
- サブスクリプションサービスの年間売上※当社はSaaS売上
- Struccle(ストラクル)
- 株式会社志庵が独自開発しているAaaS
- AaaS(アース)
- Data Analytics as a Serviceの意
- SaaS(サース)
- Software as a Serviceの意
- GoogleCloudPlatform
- Googleが提供するクラウドプラットフォーム。この中に様々なサービスが存在する。
- GCP(ジーシーピー)
- GoogleCloudPlatformの略
- BigQuery(ビッグクエリ)
- 上記GCPの中に含まれるデータ分析基盤サービス
- SQL(エスキューエル)
- データベースを操作するプログラミング言語
- クエリ
- SQLで記述した命令文
- クエリ例)
- SQL構文のクエリ⬇
SELECT item_name, price FROM sales_table where price >= 1000;
- 上記クエリ(命令文)の意味としては「売上テーブル(sales_table)から価格(price)が1000円以上の商品名(item_name)と価格(price)を抽出する」
- SQL構文のクエリ⬇
- ペタバイト
- データの単位 ペタバイト=1000テラバイト=約100兆行のデータ
概要
住宅は、人々の生活基盤であり、その価格や供給状況は、経済や社会に大きな影響を与えます。住宅価格の高騰や住宅不足は、多くの人々にとって深刻な問題であり、これらの問題の現状を把握し、解決策を探ることは、社会全体の課題となっています。
今回は、Google Cloudのデータウェアハウス「BigQuery」と、アメリカ国勢調査局が公開している住宅建設に関する無料公開データを使って、住宅問題の現状と課題を分析します。BigQueryの強力な分析機能を活用すれば、住宅価格、着工件数、地域別の住宅供給状況などを分析し、住宅価格の高騰や住宅不足が深刻な地域を特定することができます。この記事では、BigQueryを使って住宅建設データを分析する方法と、そこから得られたインサイトを紹介します。データ分析初心者の方でも、BigQueryを使えば、複雑な住宅市場の動向を理解し、住宅問題の解決策を考えるためのヒントを得ることができるでしょう。
目次
- BigQueryで住宅問題を分析するメリット
- 分析に使用するBigQueryのデータセット
- BigQueryで住宅問題を分析する手順
- BigQueryを使った住宅問題分析例
- FAQ:BigQueryに関するよくある質問
- まとめ:BigQueryで住宅問題の現状を把握し、より良い住まいを目指そう!
1. BigQueryで住宅問題を分析するメリット
BigQueryは、住宅問題の分析に最適なツールです。その理由は、以下の様なメリットがあるからです。
- 大規模データの高速処理: 膨大な住宅データを高速に分析できるため、住宅市場のトレンドや地域特性を効率的に把握できます。
- 様々なデータソースとの連携: 公開データ、不動産会社のデータ、人口統計データ、地理空間データなど、様々なデータソースと連携できるため、住宅問題を多角的に分析できます。
- 豊富な分析機能: SQL、機械学習、統計分析など、高度な分析機能を利用できるため、複雑な住宅データ分析にも対応できます。
- コストパフォーマンスの高さ: 従量課金制なので、必要な時に必要なだけ利用でき、コストを抑えられます。
- 高いセキュリティ: Google Cloudの強固なセキュリティ基盤により、安心してデータを管理できます。
2. 分析に使用するBigQueryのデータセット
今回の分析では、BigQueryの公開データセット「New Residential Construction」を使用します。このデータセットは、アメリカ国勢調査局が収集した、アメリカの住宅建設に関するデータです。データの内容は、着工件数、販売件数、価格、地域、住宅タイプなどです。このデータセットは、住宅市場の動向を分析するのに適しています。特に、`new_residential_construction`テーブルには、期間、カテゴリ、地域、データ型、調整済みかどうか、値などの情報が含まれています。
3. BigQueryで住宅問題を分析する手順
BigQueryで住宅問題を分析する手順は以下の通りです。
3.1 1. データ確認
まず、データセットの内容を確認します。BigQueryコンソールのUIでデータセットのスキーマを確認したり、サンプルデータをプレビューしたりすることで、データの構造や内容を理解することができます。`census_bureau_construction.new_residential_construction`テーブルには、住宅建設に関する詳細情報が記録されています。`geo_desc`カラムには地域情報、`category_desc`カラムには建物の種類、`value`カラムには販売件数や価格などの値が含まれています。
3.2 2. データ加工
必要に応じて、データを加工します。例えば、日付データを年、月、日、曜日などに分割したり、特定の地域や住宅タイプに絞り込んだり、集計を行ったりします。BigQueryは、SQLを使ってデータ加工を行うための様々な関数を提供しています。
3.3 3. データ分析
加工したデータに対して、SQLクエリやBigQuery MLなどを用いて分析を行います。例えば、住宅価格の推移、地域別の住宅着工件数、住宅販売件数の変化、住宅不足の地域などを分析することができます。また、機械学習を用いて、将来の住宅価格や需要を予測するモデルを構築することも可能です。
3.4 4. 考察と分析結果の活用
分析結果に基づいて、住宅問題の現状と課題について考察します。住宅価格の高騰や住宅不足が深刻な地域はどこなのか、その原因は何なのか、どのような対策が有効なのかなどを分析し、レポートにまとめます。分析結果を基に、住宅政策の提言、不動産投資戦略の立案、住宅購入の意思決定などに役立てることができます。
4. BigQueryを使った住宅問題分析例
住宅問題は、世界中で多くの人が関心を寄せるテーマです。
特に、住宅価格の高騰や住宅不足は、生活の質や経済活動に大きな影響を与えます。
今回は、BigQuery公開データセットbigquery-public-data.census_bureau_construction.new_residential_constructionを用いて、アメリカの住宅建設に関するデータ分析を行い、住宅問題の現状と課題について考察します。
このデータセットには、新規住宅建設に関する様々な情報が含まれており、地域別の建設状況や、住宅の種類、価格帯などを分析することができます。
BigQuery分析例:地域別・新規住宅着工件数
地域(geo_desc)別に、新規住宅着工件数(housing_starts)を集計し、住宅供給の地域差を分析します。
SELECT
geo_desc,
SUM(value) AS housing_starts
FROM `bigquery-public-data.census_bureau_construction.new_residential_construction`
GROUP BY geo_desc
ORDER BY housing_starts DESC
【BigQuery SQL解説】
- SUM(value)で、地域別の新規住宅着工件数を合計します。
- GROUP BY句で、地域(geo_desc)ごとに集計します。
- ORDER BY句で、新規住宅着工件数(housing_starts)の降順に並べ替えます。
【BigQuery分析での活用例】
- 新規住宅着工件数(housing_starts)が多い地域と少ない地域を比較することで、住宅供給の地域差を把握できます。
- 人口増加率や世帯数などのデータと組み合わせることで、住宅需要と供給のバランスを分析し、住宅不足のリスクが高い地域を特定することができます。
BigQuery分析例:期間別・住宅価格帯別着工件数
住宅価格の高騰傾向を分析するため、期間(period_date)別・住宅価格帯(category_desc)別に、新規住宅着工件数(housing_starts)を集計します。
SELECT
period_date,
category_desc,
SUM(value) AS housing_starts
FROM `bigquery-public-data.census_bureau_construction.new_residential_construction`
GROUP BY 1, 2
ORDER BY period_date, housing_starts DESC
【BigQuery SQL解説】
- SUM(value)で、期間別・住宅価格帯別の新規住宅着工件数を合計します。
- GROUP BY句で、期間(period_date)と住宅価格帯(category_desc)ごとに集計します。
- ORDER BY句で、期間(period_date)と新規住宅着工件数(housing_starts)の降順に並べ替えます。
【BigQuery分析での活用例】
- 期間(period_date)ごとの住宅価格帯(category_desc)別着工件数(housing_starts)の変化をグラフ化することで、住宅価格の高騰傾向を可視化できます。
- 高価格帯の住宅着工件数の増加が顕著な地域や期間を特定することで、住宅価格バブルのリスクや、住宅 affordability の問題などを分析することができます。
注意点
- これらのクエリは、BigQuery公開データに基づいています。データの正確性や最新性については、実際のBigQuery公開データをご自身でご確認ください。
- 当該分析は、様々な要因を総合的に判断する必要があります。これらのクエリは分析の一例であり、意思決定の根拠として単独で使用すべきではありません。
5. FAQ:BigQueryに関するよくある質問
Q1. BigQueryの無料枠を超えて利用すると、どのくらい費用がかかりますか?
A1. 無料枠を超えた場合、従量課金制で料金が発生します。料金は、処理したデータ量やストレージ容量などによって異なります。詳しくは、BigQueryの料金ページをご確認ください。
Q2. BigQueryで使えるSQLは、他のデータベースと同じですか?
A2. BigQueryは標準SQLをサポートしており、他のデータベースで学んだSQLの知識を活かすことができます。ただし、BigQuery独自の関数や構文も存在するため、BigQueryのドキュメントで詳細を確認することをおすすめします。
Q3. SQLの学習には、どのような教材がありますか?
A3. SQLの学習には、オンライン学習サイト、書籍、動画教材など、様々な教材があります。初心者向けの教材から、上級者向けの教材まで、レベルに合わせて選ぶことができます。Googleが提供するBigQueryのチュートリアルもSQLの学習に役立ちます。
6. まとめ:BigQueryで住宅問題の現状を把握し、より良い住まいを目指そう!
BigQueryは、住宅問題を分析するための強力なツールです。BigQueryの高速な処理性能と豊富な分析機能、そして無料公開データセットを活用することで、住宅価格の高騰や住宅不足といった社会問題の現状を把握し、その解決策を探ることができます。ぜひ、BigQueryを導入し、データ分析の力をより良い住まいづくりに活かしましょう。
BigQuery導入サポート、転職検討中の方はお問い合わせフォームからご相談くださいませ。
誠心誠意精一杯対応いたします。
【参考URL】
GoogleCloudPlatform:https://console.cloud.google.com/welcome/new
BigQuery:https://cloud.google.com/bigquery?hl=ja
BigQueryリリース情報:https://cloud.google.com/bigquery/docs/release-notes
BigQuery料金:https://cloud.google.com/bigquery/pricing
BigQuery料金無料枠:https://cloud.google.com/bigquery/pricing?hl=ja#free-tier
Google Cloud活用事例:https://cloud.google.com/customers/index.html?hl=ja#
Looker Studio:https://cloud.google.com/looker-studio?hl=ja
Looker Studioサンプル:https://cloud.google.com/bigquery/docs/visualize-looker-studio?hl=ja