記事の対象者と解消できるお悩み
【対象者】
初中級データアナリスト
【興味関心】
- 気候変動問題
- 環境問題
- 持続可能な社会
- 社会貢献
- データ分析の可能性
【解消できるお悩み】
- 気候変動の影響が具体的にどんなものか知りたい
- 地球温暖化って本当に深刻なの?
- データ分析で環境問題に貢献できるの?
- BigQueryを使ってどんな社会貢献ができるの?
記事作成者
【人物】株式会社志庵 代表取締役 佐藤 光 起業6年目
【経歴】株式会社光通信➜光通信同期と起業➜データアナリスト転職➜SaaSで2度目起業
【会社実績】
SaaS 資金調達無しARR2億円
SaaS GMV200億円
【内容】自社AaaSであるStruccle、webスクレイピング、BigQueryに関する記事を作成
各種用語
- ARR(Annual Recurring Revenue)
- サブスクリプションサービスの年間売上※当社はSaaS売上
- Struccle(ストラクル)
- 株式会社志庵が独自開発しているAaaS
- AaaS(アース)
- Data Analytics as a Serviceの意
- SaaS(サース)
- Software as a Serviceの意
- GoogleCloudPlatform
- Googleが提供するクラウドプラットフォーム。この中に様々なサービスが存在する。
- GCP(ジーシーピー)
- GoogleCloudPlatformの略
- BigQuery(ビッグクエリ)
- 上記GCPの中に含まれるデータ分析基盤サービス
- SQL(エスキューエル)
- データベースを操作するプログラミング言語
- クエリ
- SQLで記述した命令文
- クエリ例)
- SQL構文のクエリ⬇
SELECT item_name, price FROM sales_table where price >= 1000;
- 上記クエリ(命令文)の意味としては「売上テーブル(sales_table)から価格(price)が1000円以上の商品名(item_name)と価格(price)を抽出する」
- SQL構文のクエリ⬇
- ペタバイト
- データの単位 ペタバイト=1000テラバイト=約100兆行のデータ
概要
気候変動は、現代社会における最も重要な課題の一つです。地球温暖化による気温上昇、海面上昇、異常気象の増加など、地球環境に深刻な影響を与えています。これらの変化を理解し、将来を予測することは、持続可能な社会を実現するために不可欠です。
今回は、Google Cloudのデータウェアハウス「BigQuery」と、気候変動に関する無料公開データを使って、世界の気温変化を分析してみましょう。BigQueryの強力な分析機能を活用すれば、膨大な気象データから、気温の経年変化、地域別の気温変化、異常気象の発生状況などを分析することができます。この記事では、BigQueryを使って気候変動データを分析する方法と、そこから得られたインサイトを紹介します。データ分析初心者の方でも、BigQueryを使えば、地球規模で進行する気候変動を理解する一助となるでしょう。
目次
- BigQueryで気候変動データ分析を行うメリット
- 分析に使用するBigQueryのデータセット
- BigQueryで気候変動データを分析する手順
- BigQueryを使った気候変動データ分析例
- FAQ:BigQueryに関するよくある質問
- まとめ:BigQueryで気候変動を理解し、地球の未来に貢献しよう!
1. BigQueryで気候変動データ分析を行うメリット
BigQueryは、気候変動データ分析に最適なツールです。その理由は、以下の様なメリットがあるからです。
- 大規模データの高速処理: 膨大な気候変動データを高速に分析できるため、地球全体の気候変動を効率的に把握できます。
- 様々なデータソースとの連携: 公開データ、研究機関のデータ、気象庁の観測データなど、様々なデータソースと連携できるため、気候変動分析に必要なデータを統合的に分析できます。
- 豊富な分析機能: SQL、機械学習、統計分析など、高度な分析機能を利用できるため、複雑な気候変動データ分析にも対応できます。
- コストパフォーマンスの高さ: 従量課金制なので、必要な時に必要なだけ利用でき、コストを抑えられます。
- 高いセキュリティ: Google Cloudの強固なセキュリティ基盤により、安心してデータを管理できます。
2. 分析に使用するBigQueryのデータセット
今回の分析では、BigQueryの公開データセット「米国海洋大気庁(NOAA)」を使用します。このデータセットには、世界中の気象観測所の気温などの日次データが格納されています。このデータセットは、地球全体の気候変動を分析するのに適しています。
3. BigQueryで気候変動データを分析する手順
BigQueryで気候変動データを分析する手順は以下の通りです。
3.1 1. データ確認
まず、データセットの内容を確認します。BigQueryコンソールのUIでデータセットのスキーマを確認したり、サンプルデータをプレビューしたりすることで、データの構造や内容を理解することができます。`bigquery-public-data.noaa_gsod` データセットには、 `stations` と `gsod` テーブルが含まれています。`stations` テーブルには各国の情報が、`gsod` テーブルには日々の気象データが記録されています。
3.2 2. データ加工
必要に応じて、データを加工します。例えば、特定の地域や期間のデータに絞り込んだり、気温の単位を摂氏に変換したり、日々のデータを月平均や年平均に集計したりします。BigQueryは、SQLを使ってデータ加工を行うための様々な関数を提供しています。
3.3 3. 気温変化の分析
加工したデータに対して、SQLクエリやBigQuery MLなどを用いて分析を行います。例えば、世界の平均気温の経年変化を分析したり、地域別の気温変化を比較したりすることができます。また、機械学習を用いて、将来の気温変化を予測するモデルを構築することも可能です。
3.4 4. 異常気象の分析
気温の変化だけでなく、異常気象の発生状況を分析することも重要です。例えば、猛暑日や豪雨の発生頻度を分析することで、気候変動の影響をより具体的に把握することができます。BigQueryでは、過去の気象データを用いて、異常気象の発生確率を予測するモデルを構築することも可能です。
3.5 5. 考察と分析結果の活用
分析結果に基づいて、気候変動の現状と将来展望について考察します。地球温暖化の影響はどの程度深刻なのか、今後どのような変化が予測されるのか、私たちにできることは何かなどを考え、レポートにまとめます。分析結果を基に、環境問題への意識向上、環境保護活動への参加、持続可能な社会の実現に向けた取り組みなどを促進することができます。
4. BigQueryを使った気候変動データ分析例
今回は、BigQueryの公開データを使って、世界の気温の変化を分析してみましょう。
使用するデータセットは、米国海洋大気庁(NOAA)が提供している、世界各地の気象観測所の日次データです。
BigQuery分析例:世界の平均気温の推移
まずは世界の平均気温の推移を可視化してみましょう。
1929年〜2024年までのデータを集計しています。
WITH average_temperature_by_year AS (
SELECT
year,
ROUND(AVG(temp), 2) AS avg_temp
FROM `bigquery-public-data.noaa_gsod.gsod*`
WHERE temp < 9999.9
GROUP BY year
)
SELECT
year,
avg_temp
FROM average_temperature_by_year
ORDER BY year
実行結果を可視化
【BigQuery SQL解説】
- average_temperature_by_year という名前のwith句で、日付ごとの平均気温を計算しています。
- FROM 句で bigquery-public-data.noaa_gsod.gsodテーブルを指定し、 WHERE 句で気温の欠損値(9999.9)を除外しています。
- AVG(temp) で、年ごとの平均気温を計算します。
- GROUP BY year で年ごとに集計しています。
- 外側のSELECT句で年と平均気温を抽出し、年順に並べ替えています。
【BigQuery分析での活用例】
- このクエリを実行すると、1929年〜2024年の年ごとの世界平均気温の推移を時系列データとして取得できます。
- 取得したデータを使って、気温の変化をグラフ化することで、視覚的に気温の推移を把握できます。
- さらに、他の気象データ(降水量、風速など)と組み合わせて分析することで、気温変化の原因や影響について考察することができます。
BigQuery分析例:各国の気温変動
次に国ごとの気温変動を見てみましょう。
ここでは各国の2020年の平均気温と1929年の平均気温を比較し、その差を計算します。
WITH country_temp_2020 AS (
SELECT
country,
AVG(temp) AS avg_temp_2020
FROM `bigquery-public-data.noaa_gsod.gsod2020` AS gsod
JOIN `bigquery-public-data.noaa_gsod.stations` AS stations ON gsod.stn = stations.usaf
WHERE temp < 9999.9
GROUP BY country
)
, country_temp_1970 AS (
SELECT
country,
AVG(temp) AS avg_temp_1970
FROM `bigquery-public-data.noaa_gsod.gsod1970` AS gsod
JOIN `bigquery-public-data.noaa_gsod.stations` AS stations ON gsod.stn = stations.usaf
WHERE temp < 9999.9
GROUP BY country
)
SELECT
c2020.country,
avg_temp_2020,
avg_temp_1970,
avg_temp_2020 - avg_temp_1970 AS temp_difference
FROM country_temp_2020 AS c2020
JOIN country_temp_1970 AS c1970 ON c2020.country = c1970.country
ORDER BY temp_difference DESC;
【BigQuery SQL解説】
- country_temp_2020 with句で、2020年の国ごとの平均気温を計算しています。
- bigquery-public-data.noaa_gsod.gsod2020 テーブルと bigquery-public-data.noaa_gsod.stations テーブルを stn 列と usaf 列で結合し、国情報を取得しています。
- WHERE 句で気温の欠損値(9999.9)を除外しています。
- country_temp_1970 with句で、1970年の国ごとの平均気温を計算しています。country_temp_2020 と同様の方法です。
- 外側のSELECT句で国、2020年の平均気温、1970年の平均気温、そしてその差を抽出し、気温差の降順に並べ替えています。
【BigQuery分析での活用例】
- このクエリを実行すると、各国における2020年と1970年の平均気温の差を比較することができます。
- 気温差が大きい国を特定することで、地球温暖化の影響をより強く受けている地域を分析することができます。
- また、気温差と他の社会経済指標(例:経済発展レベル、人口密度)との関係を調べることで、温暖化の影響と社会経済状況との関連性について考察することができます。
【注意点】
- これらのクエリは、BigQuery公開データに基づいています。データの正確性や最新性については、実際のBigQuery公開データをご自身でご確認ください。
- 当該分析は、様々な要因を総合的に判断する必要があります。これらのクエリは分析の一例であり、意思決定の根拠として単独で使用すべきではありません。
5. FAQ:BigQueryに関するよくある質問
Q1. BigQueryの無料枠を超えて利用すると、どのくらい費用がかかりますか?
A1. 無料枠を超えた場合、従量課金制で料金が発生します。料金は、処理したデータ量やストレージ容量などによって異なります。詳しくは、BigQueryの料金ページをご確認ください。
Q2. BigQueryで使えるSQLは、他のデータベースと同じですか?
A2. BigQueryは標準SQLをサポートしており、他のデータベースで学んだSQLの知識を活かすことができます。ただし、BigQuery独自の関数や構文も存在するため、BigQueryのドキュメントで詳細を確認することをおすすめします。
Q3. SQLの学習には、どのような教材がありますか?
A3. SQLの学習には、オンライン学習サイト、書籍、動画教材など、様々な教材があります。初心者向けの教材から、上級者向けの教材まで、レベルに合わせて選ぶことができます。Googleが提供するBigQueryのチュートリアルもSQLの学習に役立ちます。
6. まとめ:BigQueryで気候変動を理解し、地球の未来に貢献しよう!
BigQueryは、気候変動データ分析に最適なツールです。BigQueryの高速な処理性能、豊富な分析機能、そして無料公開データセットを活用することで、誰でも簡単に気候変動データを分析し、地球温暖化問題への理解を深めることができます。ぜひ、BigQueryを導入し、データ分析の力を地球の未来に貢献していきましょう。
BigQuery導入サポート、転職検討中の方はお問い合わせフォームからご相談くださいませ。
誠心誠意精一杯対応いたします。
【参考URL】
GoogleCloudPlatform:https://console.cloud.google.com/welcome/new
BigQuery:https://cloud.google.com/bigquery?hl=ja
BigQueryリリース情報:https://cloud.google.com/bigquery/docs/release-notes
BigQuery料金:https://cloud.google.com/bigquery/pricing
BigQuery料金無料枠:https://cloud.google.com/bigquery/pricing?hl=ja#free-tier
Google Cloud活用事例:https://cloud.google.com/customers/index.html?hl=ja#
Looker Studio:https://cloud.google.com/looker-studio?hl=ja
Looker Studioサンプル:https://cloud.google.com/bigquery/docs/visualize-looker-studio?hl=ja