記事の対象者と解消できるお悩み
【対象者】
初中級データアナリスト
【興味関心】
- 労働市場の動向
- 雇用状況の変化
- 人材採用計画
- 従業員のスキルアップ
- 働き方改革
- データに基づいた経営判断
【解消できるお悩み】
- コロナ禍で、アメリカの雇用状況はどう変わったのか知りたい
- 今後、需要が高まる職業やスキルは何か?
- 人材採用や育成、配置転換をどのように進めるべきか?
- 従業員の働きがいを高めるには?
- データ分析によって、より的確な経営判断をしたい
記事作成者
【人物】株式会社志庵 代表取締役 佐藤 光 起業6年目
【経歴】株式会社光通信➜光通信同期と起業➜データアナリスト転職➜SaaSで2度目起業
【会社実績】
SaaS 資金調達無しARR2億円
SaaS GMV200億円
【内容】自社AaaSであるStruccle、webスクレイピング、BigQueryに関する記事を作成
各種用語
- ARR(Annual Recurring Revenue)
- サブスクリプションサービスの年間売上※当社はSaaS売上
- Struccle(ストラクル)
- 株式会社志庵が独自開発しているAaaS
- AaaS(アース)
- Data Analytics as a Serviceの意
- SaaS(サース)
- Software as a Serviceの意
- GoogleCloudPlatform
- Googleが提供するクラウドプラットフォーム。この中に様々なサービスが存在する。
- GCP(ジーシーピー)
- GoogleCloudPlatformの略
- BigQuery(ビッグクエリ)
- 上記GCPの中に含まれるデータ分析基盤サービス
- SQL(エスキューエル)
- データベースを操作するプログラミング言語
- クエリ
- SQLで記述した命令文
- クエリ例)
- SQL構文のクエリ⬇
SELECT item_name, price FROM sales_table where price >= 1000;
- 上記クエリ(命令文)の意味としては「売上テーブル(sales_table)から価格(price)が1000円以上の商品名(item_name)と価格(price)を抽出する」
- SQL構文のクエリ⬇
- ペタバイト
- データの単位 ペタバイト=1000テラバイト=約100兆行のデータ
概要
コロナ禍は、世界中の経済活動に大きな影響を与え、アメリカの労働市場も例外ではありませんでした。失業率の急上昇、リモートワークの普及、一部業界における需要の高まりなど、雇用状況は大きく変化しました。これらの変化を理解することは、今後のビジネス戦略を考える上で非常に重要です。
この記事では、BigQueryを使ってアメリカの労働統計データを分析し、コロナ禍で雇用がどのように変化したのかを明らかにします。具体的には、職業別、年齢層別の雇用状況の変化、賃金の変動、労働時間などに着目し、データから読み取れる示唆を解説します。BigQueryの強力な分析機能を活用すれば、膨大な労働統計データの中から、有益な情報を見つけ出すことができます。データ分析初心者の方でも、BigQueryを使うことで、アメリカの労働市場の動向を理解し、ビジネスに役立つインサイトを得ることができるでしょう。
目次
- BigQueryで労働統計データ分析を行うメリット
- 分析に使用するBigQueryのデータセット
- BigQueryでアメリカの労働統計データを分析する手順
- BigQueryを使った労働統計データ分析例
- FAQ:BigQueryに関するよくある質問
- まとめ:BigQueryで労働市場の動向を把握し、ビジネス戦略に活かそう!
1. BigQueryで労働統計データ分析を行うメリット
BigQueryは、労働統計データ分析に最適なツールです。その理由は、以下の様なメリットがあるからです。
- 大規模データの高速処理: 膨大な労働統計データを高速に分析できるため、雇用状況の変化を詳細に把握できます。
- 様々なデータソースとの連携: 公開データ、企業の従業員データ、経済指標データなど、様々なデータソースと連携できるため、労働市場を多角的に分析できます。
- 豊富な分析機能: SQL、機械学習、統計分析など、高度な分析機能を利用できるため、複雑な労働統計分析にも対応できます。
- コストパフォーマンスの高さ: 従量課金制なので、必要な時に必要なだけ利用でき、コストを抑えられます。
- 高いセキュリティ: Google Cloudの強固なセキュリティ基盤により、安心してデータを管理できます。
2. 分析に使用するBigQueryのデータセット
今回の分析では、BigQueryの公開データセット「sensus_adult_income」を使用します。このデータセットは、年齢、職業、教育レベル、収入などの属性を持つアメリカの人口調査データです。
コロナ禍以前の雇用状況や属性別の収入などを分析できます。
3. BigQueryでアメリカの労働統計データを分析する手順
BigQueryで労働統計データを分析する手順は以下の通りです。
3.1 1. データ確認
まず、データセットの内容を確認します。BigQueryコンソールのUIでデータセットのスキーマを確認したり、サンプルデータをプレビューしたりすることで、データの構造や内容を理解することができます。`bigquery-public-data.ml_datasets` データセットには、`census_adult_income`などのテーブルが含まれており、アメリカの雇用状況に関する詳細情報が記録されています。
3.2 2. データ加工
必要に応じて、データを加工します。例えば、日付データを年、月、日、曜日などに分割したり、特定の職業や年齢層に絞り込んだり、集計を行ったりします。BigQueryは、SQLを使ってデータ加工を行うための様々な関数を提供しています。
3.3 3. データ分析
加工したデータに対して、SQLクエリやBigQuery MLなどを用いて分析を行います。例えば、職業別、年齢層別の失業率の推移、コロナ禍前後の賃金の変動、労働時間の変化などを分析することができます。また、機械学習を用いて、将来の雇用状況を予測するモデルを構築することも可能です。
3.4 4. 考察と分析結果の活用
分析結果に基づいて、コロナ禍がアメリカの労働市場に与えた影響について考察します。特定の職業や年齢層で失業率が上昇しているのか、賃金や労働時間にどのような変化があったのか、コロナ禍の影響が長期化する可能性はあるのかなどを分析します。これらの分析結果は、今後のビジネス戦略、人材採用計画、従業員教育などに役立てることができるでしょう。
4. BigQueryを使った労働統計データ分析例
本記事では、BigQueryの公開データ「bigquery-public-data.ml_datasets.census_adult_income」を使って、アメリカの労働統計データを分析します。
BigQuery分析例:職業別の収入
職業(occupation)別で高収入>50K(high_income_rate)の割合を集計しています。
SELECT
occupation,
SUM(CASE WHEN income_bracket like '%>50K%' THEN 1 ELSE 0 END) AS high_income_cnt,
SUM(CASE WHEN income_bracket not like '%>50K%' THEN 1 ELSE 0 END) AS low_income_cnt,
COUNT(*) AS cnt,
ROUND(SUM(CASE WHEN income_bracket like '%>50K%' THEN 1 ELSE 0 END) / COUNT(*) * 100, 2) AS high_income_rate
FROM `bigquery-public-data.ml_datasets.census_adult_income`
GROUP BY occupation
ORDER BY high_income_rate DESC;
【BigQuery SQL解説】
- occupation 列で、職業別に集計します。
- SUM(CASE WHEN income_bracket like ‘%>50K%’ THEN 1 ELSE 0 END)で、高収入(>50K)の割合を計算します。
- COUNT(*) で、各職業に就く人の総数をカウントします。
- GROUP BY 句で、職業別に集計します。
- ORDER BY 句で、高収入割合の高い順に並べ替えます。
【BigQuery分析での活用例】
- 高収入を得やすい職業、低収入になりやすい職業を特定しています。
- 教育レベルや年齢などの属性と組み合わせることで、より詳細な分析が可能です。
BigQuery分析例:年齢層別の労働時間
年代別(age_group)での平均労働時間(average_hours_worked)と人数(total_people)を集計しています。
WITH age_group_table AS (
SELECT
CASE
WHEN age BETWEEN 18 AND 24 THEN '18-24'
WHEN age BETWEEN 25 AND 34 THEN '25-34'
WHEN age BETWEEN 35 AND 44 THEN '35-44'
WHEN age BETWEEN 45 AND 54 THEN '45-54'
WHEN age BETWEEN 55 AND 64 THEN '55-64'
ELSE '65+'
END AS age_group,
hours_per_week
FROM `bigquery-public-data.ml_datasets.census_adult_income`
)
SELECT
age_group,
AVG(hours_per_week) AS average_hours_worked,
COUNT(*) AS total_people
FROM age_group_table
GROUP BY age_group
ORDER BY age_group;
【BigQuery SQL解説】
- WITH句で、年齢層を定義するage_group_tableを作成します。
- CASE文で、年齢層を6つのグループに分類します。
- average_hours_worked を計算します。
- total_peopleをカウントします。
- GROUP BY 句で、年齢層別に集計します。
- ORDER BY 句で、年齢層順に並べ替えます。
【BigQuery分析での活用例】
- 年齢層別の労働時間の変化を分析することで、コロナ禍における世代間格差を考察できます。
- 他の属性と組み合わせることで、年齢層別での就労状況をより深く理解できます。
注意点
- これらのクエリは、BigQuery公開データに基づいています。データの正確性や最新性については、実際のBigQuery公開データをご自身でご確認ください。
- 当該分析は、様々な要因を総合的に判断する必要があります。これらのクエリは分析の一例であり、意思決定の根拠として単独で使用すべきではありません。
5. FAQ:BigQueryに関するよくある質問
Q1. BigQueryの無料枠を超えて利用すると、どのくらい費用がかかりますか?
A1. 無料枠を超えた場合、従量課金制で料金が発生します。料金は、処理したデータ量やストレージ容量などによって異なります。詳しくは、BigQueryの料金ページをご確認ください。
Q2. BigQueryで使えるSQLは、他のデータベースと同じですか?
A2. BigQueryは標準SQLをサポートしており、他のデータベースで学んだSQLの知識を活かすことができます。ただし、BigQuery独自の関数や構文も存在するため、BigQueryのドキュメントで詳細を確認することをおすすめします。
Q3. SQLの学習には、どのような教材がありますか?
A3. SQLの学習には、オンライン学習サイト、書籍、動画教材など、様々な教材があります。初心者向けの教材から、上級者向けの教材まで、レベルに合わせて選ぶことができます。Googleが提供するBigQueryのチュートリアルもSQLの学習に役立ちます。
6. まとめ:BigQueryで労働市場の動向を把握し、ビジネス戦略に活かそう!
BigQueryは、労働統計データ分析に最適なツールです。BigQueryの高速な処理性能、豊富な分析機能、そして無料公開データセットを活用することで、アメリカの労働市場の動向を把握し、ビジネス戦略に役立てることができます。ぜひ、BigQueryを導入し、データ分析の力をビジネスに活かしましょう。
BigQuery導入サポート、転職検討中の方はお問い合わせフォームからご相談くださいませ。
誠心誠意精一杯対応いたします。
【参考URL】
GoogleCloudPlatform:https://console.cloud.google.com/welcome/new
BigQuery:https://cloud.google.com/bigquery?hl=ja
BigQueryリリース情報:https://cloud.google.com/bigquery/docs/release-notes
BigQuery料金:https://cloud.google.com/bigquery/pricing
BigQuery料金無料枠:https://cloud.google.com/bigquery/pricing?hl=ja#free-tier
Google Cloud活用事例:https://cloud.google.com/customers/index.html?hl=ja#
Looker Studio:https://cloud.google.com/looker-studio?hl=ja
Looker Studioサンプル:https://cloud.google.com/bigquery/docs/visualize-looker-studio?hl=ja