MENU

Anthropic Economic Index 最新分析:Claude 3.7 Sonnetが示すAI利用動向と経済への影響

Anthropic Economic Index 最新分析:Claude 3.7 Sonnetが示すAI利用動向と経済への影響
  • URLをコピーしました!

こんにちは、スクーティー代表のかけやと申します。

弊社は生成AIを強みとするベトナムオフショア開発・ラボ型開発や、生成AIコンサルティングなどのサービスを提供しており、最近はありがたいことに生成AIと連携したシステム開発のご依頼を数多く頂いています。

AIが私たちの仕事や経済にどんな影響を与えるのか、気になっている方も多いのではないでしょうか?「自分の仕事はAIに奪われる?」「AIで生産性は上がるの?」そんな疑問や不安を感じているかもしれませんね。特に最近のAIの進化は目覚ましく、その影響を正確に把握するのは難しいと感じている方もいるでしょう。

Anthropic社が立ち上げた「 Anthropic Economic Index 」は、まさにそうした疑問に答えるための新しい試みです。この取り組みは、AI、特に同社のClaudeモデルが、労働市場や経済全体にどのような影響を与えているかを、実際の利用データに基づいて定期的に分析・公開しています。憶測ではなく、具体的なデータに基づいた洞察を提供することで、AI時代における経済の変化を理解する手助けとなることを目指しています。Anthropic Economic Index は、AIの進化がもたらす変化の波を捉え、私たちが未来に備えるための羅針盤となる可能性を秘めているのです。

この記事では、Anthropic Economic Index の最新レポートと、その基盤となる研究論文の内容を詳しく解説し、AIが経済タスクにどのように利用されているかの実態と、今後の展望について深く掘り下げていきます。

目次

Anthropic Economic Index とは何か?AI経済影響測定の新指標

今回の Anthropic Economic Index で何がわかる?

Anthropic Economic Indexの最新レポートおよび初期論文から、以下の重要なインサイトが得られます。

  • Claude 3.7 Sonnet導入後の変化: コーディング(コンピュータ・数学関連、利用シェア+3%ポイント増)、教育、科学、ヘルスケア分野での利用シェアが増加しました。
  • 拡張思考モードの利用: 主にコンピュータ・情報研究科学者(利用率約10%)、ソフトウェア開発者(約8%)、マルチメディアアーティスト(約7%)、ビデオゲームデザイナー(約6%)など、技術的・創造的なタスクで利用されています。
  • 拡張 vs 自動化: AI利用全体では、人間の能力を補完・強化する「拡張」が57%、人間の作業を代替する「自動化」が43%と、拡張的利用がやや優勢な状況は継続しています。
  • インタラクションタイプの変化: 拡張/自動化の全体比率は安定していますが、「学習」目的のインタラクションが約23%から約28%へと顕著に増加しました。
  • 職業・タスクによる利用差:
    • タスク反復(拡張): コピーライター(約58%)や編集者で特に多い。
    • 指示(自動化): 翻訳者・通訳者や俳優で比較的多い。
    • 学習(拡張): 司書(約56%)やコンピュータハードウェアエンジニアで多い。
    • フィードバックループ(自動化): ネットワーク・システム管理者(約45%)やウェブ管理者で多い。
    • 検証(拡張): ソフトウェア品質保証エンジニア(約11%)や統計学者で多い。
  • ボトムアップ・タクソノミー: O*NETでは捉えきれない「家庭の配管修理支援」や「バッテリー技術ガイダンス」など、630の詳細な利用カテゴリが特定されました。
  • AI利用の深度: 全職業の約36%が関連タスクの25%以上でAIを利用していますが、75%以上利用している職業は約4%に留まります。
  • 賃金・参入障壁との関係: AI利用は賃金の上位4分の1(特にソフトウェア職)およびJob Zone 4(学士号レベル)でピークに達する傾向があります。

前回のAnthropic Economic Indexの調査結果はこちらの記事にまとめています。ぜひご覧ください!

関連記事:Anthropic Economic Index : AIが経済に与える影響を分析したAnthropicのレポートが興味深い

AIの経済・労働市場への影響を追跡

Anthropic Economic Indexは、人工知能(AI)が労働市場や経済全体に与える影響を、実際のデータに基づいて継続的に測定・分析するためにAnthropic社が開始した調査・分析です。

AI技術、特に大規模言語モデル(LLM)の急速な進歩は、私たちの働き方や経済構造に大きな変化をもたらす可能性を秘めています。しかし、その具体的な影響については、まだ不明な点が多く、体系的な実証データが不足しているのが現状でした。このインデックスは、まさにそのギャップを埋めることを目的としています。

この取り組みの中心にあるのは、Anthropic社のAIモデル「Claude」の実際の利用データを分析し、以下の点を明らかにすることです。

  • AIがどのような経済的タスクに使われているか?
  • その利用動向は時間と共にどう変化するか?
  • AIは人間の能力を拡張するため、あるいはタスクを自動化するために使われているか?
  • 新しいAIモデルや機能が登場した際、利用パターンはどう変わるか?

これらの分析結果を定期的にデータや研究成果として公開することで、AIの経済への浸透度や影響を経時的に追跡し、社会全体がAIによる変化に対してより良く備え、適応していくための信頼できる情報基盤を提供します。憶測ではなく事実に基づいた洞察を提供することで、政策立案者、企業、労働者、研究者がより情報に基づいた意思決定を行えるように支援することを目指しています。

なぜAnthropic Economic Indexが重要なのか?体系的証拠の必要性

AI、特に生成AIの急速な進化に伴い、労働市場への影響に関する議論は活発化していますが、その多くは予測や限定的な事例に基づいています。AIの経済的影響を正確に理解し、適切な対策を講じるためには、憶測ではなく、体系的で実証的な証拠が不可欠です。

既存の研究アプローチには限界がありました。

  • 予測モデル: 様々な研究はAIによる自動化の可能性を示唆しますが、あくまで予測であり、実際の導入状況とは異なる可能性があります。
  • 実験研究: 特定の条件下での生産性効果を示す研究はありますが、経済全体への影響を捉えるのは困難です。
  • アンケート調査: アンケート調査は利用者の声を反映しますが、自己申告に基づくため実際の利用状況と異なる可能性や、詳細把握の難しさがあります。

さらに、これらのアプローチではAI技術の急速な進化と実際の利用パターンの動的な変化をリアルタイムで捉えることが困難でした。

Anthropic Economic Indexは、この「体系的な実証証拠の欠如」という課題に対応します。数百万件の実際のAI利用データ(Claude.aiの会話ログ)をプライバシーに配慮しつつ分析することで、「AIが実際にどのように使われているか」を大規模かつ継続的に明らかにします。これにより、AIの経済的影響に関する議論をよりデータに基づいた客観的なものにし、政策決定から個人のキャリアプランニングまで、確かな情報基盤を提供します。AIの社会実装が進む中で、その影響を客観的に評価し、未来への舵取りを行うための羅針盤としての役割が期待されています。

実利用データに基づく動的分析

Anthropic Economic Indexが他のAI影響分析と一線を画す最大の特徴は、実際の利用データに基づき、その変化を動的に追跡する点にあります。従来の分析の多くは、専門家による予測(将来の可能性を探る)、限定的な実験(特定の条件下での効果測定)、あるいはアンケート調査(自己申告に基づく利用状況把握)に依存していました。これに対し、Anthropic Economic Indexは以下の点で独自性を持っています。

  1. 実利用データへの準拠: Anthropic社のAIモデル「Claude」の実際の利用データ(数百万件規模の匿名化された会話ログ)を直接分析します。これにより、「AIが理論上何ができるか」ではなく、「人々が実際にAIをどのように、どの程度利用しているか」という現実を捉えます。
  2. 動的な追跡: 分析は一度きりではなく、定期的に実施・公開されます。AI技術の進化や社会への浸透に伴う利用パターンの変化(例: 新モデル登場後の利用分野の変化、特定機能の利用動向)を継続的に観測し、報告します。

このアプローチにより、AIの経済への影響に関する議論を、より現実的で、タイムリーな情報に基づいて行うことが可能になります。プライバシー保護分析ツール「Clio」Tamkin et al., 2024 の活用により、大規模データをプライバシーに配慮しながら分析できる点も、この独自性を支える重要な技術的基盤となっています。

他のアプローチがAIの影響の「可能性」や「特定条件下での効果」を示すのに対し、Anthropic Economic IndexはAI利用の「現実」とその「変化」を捉えることに主眼を置いています。この現実に基づいた動的な視点が、AI時代における経済と労働市場の未来を考える上で、より信頼性の高い洞察を提供します。

Claude 3.7 Sonnet登場後の変化:Anthropic Economic Index最新レポート

分析概要:Claude 3.7 Sonnetローンチ後の100万会話を分析

Anthropic Economic Indexの第2弾レポートは、2024年6月にリリースされた最新モデルClaude 3.7 Sonnetの登場がAI利用動向に与えた初期の影響を分析しています。Claude 3.7 Sonnetは、特にエージェント的なコーディング能力や新しい「拡張思考」モードを特徴としています。

分析は、リリース後11日間のClaude.ai無料・プロユーザーによる匿名化された100万件の会話を対象とし、その大部分がデフォルト設定されたClaude 3.7 Sonnetによるものと考えられます。分析手法は基本的に初回レポートを踏襲し、プライバシー保護ツール「Clio」を用いて会話をO*NETタスクにマッピングし、関連する職業や職業カテゴリの利用パターンを調査しています。

この分析により、高性能な新モデルの登場が、利用分野や利用方法にどのような変化をもたらしたかを明らかにすることを目的としています。特筆すべき点として、この最新の分析では、分類タスク自体にもClaude 3.7 Sonnetが(Clioを通じて)使用されており、Anthropic社の内部ベンチマークによれば、以前の分析(Claude 3.5 Sonnetを使用)よりも分類精度が向上していると報告されています。これにより、分析結果の信頼性がさらに高まっていると考えられます。

Claude 3.7 Sonnetについて詳細を知りたい方はこちらの記事をご覧ください!

関連記事:Claude 3.7 Sonnet : プログラミング能力最強モデル

利用分野の変化:コーディング、教育、科学分野での利用増

Claude 3.7 Sonnetの導入後、Claude.aiの利用分野にはいくつかの変化が見られました。初回レポート(2024年12月~2025年1月データ)と比較して、特定の職業カテゴリにおける利用シェアが増加しました。

このグラフは主要カテゴリの変化を示しており、特にコンピュータ・数学関連 (Coding)のシェア増加が顕著です。これはClaude 3.7 Sonnetのコーディング能力向上(ベンチマークスコアの改善)を反映していると考えられます。加えて、教育・訓練・図書館関連 (Education)、生命・物理・社会科学関連 (Sciences)、ヘルスケア実践者・技術関連 (Healthcare)の分野でも利用シェアが増加しました。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7

上のグラフは主要カテゴリの変化を示しており、特にコンピュータ・数学関連 (Coding)のシェア増加が顕著です。これはClaude 3.7 Sonnetのコーディング能力向上(ベンチマークスコアの改善)を反映していると考えられます。加えて、教育・訓練・図書館関連 (Education)生命・物理・社会科学関連 (Sciences)ヘルスケア実践者・技術関連 (Healthcare)の分野でも利用シェアが増加しました。

これらの増加は、モデルの能力向上、AI技術の継続的な普及、コーディング技術の他分野への応用、あるいは予期せぬ能力向上の結果である可能性があります。これは利用「シェア」の変化であり、絶対的な利用量の変化ではない点に注意が必要です。Appendixの詳細グラフでは、コンピュータ・数学関連が絶対的なシェア増加(+3%ポイント)で最大である一方、教育や科学分野も注目すべき増加率を示しています。

下のグラフは、全職業カテゴリにおけるClaude.ai利用シェアの初回レポート(灰色)と最新レポート(黄色が増加、青が減少)の比較を詳細に示しています。上記の、変化が大きいカテゴリ以外のカテゴリではシェアの変動は比較的小さいですが、分野ごとに利用動向に違いがあることが確認できます。

このグラフは、全職業カテゴリにおけるClaude.ai利用シェアの初回レポート(灰色)と最新レポート(黄色が増加、青が減少)の比較を詳細に示しています。上記の、変化が大きいカテゴリ以外のカテゴリではシェアの変動は比較的小さいですが、分野ごとに利用動向に違いがあることが確認できます。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7 (Appendix)

「拡張思考モード」の利用実態:技術・創造タスクが中心

Claude 3.7 Sonnetの新機能「拡張思考(extended thinking)」モードは、ユーザーがより複雑な質問に対して、モデルに追加の思考時間を要求できる機能です。最新レポートでは、このモードがどのような場面で利用されているかが分析されました。

このグラフは、拡張思考モードの利用率が高かった職業を示しています(データ全体で0.5%以上のシェアを持つ職業に限定)。分析の結果、このモードは主に技術的(Technical)および創造的(Creative)な問題解決の文脈で利用されていることが明らかになりました。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7

上のグラフは、拡張思考モードの利用率が高かった職業を示しています(データ全体で0.5%以上のシェアを持つ職業に限定)。分析の結果、このモードは主に技術的(Technical)および創造的(Creative)な問題解決の文脈で利用されていることが明らかになりました。

  • コンピュータ・情報研究科学者関連タスク: 約10%が利用(最高)
  • ソフトウェア開発者関連タスク: 約8%が利用
  • マルチメディアアーティスト・アニメーター関連タスク: 約7%が利用
  • ビデオゲームデザイナー関連タスク: 約6%が利用

これらの結果は、ユーザーが研究開発、高度なプログラミング、複雑なデザイン作業など、深い分析や創造性が求められる場面で拡張思考モードの価値を認識し、利用している傾向を示唆しています。

拡張思考モード利用データセットの公開

「拡張思考モード」に関する研究を促進するため、Anthropic社は新しいデータセットを公開しました。このデータセットは、O*NETの各タスクについて、関連する会話の中で拡張思考モードが利用された割合(fraction)をマッピングしたものです。これにより、どのような性質を持つタスクが拡張思考モードを誘発しやすいか、といった問いに対するデータ駆動型の分析が可能になります。このデータセットは、他のAnthropic Economic Index関連データと同様に、Hugging FaceのAnthropicページ からダウンロード可能です。このデータの公開は、AIの新機能が実際の利用シーンでどのように受け入れられ、活用されていくのかについての理解を深める上で重要です。

AI利用の性質:タスクの拡張(Augmentation) vs 自動化(Automation)

全体的な傾向:拡張利用が57%、自動化利用が43%

AIの利用目的を理解する上で重要なのが、人間の能力を補完・強化する「拡張(Augmentation)」と、人間の作業を代替する「自動化(Automation)」の区別です Autor, 2015。Anthropic Economic Indexでは、Clioを用いて会話パターンを分析し、どちらの性質に近いかを分類しています。最新レポート(Claude 3.7 Sonnetローンチ後データ)によると、全体的な傾向は以下の通りで、初回レポートから大きな変化はありませんでした。

  • 拡張的な利用 (Augmentative Uses): 全体の57%
  • 自動化的な利用 (Automative Uses): 全体の43%

依然として拡張的な利用がやや優勢であり、AIが人間の仕事を単純に代替するよりも、協働パートナーとしての役割を果たしている側面が強いことを示唆しています。ただし、チャット外での編集活動などを考慮すると、実際の拡張利用の割合はさらに高い可能性も指摘されています。

利用タイプの変化:「学習」インタラクションの増加

拡張/自動化の全体バランスは安定していましたが、その内訳である具体的なインタラクションの種類には変化が見られました。Anthropic Economic Indexでは、協働パターンを以下の5タイプに分類しています(PDF論文 Table 1参照)。

  • 拡張 (Augmentation): 学習 (Learning), タスク反復 (Task Iteration), 検証 (Validation)
  • 自動化 (Automation): 指示 (Directive), フィードバックループ (Feedback Loop)
このグラフは、これらのタイプのシェア変化を示しています。注目すべきは、拡張タイプの一つである「学習 (Learning)」(ユーザーが情報や説明を求める)の割合が、最初のレポートの約23%から最新レポートでは約28%へと顕著に増加している点です。これは、ユーザーがClaudeを知識習得や理解深化のための教育的リソースとして活用する傾向が強まっていることを示唆している可能性があります。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7

上のグラフは、これらのタイプのシェア変化を示しています。注目すべきは、拡張タイプの一つである「学習 (Learning)」(ユーザーが情報や説明を求める)の割合が、最初のレポートの約23%から最新レポートでは約28%へと顕著に増加している点です。これは、ユーザーがClaudeを知識習得や理解深化のための教育的リソースとして活用する傾向が強まっていることを示唆している可能性があります。

職業カテゴリ別分析:分野による拡張/自動化の偏り

拡張/自動化のバランスは、職業分野によって異なります。最新レポートでは、O*NETの高レベル職業カテゴリ別に、5つのインタラクションモードの割合を分析しています。

このグラフから、以下の傾向が読み取れます。

拡張性が高い分野: コミュニティ・社会サービス(約75%が拡張利用)、教育・訓練・図書館、芸術・デザイン・エンターテイメント・スポーツ・メディア(特にタスク反復が多い)。

拡張と自動化が半々に近い分野: コンピュータ・数学(フィードバックループや指示と、タスク反復や学習が混在)、生産、経営。

自動化が優勢な分野は見られない: 全ての主要カテゴリで、自動化的利用が拡張的利用を明確に上回るケースはありませんでした。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7

上のグラフから、以下の傾向が読み取れます。

  • 拡張性が高い分野: コミュニティ・社会サービス(約75%が拡張利用)、教育・訓練・図書館、芸術・デザイン・エンターテイメント・スポーツ・メディア(特にタスク反復が多い)。
  • 拡張と自動化が半々に近い分野: コンピュータ・数学(フィードバックループや指示と、タスク反復や学習が混在)、生産、経営。
  • 自動化が優勢な分野は見られない: 全ての主要カテゴリで、自動化的利用が拡張的利用を明確に上回るケースはありませんでした。

この結果は、多くの分野でAIが人間の作業を完全に代替するよりも、人間と協力するパートナーとしての役割が多い現状を示唆しています。

具体的な職業・タスク例:コピーライターと翻訳者の違い

さらに具体的な職業レベルで見ると、AIとのインタラクションパターンはより多様になります。レポートでは、5つのインタラクションタイプ(学習、タスク反復、検証、指示、フィードバックループ)それぞれについて、そのタイプの利用割合が特に高い職業の例が示されています。以下に各タイプのグラフと、その内容を説明します。

1. 学習 (Learning – 拡張): ユーザーが情報や説明を求めるインタラクション

このグラフは、「学習」タイプの利用割合が最も高い職業を示しています。トップは司書・メディアコレクション専門家で、関連タスクの約56%が学習インタラクションです。これは、利用者の情報ニーズを特定し、情報源の検索やアクセスを支援するタスクでAIが活用されていることを示唆しています。次いでコンピュータハードウェアエンジニア(約55%)、一般事務員(約50%)などが続きます。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7 (Appendix)

このグラフは、「学習」タイプの利用割合が最も高い職業を示しています。トップは司書・メディアコレクション専門家で、関連タスクの約56%が学習インタラクションです。これは、利用者の情報ニーズを特定し、情報源の検索やアクセスを支援するタスクでAIが活用されていることを示唆しています。次いでコンピュータハードウェアエンジニア(約55%)、一般事務員(約50%)などが続きます。

2. タスク反復 (Task Iteration – 拡張): AIと共同で成果物を練り上げるインタラクション

このグラフは、「タスク反復」の利用割合が最も高い職業を示しています。トップはコピーライターで、関連タスクの約58%がこのタイプです。広告コピーを作成するようなクリエイティブなプロセスで、AIとの協働が中心となっていることがうかがえます。編集者(約55%)、インストラクショナルデザイナー(約46%)なども高い割合を示しています。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7

このグラフは、「タスク反復」の利用割合が最も高い職業を示しています。トップはコピーライターで、関連タスクの約58%がこのタイプです。広告コピーを作成するようなクリエイティブなプロセスで、AIとの協働が中心となっていることがうかがえます。編集者(約55%)、インストラクショナルデザイナー(約46%)なども高い割合を示しています。

3. 検証 (Validation – 拡張): ユーザー作成物のチェックや改善提案を求めるインタラクション

このグラフは、「検証」タイプの利用割合が最も高い職業を示しています。トップはソフトウェア品質保証エンジニア・テスターで、関連タスクの約11%が検証インタラクションです。初期デバッグ手順の実行などでAIが活用されている可能性があります。統計学者(約9%)、データベース管理者(約8%)なども比較的高い割合を示しています。(なお、レポート本文では外国語教師が挙げられていましたが、Appendixのグラフではより高い割合の職業が示されています。)
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7 (Appendix)

このグラフは、「検証」タイプの利用割合が最も高い職業を示しています。トップはソフトウェア品質保証エンジニア・テスターで、関連タスクの約11%が検証インタラクションです。初期デバッグ手順の実行などでAIが活用されている可能性があります。統計学者(約9%)、データベース管理者(約8%)なども比較的高い割合を示しています。(なお、レポート本文では外国語教師が挙げられていましたが、Appendixのグラフではより高い割合の職業が示されています。)

4. 指示 (Directive – 自動化): AIにタスク実行を直接指示するインタラクション

このグラフは、「指示」タイプの利用割合が最も高い職業を示しています。トップは俳優で、関連タスクの約63%が指示インタラクションです。台本作成や脚色などでAIに直接的な指示を与えている可能性が考えられます。次いで翻訳者・通訳者(約59%)、詩人・作詞家・クリエイティブライター(約56%)などが続きます。これらの職業では、比較的明確な成果物をAIに生成させる利用が多いことが示唆されます。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7

このグラフは、「指示」タイプの利用割合が最も高い職業を示しています。トップは俳優で、関連タスクの約63%が指示インタラクションです。台本作成や脚色などでAIに直接的な指示を与えている可能性が考えられます。次いで翻訳者・通訳者(約59%)、詩人・作詞家・クリエイティブライター(約56%)などが続きます。これらの職業では、比較的明確な成果物をAIに生成させる利用が多いことが示唆されます。

5. フィードバックループ (Feedback Loop – 自動化): エラー修正などを繰り返すインタラクション

このグラフは、「フィードバックループ」の利用割合が最も高い職業を示しています。トップはネットワーク・コンピュータシステム管理者で、関連タスクの約45%がこのタイプです。ハードウェアやソフトウェアの問題診断・解決・交換といったタスクで、試行錯誤を繰り返している様子がうかがえます。ウェブ管理者(約41%)、ソフトウェア開発者(システム、約31%)なども高い割合を示し、特に技術的なトラブルシューティングやデバッグ作業でこのパターンが多いことが示唆されます。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7 (Appendix)

このグラフは、「フィードバックループ」の利用割合が最も高い職業を示しています。トップはネットワーク・コンピュータシステム管理者で、関連タスクの約45%がこのタイプです。ハードウェアやソフトウェアの問題診断・解決・交換といったタスクで、試行錯誤を繰り返している様子がうかがえます。ウェブ管理者(約41%)、ソフトウェア開発者(システム、約31%)なども高い割合を示し、特に技術的なトラブルシューティングやデバッグ作業でこのパターンが多いことが示唆されます。

これらの例は、職業やタスクの性質によってAIとの関わり方が大きく異なることを示しています。

ボトムアップ・タクソノミー:O*NETを超えたAI利用実態の把握

O*NETの限界とボトムアップ・アプローチの必要性

ONETデータベースは有用な枠組みですが、(1)全てのタスクを網羅しているわけではない、(2)AIによって新たに創出されるタスクを捉えられない、(3)既存の枠組みに当てはまらない利用方法を見逃す可能性がある、といった限界があります。これらの限界を補完するため、Anthropic Economic Indexでは「ボトムアップ・アプローチ」も導入されました。これは、事前に定義されたカテゴリに依存せず、実際の会話データそのものから利用パターンのクラスターを自動的に発見・生成する手法です。これにより、ONETの枠組みでは見逃されがちな、現実の多様なAI利用実態を捉えることを目指しています。このアプローチは、AIの予期せぬ応用や新しい働き方の萌芽を発見する上で特に重要となります。

興味深い利用例:配管修理からバッテリー技術まで

ボトムアップ・タクソノミーによって生成された630の利用クラスタには、O*NETの職業タスクとは異なる、興味深い利用例が多数含まれています。レポートで紹介されている例をいくつか挙げます。

  • 日常生活・家庭内: 「家庭の配管、水回り、メンテナンスの問題解決を手伝う」
  • 専門技術: 「インタラクティブな可視化機能を備えた物理ベースのシミュレーションを作成する」、「フォントの選択、実装、トラブルシューティングを手伝う」、「バッテリー技術と充電システムに関するガイダンスを提供する」、「コードとデータベースにおけるタイムゾーン処理を手伝う」
  • キャリア支援: 「求職書類の作成または改善を手伝う」
  • インフラ関連: 「水管理システムとインフラプロジェクトを手伝う」

これらの例は、Claudeのような汎用AIが、特定の職業だけでなく、一般の人々によっても、個人的な課題解決、学習、専門情報収集など、非常に多岐にわたる目的で利用されている実態を示唆しています。ボトムアップ・アプローチは、このようなO*NETでは見逃されがちな「ロングテール」の利用を捉える上で有効であり、AIの潜在的な応用範囲の広がりを示しています。

Anthropic Economic Indexの初期論文

論文概要:数百万のClaude会話に基づく経済タスク分析

Anthropic Economic Indexの取り組みは、Anthropic社の研究論文Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations」Handa et al., 2024 に基礎を置いています。この論文は、AIの経済的影響に関する憶測が広がる中で、その実態を明らかにするための体系的な実証データが不足しているという問題意識から出発し、実際のAI利用データに基づいた分析フレームワークを提案・実証しました。プライバシー保護ツール「Clio」を用い、数百万件のClaude.ai会話データを分析し、O*NETデータベースのタスクや職業にマッピングすることで、AI利用のパターンを経済全体の文脈で捉えようと試みています。

分析フレームワークの紹介

初期論文では、Anthropic Economic Indexの分析フレームワークを図解しています。このフレームワークは、ミクロなAI対話データからマクロな経済動向への示唆を導くプロセスを示します。

上の図はフレームワークの全体像を示しており、以下の主要要素とその連関を表しています。

会話 (Conversations): Claude.aiでのユーザーとAIの実際の対話データが分析の出発点です。

タスク (Tasks): Clioを用いて会話をO*NETデータベースの具体的な経済タスクにマッピングします。

職業 (Occupations): タスクを関連するO*NET職業カテゴリに集約します。

経済的特徴との関連分析: AI利用パターンを賃金、拡張/自動化比率、関連スキルなどの経済指標と関連付けて分析します。
出典:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

上の図はフレームワークの全体像を示しており、以下の主要要素とその連関を表しています。

  1. 会話 (Conversations): Claude.aiでのユーザーとAIの実際の対話データが分析の出発点です。
  2. タスク (Tasks): Clioを用いて会話をO*NETデータベースの具体的な経済タスクにマッピングします。
  3. 職業 (Occupations): タスクを関連するO*NET職業カテゴリに集約します。
  4. 経済的特徴との関連分析: AI利用パターンを賃金、拡張/自動化比率、関連スキルなどの経済指標と関連付けて分析します。

このフレームワークにより、AI利用の「量」だけでなく、「どの分野で」「どのような目的で」「どのようなスキルと関連して」利用されているかといった多角的な分析が可能になります。

主な貢献:タスク利用の測定、利用深度、スキル、賃金との相関、拡張/自動化分析

初期論文は、Anthropic Economic Indexの基盤として、いくつかの重要な貢献をしました。ここでは、各貢献内容を、関連する図表を参照しながら説明します。

1. AIタスク利用の初の大規模実証測定:

数百万の会話を分析し、「AIがどの経済的タスクで実際に使われているか」を大規模に測定しました。以下の図は、利用が多い上位6つの職業カテゴリとその内訳(主要な職業とタスク)を示しており、ソフトウェア開発とライティング関連タスクでの利用が特に多いことが分かります。

数百万の会話を分析し、「AIがどの経済的タスクで実際に使われているか」を大規模に測定しました。以下の図は、利用が多い上位6つの職業カテゴリとその内訳(主要な職業とタスク)を示しており、ソフトウェア開発とライティング関連タスクでの利用が特に多いことが分かります。
出典:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

2. AI利用の「深度」の定量化:

各職業において、関連する全タスクのうちAIが利用されている割合(利用の深さ)を測定しました。以下の図は、その累積分布を示しています。このグラフから、例えば横軸0.25(25%)の点で縦軸が約0.36(36%)となっており、「約36%の職業で、関連タスクの少なくとも25%においてAI利用が見られる」ことが読み取れます。一方で、横軸0.75(75%)の点では縦軸が約0.04(4%)と低く、多くのタスクでAIを利用している職業は少数派であることも分かります。

各職業において、関連する全タスクのうちAIが利用されている割合(利用の深さ)を測定しました。以下の図は、その累積分布を示しています。このグラフから、例えば横軸0.25(25%)の点で縦軸が約0.36(36%)となっており、「約36%の職業で、関連タスクの少なくとも25%においてAI利用が見られる」ことが読み取れます。一方で、横軸0.75(75%)の点では縦軸が約0.04(4%)と低く、多くのタスクでAIを利用している職業は少数派であることも分かります。
出典:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

3. AI利用と職業スキルの関連測定:

会話の中でAIが(あるいはAIとの対話を通じて)どのような職業スキルを発揮しているかを分析しました。以下の図は、O*NETで定義される35のスキルについて、その出現頻度を棒グラフで示しています。「批判的思考」「読解力」「ライティング」「プログラミング」といった認知スキルが上位を占める一方、「設置」「機器メンテナンス」といった物理スキルは最下位層にあることが一目で分かります。

会話の中でAIが(あるいはAIとの対話を通じて)どのような職業スキルを発揮しているかを分析しました。論文のFigure 5は、O*NETで定義される35のスキルについて、その出現頻度を棒グラフで示しています。「批判的思考」「読解力」「ライティング」「プログラミング」といった認知スキルが上位を占める一方、「設置」「機器メンテナンス」といった物理スキルは最下位層にあることが一目で分かります。
出典:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

4. 賃金・参入障壁とAI利用の相関分析:

AI利用が職業の賃金レベルや参入に必要な準備レベル(Job Zone)とどう関連するかを分析しました。以下の図は、賃金の中央値とAI利用率の関係を示し、賃金の上位4分の1付近で利用がピークとなり、最高賃金層と低賃金層では利用が少ない傾向を示しています。

AI利用が職業の賃金レベルや参入に必要な準備レベル(Job Zone)とどう関連するかを分析しました。以下の図は、賃金の中央値とAI利用率の関係を示し、賃金の上位4分の1付近で利用がピークとなり、最高賃金層と低賃金層では利用が少ない傾向を示しています。
出典:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

また、以下の表は、Job Zone別の利用割合を示し、Zone 4(学士号レベル)で利用が最も多く、それより低いZoneや高いZone 5では利用が減少することを示しています。

Job Zone説明会話の割合 (%)
1ほとんど、または全く準備が不要0.4
2いくらか準備が必要6.2
3中程度の準備が必要26.0
4かなりの準備が必要56.3
5広範な準備が必要11.1
出典:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

論文での議論:限界と将来の展望

初期論文では、提案手法の意義と共に、その限界点 (Section 4.1)今後の展望 (Section 4.2) も詳細に議論しています。

主な限界点:

  • データサンプルの代表性: 特定期間のClaude.ai個人ユーザーデータであり、全期間、ビジネス利用、他プラットフォームを代表しない可能性。テキスト限定。
  • モデルによる分類の信頼性: 分類自体にAIを使用するため、解釈の違いによるノイズの可能性。
  • クエリの複雑さの無視: ユーザーの専門性や質問の難易度を考慮していない。
  • O*NETデータベースの限界: 静的、網羅性・曖昧さの問題、米国中心。
  • ユーザーワークフローの全体像の欠如: AI出力の最終的な利用状況(編集、ファクトチェック等)は不明。

含意と今後の展望:

  • 予測研究との対話: 実証データは既存予測 Webb, 2019; Eloundou et al., 2023 の検証やギャップ要因特定に貢献。
  • AI利用の動的追跡: 継続的な追跡により、変化の早期発見、導入障壁特定が可能に。政策決定に資する。
  • タスクレベル分析の意義: 職業消滅よりタスク構成変化の可能性を示唆。利用の広がりと深さの監視が重要。
  • 拡張 vs 自動化の意味合い: バランス変化の追跡は、生産性、スキル、政策対応(協調AI支援、労働移動支援等)の検討に重要。
  • 利用パターンから広範な影響への接続: 利用パターンと経済的成果(生産性、雇用、格差等)の因果関係解明が今後の課題。縦断分析が必要。

結論として、論文は、Anthropic Economic Indexのような実証的測定フレームワークが、AIの経済影響を理解し、議論し、政策形成する上で不可欠な基盤となることを強調しています。

Anthropic Economic Indexの分析手法:Claude会話データから経済動向を探る

(※このセクションは、分析手法の詳細に関心のある読者向けです。興味のない方は飛ばしてください。)

Clio:プライバシー保護下での大規模会話分析ツール

Anthropic Economic Indexの分析を支える基盤技術が、Anthropic社開発の「Clio」です。Clioは、大規模言語モデル(LLM)を活用し、数百万件規模の人間とAIの会話データから、個々のプライバシーを保護しつつ集計的な洞察を得るための分析ツールです。

その核心は、プライバシー保護にあります。

分析は集計され匿名化されたデータに対してのみ行われ、個々のユーザーや会話内容の特定、モデルトレーニングへの利用(デフォルト設定)はありません。Clioは「ファセット」と呼ばれる機能を用い、会話から特定の属性(例:「実行されているタスクは何か?」、「使用モデルは?」)を抽出します。

Anthropic Economic Indexでは、Clioを使い、会話をO*NETの職業タスクやスキル、インタラクションパターン(拡張/自動化)に分類し、その分布を分析します。Clioは、プロンプトを用いてLLM(論文ではClaude、最新レポートではClaude 3.7 Sonnet自身も使用)に指示を与え、会話が分析対象として適切か(例:職業関連性があるか、安全分類器に抵触しないか)をスクリーニングしたり(論文 Appendix F参照)、階層化されたタスクリストから最も適切なものを選択させたりします。

Clioは少量のラベル付きデータを用いたfew-shot学習や、ラベルなしデータからのクラスタリングなど、多様な分析タスクに対応可能です。この技術により、大規模な実利用データに基づきながらも、プライバシーに配慮した詳細なAI利用動向分析が可能となり、Anthropic Economic Indexの信頼性と独自性を支えています。

O*NETデータベース:会話を職業タスクにマッピング

Anthropic Economic Indexが個々のClaude会話を経済活動の文脈に位置づけるために用いる基準が、米労働省提供の「ONET(Occupational Information Network)データベース」です。

ONETは、米国の数百の職業に関する包括的で標準化された情報(タスク、スキル、知識、能力、労働活動など)を提供します。特に重要なのが、各職業で遂行される具体的なタスクの記述で、データベース全体で約2万件含まれています(論文では19,530件のベースタスクを分析)。

Anthropic Economic Indexでは、Clioを用いて、分析対象の会話内容がONET中のどのタスクに最も関連性が高いかを特定します。例えば、「ウェブサイトの読み込み速度改善コード」に関する会話は、「ソフトウェアを修正してパフォーマンスを向上させる」タスクにマッピングされる可能性があります。このマッピングにより、会話データを具体的な職業活動と結びつけ、「どの職業分野の、どのようなタスクでAIが活用されているか」を定量的に分析できます。

ONETは米国のデータベースですが、その網羅性と詳細さから、AIの経済タスクへの応用を理解するための有用な枠組みとして採用されています。各タスクはさらにONET内で一つ以上の職業に関連付けられており、タスクレベルの分析から職業レベル、さらには職業カテゴリレベルでの利用状況分析へと展開することが可能になります。例えば、あるタスクが複数の職業に関連する場合、そのタスクに割り当てられた会話数は、関連する職業の数で均等に分割して各職業の利用量に加算されます。

階層的分類:約2万のタスクを効率的に分析する仕組み

O*NETの約2万件という膨大なタスクリストから、会話内容に最も合致するタスクを効率的かつ正確に特定するため、Anthropic Economic Indexでは階層的な分類手法を採用しています Morin and Bengio, 2005; Mnih and Hinton, 2008。これは、事前に全タスクを意味的な関連性に基づいてツリー構造に整理しておくアプローチです。

  1. タスクのベクトル化: まず、各タスクの説明文を、文の意味を捉えることができる事前学習済みモデル(論文では all-mpnet-base-v2 Reimers and Gurevych, 2022 を使用)を用いて768次元のベクトル表現に変換します。
  2. 近傍へのグループ化: これらのベクトルをk-meansクラスタリングアルゴリズムを用いて、いくつかのグループ(近傍)に分けます。グループ内のタスク数がLLMで処理しやすい数(例: 平均40個)になるようにk(クラスター数)を調整します。
  3. 上位カテゴリ候補の生成: 各グループ内のタスク群を代表するような、より抽象的な上位レベルのタスク記述をClaudeに複数提案させます。
  4. 候補の統合と洗練: 全グループから提案された上位カテゴリ候補を比較し、重複を排除し、内容を洗練させて、階層の次のレベルを構成するカテゴリ群を決定します。
  5. 下位タスクの割り当て: 元の(より具体的な)各タスクを、決定された上位カテゴリの中から最も適切と思われるものにClaudeを用いて割り当てます。バイアスを避けるため、上位カテゴリはランダムな順序で提示されます。
  6. 上位カテゴリの再命名: 割り当てられた下位タスク群の内容を最もよく反映するように、上位カテゴリの名前と説明を再度Claudeに生成させます。

このプロセスを再帰的に適用し、最終的に3レベル(最上位12カテゴリ、中間474カテゴリ、ベース19,530カテゴリ)の階層ツリーを構築します。実際の会話分類時には、Clioはこのツリーをトップダウンで探索し、段階的に選択肢を絞り込むことで、効率的に最も関連性の高いベースタスクを特定します。この手法により、LLMのコンテキストウィンドウの制約内で、膨大なタスクリストに対する高精度な分類を実現しています。

このプロセスを再帰的に適用し、最終的に3レベル(最上位12カテゴリ、中間474カテゴリ、ベース19,530カテゴリ)の階層ツリーを構築します。実際の会話分類時には、Clioはこのツリーをトップダウンで探索し、段階的に選択肢を絞り込むことで、効率的に最も関連性の高いベースタスクを特定します。この手法により、LLMのコンテキストウィンドウの制約内で、膨大なタスクリストに対する高精度な分類を実現しています。
出典:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

分析対象データ:Claude.aiの匿名化された会話ログ

Anthropic Economic Indexの分析は、Anthropic社提供のAIアシスタント「Claude」のウェブサイト版(Claude.ai)およびモバイルアプリにおける、無料プラン(Free)有料プラン(Pro)のユーザーとの匿名化された会話ログに基づいています。分析期間や規模はレポートによりますが、数百万件から100万件規模の会話が対象となります。

これらのデータは、Anthropic社の厳格なプライバシーポリシーに基づき、集計・匿名化された形で利用され、個々のユーザーや会話内容の特定、モデルトレーニングへの利用(デフォルト設定)はありません。重要な点として、分析はClaude.aiの個人ユーザーに限定され、企業向けのTeam/EnterpriseプランAPI経由のビジネス利用は含まれません。

そのため、結果は特定のプラットフォームにおける個人利用の傾向を示すものであり、AI利用全体の完全な姿、特にビジネス領域の実態を表すものではない点に留意が必要です。それでも、大規模な実利用データは、AIが社会にどう浸透しているかを理解する上で非常に貴重な情報源となります。

最新レポートでは、安全分類器に抵触した会話を除外し、職業関連性に限定しない、より広範な会話を分析対象としています(以前のレポートからの変更点)。この変更により、より多くのデータが保持され、ボトムアップ・タクソノミー分析などが可能になりました。

Anthropic Economic Indexから得られる洞察と今後の展望

現在のAI利用の全体像:ソフトウェアとライティングが中心だが広範に浸透

Anthropic Economic Indexの分析から明らかになった現在のAI利用の全体像は、ソフトウェア開発ライティング関連タスクへの集中と、予想以上に広範な分野への浸透という二面性を持っています。初期論文によれば、これら二分野で経済関連利用の約半数を占める一方、全職業の約36%で関連タスクの少なくとも25%においてAI利用が観測されました。これは、AIが特定の専門職だけでなく、多様な分野の様々なタスクに既に組み込まれ始めていることを示唆します。利用目的としては、人間の能力を拡張する目的(57%)が、タスクを自動化する目的(43%)をやや上回っており、現時点では協働パートナーとしての役割が強いことがうかがえます。

動的追跡の重要性:変化するAI利用を捉える

AI技術とその利用は常に変化するため、Anthropic Economic Index動的な追跡を重視しています。定期的なデータ収集・分析により、時間経過に伴う利用パターンの変化を捉えます。新モデル(例: Claude 3.7 Sonnet)や新機能(例: 拡張思考モード)の登場が利用動向に与える影響を具体的に分析できる点が強みです。また、「タスク曲線(Task Curve)」を用いて、AIが職業内のタスクポートフォリオにどの程度深く浸透しているかの分布を経時的に比較します。最新レポート時点では短期間での大きな変化は見られませんでしたが、この指標の継続的な監視は、AIによる労働市場変革の速度と広がりを示す重要なシグナルとなります。この動的な視点こそが、急速に進化するAI技術と社会の関係性を理解し、未来に備える上で不可欠です。

AI技術とその利用は常に変化するため、Anthropic Economic Indexは動的な追跡を重視しています。定期的なデータ収集・分析により、時間経過に伴う利用パターンの変化を捉えます。新モデル(例: Claude 3.7 Sonnet)や新機能(例: 拡張思考モード)の登場が利用動向に与える影響を具体的に分析できる点が強みです。また、「タスク曲線(Task Curve)」を用いて、AIが職業内のタスクポートフォリオにどの程度深く浸透しているかの分布を経時的に比較します。最新レポート時点では短期間での大きな変化は見られませんでしたが、この指標の継続的な監視は、AIによる労働市場変革の速度と広がりを示す重要なシグナルとなります。この動的な視点こそが、急速に進化するAI技術と社会の関係性を理解し、未来に備える上で不可欠です。
出典:https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7 (Appendix)

結論と今後の方向性:AI経済影響の理解を深めるために

Anthropic Economic Indexは、AIが私たちの経済や仕事にどのような影響を与えているのか、憶測や断片的な情報ではなく、実際の利用データに基づいて体系的に理解しようとする、先進的な試みです。これまでの分析を通じて、いくつかの重要な洞察が得られました。AI、特にClaudeのような大規模言語モデルは、ソフトウェア開発とライティング関連のタスクで特に集中的に利用されている一方で、その利用は広範な職業分野に及び始めており、既に多くの職業でタスクの一部にAIが組み込まれている実態が明らかになりました。また、利用のされ方としては、人間の能力を拡張する目的(学習、共同作業、検証など)が、タスクを自動化する目的(指示実行、デバッグ支援など)をやや上回っており、現時点ではAIは人間の代替というよりも協働パートナーとしての側面が強いことが示唆されています。

Claude 3.7 Sonnetのような新モデルの登場は、コーディングや教育、科学といった分野での利用をさらに促進し、「拡張思考モード」のような新機能は、複雑な技術的・創造的タスクにおいてその価値を発揮し始めています。さらに、O*NETという既存の枠組みにとらわれないボトムアップ・タクソノミーの導入により、家庭内の問題解決からインフラプロジェクト支援まで、これまで見過ごされてきたかもしれない多様なAIの利用実態も明らかになりつつあります。

しかし、これはまだAIの経済への統合プロセスの始まりに過ぎません。AI技術は、テキスト処理能力の向上に留まらず、今後は画像、音声、動画といったマルチモーダルな情報の扱いや、ロボティクスを通じた物理世界とのインタラクションへと、その能力を急速に拡大していくと考えられます。AIエージェントがより自律的に、長期間にわたる複雑なタスクを実行できるようになる可能性もあります。これらの技術的進歩は、人間とAIの協働のあり方を根本的に変え、既存のタスクを変容させるだけでなく、全く新しいタスクや職業を生み出す可能性も秘めています。

このような急速かつ劇的な変化が予想される中で、Anthropic Economic Indexが提供するような、実証データに基づき、変化を動的に追跡するフレームワークの重要性はますます高まっていきます。Anthropic社は、今後もこれらの指標の追跡を継続し、AIの進化に合わせて新たな測定手法や指標を開発していく意向を示しています。

Anthropic Economic Indexから得られる継続的な洞察は、単に学術的な興味を満たすだけでなく、政策立案者、企業経営者、教育機関、そして個々の労働者が、AI時代における変化に賢明に対応していくための羅針盤となり得ます。AIによる生産性向上の機会をどのように活かすか、雇用の変化にどのように備えるか、AIの恩恵を社会全体で公平に享受するためにはどのような政策が必要か、といった重要な問いに対して、データに基づいた議論を促進するための基盤を提供するでしょう。

最終的に、Anthropic Economic Indexの挑戦は、AIの経済への影響を正確に測定することに留まらず、その理解を通じて、私たちがAIと共により良い未来を築くための一助となることを目指しています。この取り組みが、今後のAIと社会の関係性を考える上で、建設的かつ生産的な対話を促進していくことが大いに期待されます。

本記事をご覧いただいた方にはこちらの資料がおすすめです!

【目的別】生成AIの使い方がわかる! 生成AI活用事例集カバー画像

【目的別】生成AIの使い方がわかる! 生成AI活用事例集

「生成AIって色々ありすぎてよくわからない・・・」という方向けに、汎用型生成AIであるChatGPT、Claude、Gemini、Perplexityの比較や、画像、音声、動画生成のツールなどを、どの様な場面のときにどのように使用するのが効果的かという点を重点的に、事例をまとめて紹介いたします。これを読めば、生成AIの効果的な使い方がわかります!本資料は、

  • 生成AIとはなに?
  • ChatGPTを使ってみよう
  • 生成AIを業務で活用する
  • 生成AIツールを使いこなす
  • 生成AI利用の注意点

といった内容の構成になっており、ChatGPTや生成AIの基礎から、業務上の実務的な使用方法までをお伝えする資料です。

このような方にオススメ

  • ChatGPTや生成AIの基礎を知りたい方
  • ChatGPTや生成AIの基礎は理解しているが、有効な活用方法を知りたい方
  • 生成AIの効果的な業務活用方法を知りたい方
Anthropic Economic Index 最新分析:Claude 3.7 Sonnetが示すAI利用動向と経済への影響

この記事が気に入ったら
いいね または フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次