2024年7月
分析ガイド
本記事では、分析自体からは少し離れて、適切なゴール設定について詳説します。
もちろんゴール設定せずに、『データの中から探索的に実現可能なタスクを明らかにする』『精度のゴールを設定せずに、与えられた問題の中で限界まで精度を追求する』というアプローチ自体は間違ってはいません。与えられたデータを試行錯誤する中で、素晴らしいビジネスアイデアへの道筋が見つかるということもあるかもしれません。
しかし、多くの実務やビジネスシーン、案件において、慣れていないうちからゴール設定せずにデータの探索を行うと、いたずらに時間を消費し、結局何も得られないという、遭難状態に陥ってしまう可能性があります。
また、実務家としても、明確なゴールが設定されていることは、意思決定者と作業者間の合意形成にも役に立ちます。
そのため、本記事ではオーソドックスなデータ分析の進め方として、分析前にゴール設定を行い、分析を通して設定したゴールを達成するという方法を解説します。
以降、本記事では AI システムと AI を分離して考えます。なぜなら AI システムとしてのゴール(システムの仕様)と AI のゴール(精度目標)は分離して考える必要があるからです。
AI システムとは、経済協力開発機構(OECD)によって次のように定義されています。
明示的または暗黙的な目的のために、受信した入力から、物理環境または仮想環境に影響を与える可能性のある予測、コンテンツ、推薦、決定などの出力を生成する方法を推論する機械ベースのシステム。
要約すると、『AI を組み込んだシステムの全体』のことを指します。
対して、AI は哲学、工学、自然科学、社会科学、越境研究等の視点から定義が行われるため、市場および研究者間で合意形成が行われていない用語です。本記事では、狭義的に『AI システムを構成するために必要な前処理と機械学習モデル』を指し示します。
まずは、どのような問題に対して、どのように解決するのかを考えていきます。
問題の解決策をより具体化して考える行為は、AI システムが『どれくらいの速度で推論すればよいのか?』『機械同士がやり取りをするインタフェースを持つ必要があるのか?』などのシステム要件に落としこむ行為に一致します。
まずは、現状の問題や、問題ではないができるようになると嬉しいものを特定しましょう。
例えば、次のような問題が挙げられます。
今回は AI で解ける可能性を有する問題のみを列挙しています。
しかしながら実際のところは、AI は社会のどんな問題でも解ける万能の道具ではありません。**提示した問題が AI で解けるか? **という点について考える必要があります。
AI で真に解くべき課題とは、複雑な事象であるために、ルールベースな手法や数理モデリングでは直接的に解くことができない課題です。逆に言えば、ルールベースやモデリングといったアプローチを行って 100%の精度(もしくは必要十分な精度)を達成できるのであれば、ほとんどの場合 AI システムを構築する必要はありません。ただし、実装コストを勘案し、AI を選択するということ自体は有効かもしれません。
少なくとも以下の条件を具備していなくては、AI で解決するのは難しいでしょう。
また、具体的な事例なども参照して、『そもそも AI で解決できそうか?』『ほかによりよい手法が存在していないか?』といった部分を判断してください。
次に、システムとしての要件を考えていきます。一般な開発フローでは要件設計といわれる設計の段階にあたります。
例えば『製造機械を自動的に制御したい』となれば
といったことができるようなシステム仕様が必要になります。
以下のような要素について考慮を行い、AI システムのあるべき形と備えるべき機能を考えていきます。
『ダッシュボードとして、人が予測結果を閲覧できるようなシステム』や『Web API(Serving)として JSON や YAML として成形された推論結果を出力するマイクロサービスとして動作するシステム』、『既存システムの1つのコンポーネントとして AI を組み込みこんだシステム』といった形態が考えられます。
また、入力データの形式によって、使用するべき AI ツールなどもおのずと決まってきます。時系列データを入力とするのであれば Node-AI が候補に挙がります。逆に画像や音声となればそのほかのツールやプログラミングを視野に入れる必要があります。
また、データが集まっていないのであれば、データ収集の方法も考える必要があります。
いずれにせよ、何を入力データとし、何を出力データとするのか。そして、出力データはどのように活用するのかといった、AI システムのゴールを設定を定めてください。
AI として求めるべき、分析のゴールを設定します。これは、AI システムの要件定義(ゴール)を満たすために必要な、構成要素としての AI が満たすべき性能を指し示します。
当然、精度は高ければ高いほどよいでしょう。とはいえ、精度を高める作業は時間もコストも必要とします。まずは、AI システムのゴールを過不足なく満たすゴールを設定しましょう。
評価自体の詳細はこちらにまとめています。評価指標の中から、妥当性のある指標と目標値を設定してください。
例えば、以下のような基準によって設定します。
データサイエンティストや分析担当者は、分析ゴール(精度目標)の達成を目指して、各種前処理やモデルのチューニングを行います。
目標を明確にすることで、データ分析の効率を大幅に向上させることができます。プロジェクトの方向性を見失わず、効果的に成果を上げるためには、事前に適切なゴールを設定し、利害関係者間での目的共有と合意形成が行われることが望ましいです。