GPT活用のデモ

WEB情報収集のサポートツール

ChatGPTを始めとする大規模言語モデルは、チャットボット以外も多様な活用が可能です。

ここでは、WEB調査のサポートツールを想定して、その個別機能(パーツ)としてGPTを利用します。

※ これはGPT活用のデモです。WEBスクレイピングをする際には規約等の順守が必要ですのでご注意ください。

 

以下の動画は、調査項目を記載したエクセルをアップロードすると、自動的にWEB検索をしてエクセルを埋めて、それをダウンロードできる機能をもったデモアプリです。

A. 入力ファイルと出力ファイル

このデモアプリでは「調査項目を記載したエクセルファイル」を入力すると調査結果に関するエクセルが出力されます。

  • 入力:「調査項目を記載したエクセルファイル」
  • 出力1:「記入済みのエクセルファイル」
  • 出力2:「根拠情報(URL等)が記載されたエクセルファイル」

入力のエクセルには、調査対象が1列目、調査したい項目が1行目に記載してあります。

今回のデモでは、調査対象が「外食チェーン店」調査項目が「特徴、売上、店舗数」の3項目になっています。

出力1の「調査結果が記載されたエクセル」では、入力のエクセルでは空白だったセルに調査結果が記入されています。

出力2の「根拠情報(URL等)が記載されたエクセルファイル」では、出力1の各セルの根拠として使っているWEBページのURLとその該当箇所が記載してあります。

B. 処理フロー

処置フローとしては、以下の図ようになっています。

  • Step1. 調査情報の抽出
  • Step2. 初回調査の実施
  • Step3. 再調査の実施
  • Step4. 結果の整形

は「GPTを組み込んでいない通常のプログラミングで実装した機能」、が「GPTを組み込んで実装した機能」です。

C. GPTを組み込んだ機能一覧

機能1、機能3「情報の抽出」
  • 機能1は、WEBの検索結果から、入力されたエクセルに併せて該当結果を出力する機能です。初回調査としてできるだけ多くの項目(カラム)を抽出できるようにしています。さらに、単に該当箇所を出力するだけでなくURLも併せて出力するようにしています。機能3は、特定の項目(カラム)に限定した情報を抽出できるような機能です
  • 下の例では、入力された情報から、「特徴、売上高(円)、店舗数」に該当する情報が抽出されています
入出力の関係
プロンプト例
機能2「検索キーワードの作成」
  • エクセルの項目(カラム)を使ったキーワードではいい情報に検索がヒットしなかった場合に、検索キーワードをあらたに作成させる機能です。
  • 下の例では、「EEE(店舗名) 店舗数」のキーワードでヒットしなかったという情報をもとに「EEE 出店数」、「EEE 支店数」、「EEE 展開している数」といった意味は同じで単語が異なるキーワードが作成されています

入出力の関係

プロンプトの例

機能4「特定カラムの選択」
  • 数値系の項目(カラム)では、例えば金額の場合、xx億円、1000円など抽出時に表記揺れが生じることがあります。これを修正するために、数値系のカラムを特定してカラム名を出力する機能です。単純なpythonのデータ型では対応できないが、人なら値全体を見て理解できるような処理をGPTに実施させています
  • 下の例では、「特徴」カラムは文字列で、数字情報が入っている「売上高(円)」カラムと「店舗数」カラムが選択されています

入出力の関係

プロンプトの例

機能5「セル内の値の整形」
  • 数値系の項目(カラム)の値を列単位で取得し、フォーマットがあうように全体を整えて出力する機能です。
  • 下の例では、入力では「354(数字のみ)、197店舗、104件」といった表現が混じっているが、出力では全て「XXX店舗」で統一されています

    入出力の関係

    プロンプトの例

    このように、プロンプトを工夫し、json形式で出力させることで、従来では困難であった機能を実装することができるようになります。

    また、実装については、LangChainを用いることでより容易に実装できる環境も整ってきており、大規模言語モデルをパーツ(機能)として活用するシーンがますます増えてくる状況になってきています。

    弊社では様々なケースでのGPT活用をサポートしております。

    GPTを活用した機能開発やお悩みがある方はぜひ一度ご相談ください!

    Accelerate Your Business Growth With Us

    HOME
    • About Us
    • Service
    • Development
    • Usecase
    COMPANY
    • Member
    • VisionMission
    • 会社概要
    Privacy Policy
    HELIKS DATA Inc.

    東京都品川区西五反田二丁目14番13号ニックハイム五反田2階