【半額で倍速で賢い】GPT-4oを試してみました

GPT-4oの登場

GPT-4oがリリースされました。
以前のモデルと比べて賢くなって、高速になって、、、なんと半額になりました。
半額もうれしいんですが、個人的には高速になった点が本当にうれしいです。
思わず「はやっ」と声が出てしまいました。

GPT-4o特徴は以下の通りです。
・マルチモーダル
 テキストだけでなく、音声、写真、動画を入力することが可能。
・パフォーマンス
 英語に関してはGPT-4 Turbo相当で、その他言語については大幅に改善。
 APIでははるかに改善している。
・料金
 GPT-4 Turbo Visionに比べ、半額。
 ※Azure Open AIの料金体系がどうなるかはわかりませんが、
  おそらく半額になると思っています。
・精度
 GPT-4 Turbo Visionのスコアを上回る。

GPT-4oの使い方

5月21日まではAzureのEarly access playground (Preview)から利用することが出来ましたが、
5月22日からAzure Open AI環境にデプロイしてAPI利用が可能となっています。

既にAzure Open AI をご利用されている方でしたら、
Azure Open AI Studio > デプロイ > 新しいデプロイの作成
からgpt-4oモデルをデプロイし、利用可能です。

GPT-4 Turbo Visionと比較

同じマルチモーダル対応のモデルである
「GPT-4 Turbo Vision」と「GPT-4o」を比較してみたいと思います。
以前のブログでも利用した、手書きの請求書画像を構造化してもらいたいと思います。

GPT-4 Turbo Visionの結果

生成に28秒ほどかかり、以下が生成されたJsonですが、、、
ちょっと精度が悪いですね。OCR目的では使いづらい印象です。

{
  "請求書番号": "No. イ23よ5",
  "請求日": "2023年11月21日",
  "請求先企業情報": {
    "企業名": "サンプル株式会社",
    "郵便番号": "〒100-0001",
    "住所": "東京都中央区日本橋1-1-1",
    "部署": "サンプルビル3階",
    "電話番号": "TEL: 03-0000-0000",
    "担当者": "サンプル太郎",
    "登録番号": "T1234567890123"
  },
  "発行元情報": {
    "社名": "株式会社システムインテグレーション",
    "言葉": "下記のとおり、御請求申し上げます。",
    "支払い条件": "サンプル条件(3ヶ月以内",
    "発行日": "2023年12月31日",
    "請求者": "サンプル登録者 中央よ67号 サンプル市(市"
  },
  "合計金額": "合計 27,987,332 (税込)",
  "内訳": [
    {
      "品名": "もの売っている",
      "数量": "1",
      "単位": "式",
      "単価": "16,000,000",
      "税率": "10%",
      "金額": "16,000,000"
    },
    {
      "品名": "タイヤ取替え",
      "数量": "1",
      "単位": "式",
      "単価": "12,345,678",
      "税率": "8%",
      "金額": "12,345,678"
    },
    {
      "品名": "何か設置",
      "数量": "1",
      "単位": "式",
      "単価": "3,400,000",
      "税率": "10%",
      "金額": "3,400,000"
    },
    {
      "品名": "修正",
      "数量": "1",
      "単位": "回",
      "単価": "1,000,000",
      "税率": "8%",
      "金額": "1,000,000"
    },
    {
      "品名": "テスト",
      "数量": "1",
      "単位": "式",
      "単価": "2,000,000",
      "税率": "10%",
      "金額": "2,000,000"
    }
  ],
  "税額詳細": {
    "10%対象": "12,340,000",
    "10%税額": "1,234,000",
    "8%対象": "13,345,678",
    "8%税額": "1,067,654",
    "0%対象": "0",
    "0%税額": "0"
  },
  "小計": {
    "小計": "25,685,678",
    "消費税": "2,301,654",
    "合計": "27,987,332"
  },
  "備考": "※請求書は先付け"
}

GPT-4o

生成に15秒ほどかかりました。GPT4vと比べると、倍近く高速化されていますし、
OCRとしての精度もかなり向上しています。

{
    "invoiceNumber": "T12345",
    "invoiceDate": "2023/11/21",
    "recipient": "株式会社システムコンサルタント 御中",
    "author": "システム開発プロジェクト",
    "paymentDeadline": "2023/12/31",
    "depositAccount": "サンプル銀行 1234567 サンプル口座",
    "totalAmount": "27,987,332 (税込)",
    "details": [
        {
            "description": "ようけんていき",
            "quantity": "1",
            "unit": "式",
            "unitPrice": "10,000,000",
            "taxRate": "10%",
            "amount": "10,000,000"
        },
        {
            "description": "外部設計",
            "quantity": "1",
            "unit": "式",
            "unitPrice": "12,345,678",
            "taxRate": "8%",
            "amount": "12,345,678"
        },
        {
            "description": "内部設計",
            "quantity": "1",
            "unit": "式",
            "unitPrice": "3,000,000",
            "taxRate": "10%",
            "amount": "3,000,000"
        },
        {
            "description": "製造",
            "quantity": "1",
            "unit": "式",
            "unitPrice": "1,000,000",
            "taxRate": "8%",
            "amount": "1,000,000"
        },
        {
            "description": "テスト",
            "quantity": "1",
            "unit": "式",
            "unitPrice": "2,000,000",
            "taxRate": "10%",
            "amount": "2,000,000"
        }
    ],
    "subtotal": "25,685,678",
    "consumptionTax": "2,301,654",
    "breakdown": {
        "10%対象": {
            "taxExcludedAmount": "12,340,000",
            "consumptionTax": "1,234,000"
        },
        "軽減税率8%対象": {
            "taxExcludedAmount": "13,345,678",
            "consumptionTax": "1,067,654"
        }
    },
    "companyInfo": {
        "name": "サンプル株式会社",
        "address": "〒100-0001 東京都千代田区千代田1-1-1 サンプルビル3階",
        "telephone": "03-0000-0000",
        "contact": "サンプル太郎",
        "registrationNumber": "T1234567890123"
    },
    "notes": ""
}

Auzre Open AI料金について

まだ正式に発表されているわけではありませんが、
Open AIが発表している料金からすると以下のようになる可能性が高いです。

モデル入力トークン1,000あたり出力トークン1,000あたり
GPT-4 Turbo Vision0.01ドル0.03ドル 
GPT-4o0.005ドル0.015ドル

この通り、GPT-4 Turbo Visionからすると、半額になっています。

しかも、トークン処理が最適化されている為、日本語であればトークン数も少なくカウントされます。
以下の文章のトークン数を、「GPT-4 Turbo Vision」と「GPT-4o」で比較してみたいと思います。

「株式会社システムコンサルタントは完全独立系IT企業として1968年に創業、金融・製造を筆頭に多彩な業界大手のビジネスパートナーとして「お客様の企業価値向上」に務めてまいりました。「ソフトウェアで未来を創る」をモットーに、当社はお客様、ひいては社会の課題に対してこれからも様々なITテクノロジーを駆使し、解決してまいります。」

モデル入力トークン数料金(1ドル156円換算)
GPT-4 Turbo Vision1860.29円
GPT-4o1290.10円

このように、料金も半額になり、トークン数も少なくなっているので、日本語であれば実質三分の一の料金で利用可能ということになります。

まとめ

・生成速度は倍
・精度も向上。画像はOCR目的でも利用可能なレベル
・料金も半額。トークン処理も最適化されているので日本語であれば、約三分の一。

OCR、画像からHTML作成、図面から情報取得等、
人がモノを見て何かを判断している業務全般に活用可能だと思います。

お問い合わせ

弊社ではChatGPTを活用し、人のノウハウを模倣したエージェントを作成し、
業務の改善や新たな価値を生み出しています。

ChatGPT活用環境の構築、ChatGPTシステムの構築、ChatGPTエージェントの作成などに
興味がある方、よくわからないからもっと知りたい方は是非ともご相談下さい。

株式会社システムコンサルタント 第一営業部