この記事のポイント
- 「経理の専門家」などのペルソナ設定でOCR精度が向上するメカニズム
- 専門家の視点を与えることで得られる具体的なメリット
- 過剰なペルソナ設定がもたらす逆効果と、適切なバランスの取り方
はじめに:ペルソナ設定とは何か
プロンプトエンジニアリングにおいて、「ペルソナ設定」は非常に効果的なテクニックとして知られています。これは、AIに対して「あなたは○○の専門家です」という役割を与えることで、その専門家らしい視点や知識を引き出す手法です。
例えば、「あなたは経験豊富なプログラマーです」と指示すればコードの品質が上がり、「あなたは校正のプロです」と指示すれば文章チェックの精度が上がる、といった効果があります。
では、OCRの文脈ではどうでしょうか?本記事では、請求書OCRを例に、ペルソナ設定がもたらす効果と注意点を解説します。
「経理の専門家」というペルソナの効果
実験:ペルソナの有無による出力比較
同一の請求書画像に対して、以下の2種類のプロンプトでGeminiに読み取りを行いました。
使用した請求書画像:

プロンプトA(ペルソナなし)
この書類の内容を読みおこしてください。
出力結果:
## 請求書概要
* **請求書番号**: INV-2026-0204-001
* **請求日 / 発行日**: 2026年2月4日
* **お支払期限**: 2026年2月28日
---
## 宛先および発行者情報
### 請求先 (お客様)
* **名称**: 株式会社 山田商事 御中
* **住所**: 〒150-0001 東京都渋谷区神宮前1-2-3
### 発行者 (請求元)
* **名称**: 株式会社 田中システムズ
* **住所**: 〒100-0001 東京都千代田区千代田1-1-1
* **連絡先**: TEL 03-1234-5678 / Email info@tanaka-systems.co.jp
* **登録番号**: T1234567890123 (適格請求書発行事業者)
---
## 請求明細
合計金額(税込)は **¥836,000** です。
| No. | 品目 | 数量 | 単価 | 税率 | 金額 (税抜) |
| --- | --- | --- | --- | --- | --- |
| 1 | Webシステム開発業務(1月分) | 1式 | ¥500,000 | 10% | ¥500,000 |
| 2 | サーバー保守管理費用 | 1ヶ月 | ¥80,000 | 10% | ¥80,000 |
| 3 | 追加機能実装(決済システム連携) | 1式 | ¥120,000 | 10% | ¥120,000 |
| 4 | 技術コンサルティング (4時間) | 4時間 | ¥15,000 | 10% | ¥60,000 |
### 金額内訳
* **小計 (税抜)**: ¥760,000
* **消費税 (10%)**: ¥76,000
* **合計金額 (税込)**: ¥836,000
---
## お振込先・備考
* **振込先口座**: 三菱UFJ銀行 渋谷支店
* **口座種別・番号**: 普通預金 1234567
* **口座名義**: カ) タナカシステムズ
* **注意事項**: 振込手数料は顧客負担となります。
> **備考**:
> * 本請求書は適格請求書(インボイス)に対応しています。
> * 不明点は発行者の連絡先まで問い合わせが必要です。
プロンプトB(ペルソナあり)
あなたは中小企業の経理と会計実務に詳しい専門家です。
これから1枚の請求書の画像を渡します。画像を読み取り、次の項目を日本語で箇条書きでまとめてください。
請求元・請求先の名称と住所
請求書番号、発行日、お支払期限
各品目の名称、数量、単価、金額、税率
小計、消費税額、税込合計金額
そのうえで、金額や税率に不整合や注意点があれば指摘してください。
出力結果:
## 1. 請求情報の詳細
### **請求元・請求先の名称と住所**
* **請求先名称**: 株式会社 山田商事 御中
* **請求先住所**: 〒150-0001 東京都渋谷区神宮前1-2-3
* **請求元名称**: 株式会社 田中システムズ
* **請求元住所**: 〒100-0001 東京都千代田区千代田1-1-1
* **登録番号**: T1234567890123(適格請求書発行事業者)
### **請求管理情報**
* **請求書番号**: INV-2026-0204-001
* **発行日**: 2026年2月4日
* **お支払期限**: 2026年2月28日
### **明細情報(各品目)**
| No. | 品目 | 数量 | 単価 | 税率 | 金額(税抜) |
| --- | --- | --- | --- | --- | --- |
| 1 | Webシステム開発業務(1月分) | 1式 | ¥500,000 | 10% | ¥500,000 |
| 2 | サーバー保守管理費用 | 1ヶ月 | ¥80,000 | 10% | ¥80,000 |
| 3 | 追加機能実装(決済システム連携) | 1式 | ¥120,000 | 10% | ¥120,000 |
| 4 | 技術コンサルティング (4時間) | 4時間 | ¥15,000 | 10% | ¥60,000 |
### **合計金額**
* **小計(税抜)**: ¥760,000
* **消費税(10%)**: ¥76,000
* **税込合計金額**: ¥836,000
---
## 2. 専門家による不整合・注意点のチェック
実務上の観点から、以下の点を確認・評価しました。
* **金額の整合性**:
* 各明細の合計(500,000 + 80,000 + 120,000 + 60,000)は **¥760,000** となり、小計と完全に一致しています。
* 消費税額(760,000 × 10% = 76,000)および税込合計金額も計算通りで、算術的な誤りはありません。
* **インボイス制度への対応**:
* 適格請求書発行事業者の「登録番号(T+13桁)」が正しく記載されています。
* 税率ごとに区分した消費税額が記載されており、形式要件を満たしています。
* **振込手数料の取扱い**:
* 備考欄に「振込手数料は貴社(支払側)負担」の旨が明記されており、支払時のトラブル防止が図られています。
> **アドバイス**
> 本請求書は形式・計算ともに非常に整っており、そのまま会計処理(仕訳:外注費や支払手数料など)を進めて問題ないレベルです。
比較結果:ペルソナ設定の効果
| 観点 | プロンプトA(ペルソナなし) | プロンプトB(ペルソナあり) |
|---|---|---|
| 出力の構造化 | 情報を羅列 | 実務で使いやすい形式に整理 |
| 金額の検証 | なし | 計算の整合性を自動チェック |
| インボイス対応 | 記載のみ | 形式要件の充足を確認 |
| 実務アドバイス | なし | 会計処理の観点からコメント |
| 注意点の指摘 | なし | 振込手数料の取扱いを確認 |
ペルソナ設定により、 単なる文字認識から「実務で使える情報抽出」 へと品質が向上しています。
なぜペルソナ設定で品質が上がるのか
この結果には、いくつかの理由が考えられます。
1. ドメイン知識の活性化
「経理の専門家」というペルソナを与えることで、AIは会計に関連する知識(インボイス制度、税率区分、仕訳科目など)を優先的に参照するようになります。
2. 出力目的の明確化
「会計処理に使う」という文脈が、AIに「実務で使える形式」を意識させます。これにより、単なる転記ではなく、検証付きの出力が行われます。
3. 専門家としての責任意識
「専門家です」という設定が、「プロとして不整合を見逃してはいけない」という暗黙の基準を設定します。
効果的なペルソナ設定の例
請求書・経理文書向けペルソナ
あなたは中小企業の経理と会計実務に詳しい専門家です。
請求書の読み取りにおいて、金額の整合性、インボイス制度への対応、
仕訳に必要な情報の抽出を重視します。
医療文書OCR向けペルソナ
あなたは、医療事務の経験20年を持つ診療情報管理士です。
カルテや診断書の読み取りにおいて、医学用語を正確に
識別し、患者の安全に関わる情報を慎重に扱います。
契約書OCR向けペルソナ
あなたは、企業法務の経験10年を持つ法務担当者です。
契約書の読み取りにおいて、当事者情報、契約期間、
金額条件、特記事項を正確に抽出します。
過剰なペルソナ設定の逆効果
問題1:創作性の暴走
ペルソナを詳細に設定しすぎると、AIが「その役になりきる」ことに意識が向き、本来のタスク(正確な読み取り)がおろそかになることがあります。
過剰なペルソナ設定の例:
あなたは、大手監査法人で30年のキャリアを積んだ公認会計士です。
数々の上場企業の監査を手がけ、不正会計の発見で業界では伝説的な存在です。
一円の誤差も許さない完璧主義で知られています...
このような設定は、AIに「ストーリー性」を意識させてしまい、客観的な読み取りを妨げる可能性があります。
問題2:過度な推測の誘発
「経験豊富な専門家」を強調しすぎると、AIが「専門家なら推測できるはず」と考え、不明瞭な文字を勝手に補完してしまうことがあります。
【過剰推測の例】
「この金額は不明瞭ですが、私の経験から判断すると
おそらく『¥500,000』でしょう」
→ 実際は『¥800,000』だった
問題3:バイアスの増幅
特定の専門家像を強く設定すると、その専門家が持つであろう「偏見」や「思い込み」も再現されてしまうことがあります。
適切なバランスの取り方
推奨されるペルソナ設定のガイドライン
-
役割は明確に、背景は簡潔に
- 良い例:「経理の専門家として読み取りを行う」
- 避ける:「大手監査法人で30年のキャリアを積んだ…」
-
能力は具体的に、感情は含めない
- 良い例:「金額の整合性とインボイス対応を確認できる」
- 避ける:「一円の誤差も許さない完璧主義で…」
-
タスクとの関連性を維持
- 良い例:「正確性を最優先とする」
- 避ける:「長年の経験から直感的に判断する」
効果的なペルソナテンプレート
あなたは【専門分野】の専門家です。
【具体的なスキル1】と【具体的なスキル2】を持っています。
今回のタスクでは、以下の点を重視してください:
- 【重視するポイント1】
- 【重視するポイント2】
注意:推測による補完は行わず、不明な点は不明として報告してください。
最後の一文が重要です。ペルソナ設定の効果を活かしつつ、過剰な推測を防ぐための「安全弁」として機能します。
まとめ
プロンプトのペルソナ設定は、OCR精度を向上させる効果的なテクニックです。
| ポイント | 内容 |
|---|---|
| ペルソナ設定の効果 | 単なる文字認識から「実務で使える情報抽出」へ品質向上 |
| 得られるメリット | 専門用語の認識、整合性チェック、実務アドバイスの付加 |
| 注意すべき逆効果 | 創作性の暴走、過度な推測、バイアスの増幅 |
| バランスの取り方 | 役割は明確に、背景は簡潔に、推測禁止の安全弁を設ける |
ペルソナ設定は「魔法の杖」ではありませんが、適切に活用することでOCRの品質を着実に向上させることができます。
関連記事
- プロンプトエンジニアリング実践ガイド:AIの回答精度を劇的に上げる技術
- LLM-OCR実践ガイド:Gemini・ChatGPT・Claudeで画像から文字を読み取る
- PaddleOCR・Tesseractで印刷文字はどこまで読める?
困ったときは
ペルソナ設定を含むプロンプト設計でお困りでしたら、AI DARUMAにご相談ください。貴社の業務内容に最適化されたペルソナとプロンプトを、実績に基づいて設計いたします。
〒723-0062 広島県三原市本町 1丁目7-29 2階 コワーキングスペースarica内