FPT AI Readerは、OCR技術を使用して、既存の文書テンプレート(個人書類、請求書)や任意のカスタム文書形式(契約書、証明書など)から画像の内容を正確に認識および抽出するアプリケーションであり、迅速かつ便利に文書をデジタル化します。この記事では、FPT.AIがFPT AI Readerを使用して画像から情報を抽出する方法を説明します。一緒に見てみましょう!
FPT AI Readerのアカウント登録と言語選択
FPT.AIの専門家によって研究開発されたFPT AI Readerアプリケーションは、人工知能(AI)とコンピュータビジョン、光学文字認識(OCR)、インテリジェントドキュメント処理(IDP)技術を使用し、画像処理技術と自然言語処理(NLP)を組み合わせて、ユーザーが数秒で正確に文書をデジタル化し、高いセキュリティと簡単な保存を実現します。
FPT.AI Readerアプリケーションを使用するには、FPT IDアカウントが必要です。アカウントをお持ちでない場合は、こちらで登録してください: https://id.fptcloud.com/.その後、こちらにアクセスしてください: https://reader.fpt.ai/ 素晴らしい体験を始めましょう!

FPT AI Readerアプリケーションは、英語とベトナム語の2つの言語をサポートしています。画面右上のアイコンをクリックして使用する言語を選択してください。

FPT AI Readerの既存の文書ライブラリを使用して情報を抽出する方法
次に、FPT AI Readerのライブラリに既にある画像文書の種類から情報を抽出するには、次の手順を実行します。
文書テンプレートの選択
まず、画面右上のライブラリをクリックすると、FPT AI Readerのインターフェースに、アプリケーションに統合された文書テンプレートが表示され、抽出精度は最大98%です。

現在、FPT AI Readerは、個人書類や異なる業界分野の文書テンプレートから情報をデジタル化することをサポートしており、例えば、身分証明書、運転免許証、パスポート、出生証明書、請求書、保険証書などがあります。

使用を開始するには、データを抽出する文書の種類をクリックし、プロジェクトに名前を付けて、作成をクリックする必要があります。この記事では、運転免許証の文書を例にします。

この時点で、画面のインターフェースには、運転免許証の情報を抽出する際に使用する重要な情報フィールドと関連データ(名前、ステータス、更新時間、作成時間、モデルの使用、アクション)が表示されます。
データのアップロード
続行するには、画面右上のアップロードを選択し、運転免許証の画像をシステムにアップロードします。注意: 1ファイルのアップロード容量は5MBを超えないようにし、jpg、png、pdfなどの画像形式を受け入れます。

画面の左下隅にあるファイル選択 (1) をクリックして、複数の画像ファイルを同時にアップロードできます。アップロードする運転免許証の画像ファイルを選択した後、アップロード (2) をクリックしてこの手順を完了します。

運転免許証の画像がシステムに正常にアップロードされると、FPT AI Readerは数秒で画像を自動的に処理し、画像のステータスを処理済みに変更します。この時点で、各行をクリックして運転免許証の画像と抽出結果を表示できます。

(注意: 画像はあくまで参考用であり、実際の使用価値はありません) 他の正常にアップロードされた運転免許証の画像でも同様に操作します。OCR技術を使用して、FPT AI Readerは、画像がぼやけている、文字が不鮮明である、異なる色の領域がある、文字が重なっている、画像が整列していないなどの条件でも高精度で認識できます(例: 下の画像の「ngày/date 05 tháng/month 07」に赤い印が重なっている場合)。

(注意: 画像はあくまで参考用であり、実際の使用価値はありません)>>> XEM THÊM: Nhận dạng chữ viết tay bằng công nghệ OCR với FPT AI Read
ユーザー権限の設定
FPT AI Readerには、同じ組織内の他の個人に対して役割に応じたアクセス権を設定する機能もあります。アクセス権を持つユーザーは、データベースにアクセスしたり、プロジェクトにデータを直接提供したりできます。画面左側のアプリケーションバーの設定をクリックして、他のユーザーに権限を設定します。

「新規作成」を選択してユーザーに権限を設定します。編集権限/Editorまたは閲覧権限/Viewerを選択します。

プロジェクトを共有したいアカウントのメールアドレスを入力し、適切な役割(Role)を選択します。2つの役割があります: Admin: ユーザーはアプリケーションの所有者としてAPIをテストするために画像をアップロードできます ? Viewer: ユーザーはテストプロセスを閲覧することしかできません 注意: 新しいユーザーは権限を設定される前にFPT.AI Readerアカウントを持っている必要があります。
OCR APIのテスト
テストしたいプロジェクトにアクセスした後、使用/Usageページでアップロード/Uploadボタンをクリックしてテスト画像をアップロードしますOCR FPT.AIボタンをクリックして、名前で画像を検索するか、画像にフィルターを適用します。

画像の名前をクリックして、以下のようにAPI結果を表示します。

OCR FPT.AIボタンをクリックして、画像のOCR結果について詳しく調べます。

抽出結果が正確でない場合は、情報をドラッグしてフラグをクリックしてエラーを報告します。

正確な情報を入力し、保存/Saveをクリックします。

OCR認識結果を抽出またはフィルタリングするには、OCR FPT.AIボタンをクリックしてデータのダウンロードを承認します。

FPT AI Readerにない文書テンプレートを使用して情報を抽出する方法
既存の文書テンプレートからの情報認識および抽出をサポートするだけでなく、FPT AI Readerは、ユーザーが契約書、証明書、カードなどの任意のカスタム文書形式に従ってスマート抽出モデルを構築することもできます。具体的な手順は以下の通りです:
モデルを作成し、文書の写真をアップロードする
ライブラリにない文書の種類については、画面左側のナビゲーションバーのアプリケーションをクリックしてメイン画面に戻り、画面右上の新規作成ボタンをクリックして独自の文書テンプレートを作成します。

次に、プロジェクト名を入力し、OCR文書の種類を選択して作成ボタンをクリックします。この記事では、学生証から情報を抽出する方法を例にします。

この時点で、画面のインターフェースには、使用プロセス全体とデジタル化されたデータ(名前、ステータス、更新時間、作成時間、モデルの使用、アクション)を追跡するための重要な情報フィールドが表示されます。ユーザーは、画面左側のナビゲーションバーのテンプレートを選択し、アップロードを選択して新しい文書テンプレートの入力データをアップロードします。

画面の左下隅にあるファイル選択 (1) をクリックして、複数の画像ファイルを同時にアップロードできます。学生証の画像ファイルを選択した後、アップロード (2) をクリックしてこの手順を完了します。注意: 1ファイルのアップロード容量は5MBを超えないようにし、jpg、pngなどのさまざまな画像形式を受け入れます。

既存の文書テンプレートで操作する場合と同様に、画像から抽出された情報は右側の列に表示されます。

抽出モデルの構築
重要な情報/抽出する必要がある情報をフィルタリングするために、ユーザーはコア文書テンプレートを使用してテキスト認識および抽出モデルを構築する必要があります。文書テンプレートは、品質の良い写真であり、まっすぐに撮影され、ぼやけたり、フレームがずれたりしないようにする必要があります。品質の良い文書テンプレートは、認識および抽出の精度を向上させます。認識および抽出モデルを構築するには、少なくとも3つの文書テンプレートが必要です。テンプレート」セクションに画像テンプレートを追加した後、ユーザーは抽出する必要がある情報フィールドにラベルを付け、抽出結果を修正して認識精度を向上させるために「編集」を選択します。画面左側のナビゲーションバーで「テンプレート」を選択し、ラベルを付ける必要がある各画像を選択して「編集」を選択します。

このステップでは、画像上の各情報フィールド (1) を指し示し、システムが抽出したデータ (2) と照合することでシステムをトレーニングする必要があります。認識が不正確なデータを修正するか、不要なデータを削除する必要があります。各変更に対して、システムは修正した情報を自動的に保存します。

データの選択と修正を行った後、「トレーニングに追加」を選択してテンプレートをトレーニング待ちリストに追加します。**すべてのデータテンプレートの修正が完了したら、ユーザーは「トレーニング」ボタンを選択してシステムがデータテンプレートのトレーニングプロセスを開始します

このトレーニングプロセスには数時間かかり、トレーニングを開始するには少なくとも3つのテンプレートが必要です。トレーニングが完了すると、システムはユーザーに通知します。FPT AI Readerソフトウェアは、以前に調整およびトレーニングされたデータを通じて自己学習し、より賢くなります。高品質の文書テンプレートを提供し、データに正確にラベルを付け、モデルを定期的にトレーニングおよびテストすることで、ライブラリにない新しい文書テンプレートの情報を簡単かつ便利に認識および抽出するためにトレーニングできます。
抽出モデルの使用
データテンプレートのトレーニングが成功した後、ユーザーは既存のテンプレート形式に従って文書を認識および抽出します。これらの操作は、ライブラリ内の文書テンプレートを使用する場合と同様です。ユーザーは、画面左側のナビゲーションバーの「使用」を選択し、文書をアップロードして抽出結果を受け取ります。
FPT AI Readerアプリケーションを企業のシステムに統合する方法
FPT AI Readerアプリケーションを企業のシステムに統合することは、APIを通じて非常に簡単で、実際のリクエスト数に基づいて合理的なコストで行うことができます。OCR APIに接続するには、Console.fpt.aiにアカウントが必要です。その後、新しいAPIキーを作成してゲートウェイにリクエストを送信します(デフォルトでは、新しいAPIキーごとに50リクエストのみ送信できます)。FPT AI Readerは、企業の実際のニーズに応じて柔軟に展開され、システムのデータ処理規模を拡大できます。
容量の追加購入
ベトナム語OCRソフトウェアFPT AI Readerは、年間50リクエストを無料で提供します。ただし、より多くのトラフィックと高速変換が必要な場合は、「設定」セクションで有料プランを購入し、「購入」ボタンを選択できます。企業のお客様や大量のリクエストが必要な場合は、すぐにお問い合わせください!
_____________________________
👉🏻 FPT.AIのその他の製品を体験する: https://fpt.ai/vi
📍 住所: 7階, FPTタワー, 10 Phạm Văn Bạch, Cầu Giấy区, ハノイ市
☎️ ホットライン: 1900 638 399
📧 メール: support@fpt.ai