Skip to content
center-gradient-cover-bg
right-gradient-cover-bg
background gradient desk
ブログ

FPT AI Readerを使用して画像から情報を抽出する方法

March 12, 2025

Share with:

FPT AI Readerは、OCR技術を使用して、既存の文書テンプレート(個人書類、請求書)や任意のカスタム文書形式(契約書、証明書など)から画像の内容を正確に認識および抽出するアプリケーションであり、迅速かつ便利に文書をデジタル化します。この記事では、FPT.AIがFPT AI Readerを使用して画像から情報を抽出する方法を説明します。一緒に見てみましょう!

FPT AI Readerのアカウント登録と言語選択

FPT.AIの専門家によって研究開発されたFPT AI Readerアプリケーションは、人工知能(AI)とコンピュータビジョン、光学文字認識(OCR)、インテリジェントドキュメント処理(IDP)技術を使用し、画像処理技術と自然言語処理(NLP)を組み合わせて、ユーザーが数秒で正確に文書をデジタル化し、高いセキュリティと簡単な保存を実現します。

FPT.AI Readerアプリケーションを使用するには、FPT IDアカウントが必要です。アカウントをお持ちでない場合は、こちらで登録してください: https://id.fptcloud.com/.その後、こちらにアクセスしてください: https://reader.fpt.ai/ 素晴らしい体験を始めましょう!

fpt ai reader
FPT AIリーダーインターフェース

FPT AI Readerアプリケーションは、英語とベトナム語の2つの言語をサポートしています。画面右上のアイコンをクリックして使用する言語を選択してください。

fpt ai reader
使用言語をベトナム語または英語に選択

 

FPT AI Readerの既存の文書ライブラリを使用して情報を抽出する方法

次に、FPT AI Readerのライブラリに既にある画像文書の種類から情報を抽出するには、次の手順を実行します。

文書テンプレートの選択

まず、画面右上のライブラリをクリックすると、FPT AI Readerのインターフェースに、アプリケーションに統合された文書テンプレートが表示され、抽出精度は最大98%です。

fpt ai reader
ライブラリをクリック

現在、FPT AI Readerは、個人書類や異なる業界分野の文書テンプレートから情報をデジタル化することをサポートしており、例えば、身分証明書、運転免許証、パスポート、出生証明書、請求書、保険証書などがあります。

fpt ai reader
FPT AI Readerは、異なる業界分野の文書テンプレートのデジタル化をサポートしています

使用を開始するには、データを抽出する文書の種類をクリックし、プロジェクトに名前を付けて、作成をクリックする必要があります。この記事では、運転免許証の文書を例にします。

fpt ai reader
データを抽出する文書の種類を選択

この時点で、画面のインターフェースには、運転免許証の情報を抽出する際に使用する重要な情報フィールドと関連データ(名前、ステータス、更新時間、作成時間、モデルの使用、アクション)が表示されます。

データのアップロード

続行するには、画面右上のアップロードを選択し、運転免許証の画像をシステムにアップロードします。注意: 1ファイルのアップロード容量は5MBを超えないようにし、jpg、png、pdfなどの画像形式を受け入れます。

fpt ai reader
画像をシステムにアップロードする

画面の左下隅にあるファイル選択 (1) をクリックして、複数の画像ファイルを同時にアップロードできます。アップロードする運転免許証の画像ファイルを選択した後、アップロード (2) をクリックしてこの手順を完了します。

fpt ai reader
複数のファイルをシステムにアップロードする

運転免許証の画像がシステムに正常にアップロードされると、FPT AI Readerは数秒で画像を自動的に処理し、画像のステータスを処理済みに変更します。この時点で、各行をクリックして運転免許証の画像と抽出結果を表示できます。

fpt ai reader
FPT AI Readerによって処理された画像

(注意: 画像はあくまで参考用であり、実際の使用価値はありません) 他の正常にアップロードされた運転免許証の画像でも同様に操作します。OCR技術を使用して、FPT AI Readerは、画像がぼやけている、文字が不鮮明である、異なる色の領域がある、文字が重なっている、画像が整列していないなどの条件でも高精度で認識できます(例: 下の画像の「ngày/date 05 tháng/month 07」に赤い印が重なっている場合)。

fpt ai reader
FFPT AI Readerは、文字に赤い印が重なっている場合でも高精度で認識できます

(注意: 画像はあくまで参考用であり、実際の使用価値はありません)>>> XEM THÊM: Nhận dạng chữ viết tay bằng công nghệ OCR với FPT AI Read

ユーザー権限の設定

FPT AI Readerには、同じ組織内の他の個人に対して役割に応じたアクセス権を設定する機能もあります。アクセス権を持つユーザーは、データベースにアクセスしたり、プロジェクトにデータを直接提供したりできます。画面左側のアプリケーションバーの設定をクリックして、他のユーザーに権限を設定します。

fpt ai reader
組織内の個人の役割に応じたアクセス権の設定

「新規作成」を選択してユーザーに権限を設定します。編集権限/Editorまたは閲覧権限/Viewerを選択します。

fpt ai reader
編集権限/Editorまたは閲覧権限/Viewer

プロジェクトを共有したいアカウントのメールアドレスを入力し、適切な役割(Role)を選択します。2つの役割があります:  Admin: ユーザーはアプリケーションの所有者としてAPIをテストするために画像をアップロードできます ?⁠ Viewer: ユーザーはテストプロセスを閲覧することしかできません 注意: 新しいユーザーは権限を設定される前にFPT.AI Readerアカウントを持っている必要があります。

OCR APIのテスト

テストしたいプロジェクトにアクセスした後、使用/Usageページでアップロード/Uploadボタンをクリックしてテスト画像をアップロードしますOCR FPT.AIボタンをクリックして、名前で画像を検索するか、画像にフィルターを適用します。

fpt ai reader
名前で画像を検索するか、画像にフィルターを適用する

画像の名前をクリックして、以下のようにAPI結果を表示します。

fpt ai reader
OCR APIの結果

OCR FPT.AIボタンをクリックして、画像のOCR結果について詳しく調べます。

fpt ai reader
画像のOCR結果について詳しく調べる

抽出結果が正確でない場合は、情報をドラッグしてフラグをクリックしてエラーを報告します。

fpt ai reader
情報が正確でない場合はエラーを報告する

正確な情報を入力し、保存/Saveをクリックします。

fpt ai reader
情報が正確であれば保存/Save

OCR認識結果を抽出またはフィルタリングするには、OCR FPT.AIボタンをクリックしてデータのダウンロードを承認します。

OCR FPT.AI

FPT AI Readerにない文書テンプレートを使用して情報を抽出する方法

既存の文書テンプレートからの情報認識および抽出をサポートするだけでなく、FPT AI Readerは、ユーザーが契約書、証明書、カードなどの任意のカスタム文書形式に従ってスマート抽出モデルを構築することもできます。具体的な手順は以下の通りです:

モデルを作成し、文書の写真をアップロードする

ライブラリにない文書の種類については、画面左側のナビゲーションバーのアプリケーションをクリックしてメイン画面に戻り、画面右上の新規作成ボタンをクリックして独自の文書テンプレートを作成します。

fpt ai reader
ライブラリにない文書の種類を新規作成する

次に、プロジェクト名を入力し、OCR文書の種類を選択して作成ボタンをクリックします。この記事では、学生証から情報を抽出する方法を例にします。

fpt ai reader
プロジェクト名を入力し、OCR文書の種類を選択して作成ボタンをクリックする

この時点で、画面のインターフェースには、使用プロセス全体とデジタル化されたデータ(名前、ステータス、更新時間、作成時間、モデルの使用、アクション)を追跡するための重要な情報フィールドが表示されます。ユーザーは、画面左側のナビゲーションバーのテンプレートを選択し、アップロードを選択して新しい文書テンプレートの入力データをアップロードします。

fpt ai reader
新しい文書テンプレートの入力データをアップロードする

画面の左下隅にあるファイル選択 (1) をクリックして、複数の画像ファイルを同時にアップロードできます。学生証の画像ファイルを選択した後、アップロード (2) をクリックしてこの手順を完了します。注意: 1ファイルのアップロード容量は5MBを超えないようにし、jpg、pngなどのさまざまな画像形式を受け入れます。

fpt ai reader
複数のファイルを同時にアップロードする

既存の文書テンプレートで操作する場合と同様に、画像から抽出された情報は右側の列に表示されます。

fpt ai reader
画像から抽出された情報は右側の列に表示されます

 

抽出モデルの構築

重要な情報/抽出する必要がある情報をフィルタリングするために、ユーザーはコア文書テンプレートを使用してテキスト認識および抽出モデルを構築する必要があります。文書テンプレートは、品質の良い写真であり、まっすぐに撮影され、ぼやけたり、フレームがずれたりしないようにする必要があります。品質の良い文書テンプレートは、認識および抽出の精度を向上させます。認識および抽出モデルを構築するには、少なくとも3つの文書テンプレートが必要です。テンプレート」セクションに画像テンプレートを追加した後、ユーザーは抽出する必要がある情報フィールドにラベルを付け、抽出結果を修正して認識精度を向上させるために「編集」を選択します。画面左側のナビゲーションバーで「テンプレート」を選択し、ラベルを付ける必要がある各画像を選択して「編集」を選択します。

fpt ai reader
コア文書テンプレートの認識および抽出モデルの構築

このステップでは、画像上の各情報フィールド (1) を指し示し、システムが抽出したデータ (2) と照合することでシステムをトレーニングする必要があります。認識が不正確なデータを修正するか、不要なデータを削除する必要があります。各変更に対して、システムは修正した情報を自動的に保存します。

fpt ai reader
システムが情報を正確に認識するためにトレーニングが必要です

データの選択と修正を行った後、「トレーニングに追加」を選択してテンプレートをトレーニング待ちリストに追加します。**すべてのデータテンプレートの修正が完了したら、ユーザーは「トレーニング」ボタンを選択してシステムがデータテンプレートのトレーニングプロセスを開始します

fpt ai reader
データテンプレートのトレーニングプロセスを開始する

このトレーニングプロセスには数時間かかり、トレーニングを開始するには少なくとも3つのテンプレートが必要です。トレーニングが完了すると、システムはユーザーに通知します。FPT AI Readerソフトウェアは、以前に調整およびトレーニングされたデータを通じて自己学習し、より賢くなります。高品質の文書テンプレートを提供し、データに正確にラベルを付け、モデルを定期的にトレーニングおよびテストすることで、ライブラリにない新しい文書テンプレートの情報を簡単かつ便利に認識および抽出するためにトレーニングできます。

抽出モデルの使用

データテンプレートのトレーニングが成功した後、ユーザーは既存のテンプレート形式に従って文書を認識および抽出します。これらの操作は、ライブラリ内の文書テンプレートを使用する場合と同様です。ユーザーは、画面左側のナビゲーションバーの「使用」を選択し、文書をアップロードして抽出結果を受け取ります。

FPT AI Readerアプリケーションを企業のシステムに統合する方法

FPT AI Readerアプリケーションを企業のシステムに統合することは、APIを通じて非常に簡単で、実際のリクエスト数に基づいて合理的なコストで行うことができます。OCR APIに接続するには、Console.fpt.aiにアカウントが必要です。その後、新しいAPIキーを作成してゲートウェイにリクエストを送信します(デフォルトでは、新しいAPIキーごとに50リクエストのみ送信できます)。FPT AI Readerは、企業の実際のニーズに応じて柔軟に展開され、システムのデータ処理規模を拡大できます。

容量の追加購入

ベトナム語OCRソフトウェアFPT AI Readerは、年間50リクエストを無料で提供します。ただし、より多くのトラフィックと高速変換が必要な場合は、「設定」セクションで有料プランを購入し、「購入」ボタンを選択できます。企業のお客様や大量のリクエストが必要な場合は、すぐにお問い合わせください!

_____________________________

👉🏻 FPT.AIのその他の製品を体験する: https://fpt.ai/vi 📍 住所: 7階, FPTタワー, 10 Phạm Văn Bạch, Cầu Giấy区, ハノイ市 ☎️ ホットライン: 1900 638 399 📧 メール: support@fpt.ai

Đánh giá
Related Posts
image post
ブログ
FPT AI Read OCRツールによる手書き認識の最適化

手書き文字認識(HWR)または手書きテキスト認識とも呼ばれる技術は、コンピュータが紙の文書、画像、タッチスクリーン、その他のデバイスから手書きデータを受け取り、解釈する能力を指します。高精度かつ時間・コストの節約が可能なこの技術は、業務効率と情報セキュリティを向上させ、持続可能なビジネス成長の道を切り拓きます。 手書き認識とは何ですか? 手書き認識 (HWR) は、手書きテキスト認識とも呼ばれ、紙の文書、写真、タッチ デバイスの画面などのソースからの画像から手書きデータ、印刷されたテキスト、または入力されたテキストをコンピューターが分析して理解できるようにするテクノロジです。手書き認識には主に 2 つの方法があります。 オフライン手書き認識:紙に書かれた手書き文字をスキャン(光学的)または写真撮影によってデジタル化します。 オンライン手書き認識:タッチスクリーンや電子ボード上でのペンの動きを追跡・記録します。 光学文字認識(OCR)技術を活用した手書き文字認識。 光学文字認識(OCR)は、画像(写真、スキャン)内のテキストをデジタルデータに変換し、コンピュータが処理できる形式にする技術です。OCRは、文字の形状や構造を分析・認識し、それをデジタルテキストに変換することで機能します。 手書き認識におけるOCR技術の具体的な利点 情報の迅速な検索と編集が可能になり、紙の文書を調べる場合と比較して時間を大幅に節約できます。 紙のデータをスキャンし、わずか2〜3秒で入力可能。手作業と比較して40〜50倍の速度で処理し、エラーを最小限に抑えながらワークフローを最適化。必要な人員を大幅に削減し、運用コストを節約できます。 OCR処理後の文書は、強固なセキュリティを備えたデータベースに保存されます。システムはすべての変更を追跡・記録し、従来の紙ベースの保存方法よりも重要なデータを安全に保護します。 文書はデジタル化されシステム上に保存されるため、他の業務のためのスペースを確保でき、かさばるキャビネットの管理が不要になります 現在、OCRは行政、医療、金融、教育など多くの業界で広く活用されています。 Research and Marketsのレポートによると、世界のOCR市場規模は2030年までに263億1,000万米ドルに達すると予測されており、2022年からの年平均成長率(CAGR)は15.4%です。 FPT AI Read – 画像から手書き文字を認識する新たな進歩 FPT.AIは、ベトナム語の多様なアクセントや文字間の連結ストロークの特性を長期間にわたり研究し、その成果として、ベトナム市場で最高水準の精度を誇る手書き文字認識・抽出ソリューション「FPT AI Read」を発表しました。 このソリューションは、印刷テキストの抽出および入力プロセスの約80%を自動化し、95%以上の精度を実現します。文字形状認識モデルではなく、FPT AI Readは機械学習、ディープラーニング、コンピュータビジョンを統合したトレーニングモデルを活用し、手書き数字および手書き文字の認識精度を80〜85%に向上させます。 FPT AI Readは、抽出対象の情報フィールド(欠落または余分な文字、誤った日付など)に異常がないか検出する検証モデルを搭載しています。また、このモデルは同一の文書セット内での情報クロスチェックや、企業のCRMシステム上の顧客データとの比較が可能です。この画像からテキストへの変換ソフトウェアには、非標準的な情報フィールドに対する警告ラベル機能が搭載されており、ユーザーが簡単に介入し、最大限の精度を確保できます。 現在、FPT AI Readは、保険、金融、銀行業界に広く導入されており、診療記録、支払い承認書、顧客が記入する各種書類などの手書き文書の処理を自動化しています。このソリューションは、手作業によるデータ入力に伴う主な課題である入力ミス、時間の浪費、機密性の高い顧客情報の漏洩リスクを解決します。 FPT AI Readは、多くの企業の手書き文書処理を自動化します FPT AI Readは、データデジタル化プロセスを効率化するだけでなく、業務効率を向上させ、サービス品質を改善し、情報セキュリティを確保します。これは、企業のデジタルトランスフォーメーションを推進し、長期的な利益をもたらし、持続可能な成長を促進する強力なツールです。 手書き認識に関するその他のFAQ 手書き文字認識とは何か、どの分野で活用されているのか? 手書き文字認識(HWR)は、手書きをデジタルデータに変換する技術です。 Tこの技術は、銀行、保険、医療、教育分野における文書処理の自動化をはじめ、データ入力や情報管理プロセスの最適化に広く活用されています。 AI手書き認識ソフトウェアが適さないケースは? AI手書き認識ソフトウェアは、ぼやけた画像、損傷した紙、またはカリグラフィーのような過度に装飾された手書き文字を含む低品質の文書の処理には適していません。創造的な介入や美的判断を必要とするケースでは、人間の手による作業が依然として必要です。 FPT AI Readは企業でどのように活用されていますか? FPT AI … Continued

image post
ブログ
OCRとは何ですか? OCRの仕組みと応用

光学文字認識識(OCR)は、時間とともに重要な文書が損傷する可能性に関する懸念を解消できる技術です。では、OCRとは何ですか? FPT.AIと共にOCR技術が、タイピングされた、手書きまたは印刷されたテキストの画像をデジタルデータに変換する方法を学び、MB銀行とGRABが成功したデジタル化を実現した方法を見てみましょう。 OCRとは? OCR とは何の略ですか? OCRは「光学文字認識識」の略で、タイピングされた、手書きまたは印刷されたテキストをコンピュータが読み取れる形式(機械可読形式)に変換する技術です。OCRは、ユーザーが自動的にデータを抽出し(自動データ抽出)、編集、フォーマット、検索を行うことを可能にし、それらがワードプロセッサで作成されたかのように扱えるようにします。 光学文字認識(OCR)は、パターン認識、人工知能(AI)、およびコンピュータビジョン(Computer Vision)の研究から発展しました。OCRソフトウェアは、認知コンピューティング(Cognitive Computing)、機械翻訳(Machine Translation)、テキスト音声変換(Text-to-Speech, TTS)、主要データマイニング(Key Data Mining)、および**テキストマイニング(Text Mining)**を活用し、ユーザーがテキストデータを自動的に抽出、編集、フォーマット、検索できるようにします。これにより、まるでワードプロセッサ(Word Processor)で作成されたかのように、テキストを自在に操作することが可能になります。 組織は通常、パスポートの書類(passport documents)、請求書(invoices)、銀行明細書(bank statements)、電子領収書(computerized receipts)、名刺(business cards)、郵便物(mail)、印刷されたデータ(printed data)など、紙の記録からデータ入力の形式として光学文字認識識(OCR)を使用します。 現在、光学式文字認識 (OCR) はほぼ完璧な精度を実現しており、ラテン語、キリル文字、アラビア語、ヘブライ語、インド文字、中国語、日本語、韓国語など、多くの表記体系をサポートしています。 OCR テクノロジーの大幅な発展により、テキストを自動的に処理できるようになり、手動によるデータ入力に比べて時間が節約され、エラーが最小限に抑えられます。 >>> 詳しく読む: FPT AI Read による OCR 技術を活用した手書き認識の最適化 OCR技術はどのように機能するのでしょうか? OCR技術を使用するソフトウェア(OCRソフトウェア)は、次の手順でデータをデジタル化します: 画像の取得: 文書のページをスキャンして解析し、暗い部分が認識する必要のある文字であり、明るい部分が背景です。 前処理: 画像から不要なピクセルを取り除き、その後、直線補正、ノイズ除去、文字のエッジを滑らかにする、画像の点を除去する、枠線を消す、明るさを調整する、またはぼやけを減らす技術を使用して調整します。 レイアウト認識: OCRソフトウェアは、文書の構造を解析し、ページをテキストブロック、テーブル、または画像に分割します。行は単語に、単語は文字に分割されます。文字が分割された後、ソフトウェアはそれらを画像サンプルのセットと比較します。結果が一致すると、プログラムは認識されたテキストを返します。 テキスト認識: 暗い領域は、次の 2 つのアルゴリズムのいずれかを使用して文字、数字、または記号を検出するために処理されます。 テンプレートマッチング:事前に複数のフォントや書式でトレーニングされたOCRプログラムを使用し、入力された文字をシステム内に保存された文字と比較する手法です。この方法は、高品質で標準的なフォーマットの画像に適しています。しかし、世界中のあらゆるフォントや言語の組み合わせに対応するOCRモデルをトレーニングするには、膨大なシステムリソースが必要となります。 特徴抽出: 特徴(角度の数、交差点、ループ、または曲線)に基づいて文字を認識する手法で、OCRが訓練されていないフォントを分析する際に使用されます。例えば、”A”は交差する2本の斜線と中央に1本の水平線で識別されます。識別後、文字はコンピュータシステムが処理できるASCII(アメリカ標準情報交換コード)に変換されます。 テキスト変換: 認識された文字を編集可能なデジタル テキストに変換します。最新の OCR ツールの多くは、特に手書きや不明瞭な文字の精度を向上させるために AI … Continued

Get ahead with AI-powered technology updates!

Subscribe now to our newsletter for exclusive insights, expert analysis, and cutting-edge developments delivered straight to your inbox!