三菱UFJトラスト投資工学研究所がAdobe PDF Extract APIを導入し、PDFデータの高精度な分析を効率化
【2022年10月13日】
アドビ株式会社(本社:東京都品川区、代表取締役社長:神谷 知信、以下 アドビ)は本日、株式会社 三菱UFJトラスト投資工学研究所(本社:東京都千代田区、取締役社長:庵 栄治、以下MTEC)がPDFから文書構造を維持したまま、見出しやリスト、パラグラフなどといったテキストデータを判別し正確に抽出することが可能な「Adobe PDF Extract API」を導入したことを発表します。
日本初の金融工学に特化したシンクタンクとして、三菱信託銀行(現三菱UFJ信託銀行)の出資により設立されたMTECは、最先端の金融研究を通じて金融業務における課題を解決するソリューションを提供しています。総合金融グループである株式会社三菱UFJフィナンシャル・グループ(MUFG)の研究所としての専門性を活かし、膨大かつ多様なデータを収集し高度な分析を行うことで、市場リスクや信用リスク管理モデルの高度化、データ分析による情報処理といった領域で、様々な研究成果を発揮しています。
MTECでは、各社の決算報告書や、年々発行数が増加している統合報告書などのPDFをテキストデータへと抽出したうえで、研究員がそのデータを用いて研究を行っています。これまで利用していたソフトウェアでは単語レベルでの抽出が中心となり、文章としての抽出が難しいことや、抽出されたデータの文章構造が保持されないなどの問題がありました。今回のAdobe PDF Extract APIの導入により、報告書の文章構造が保持されたままPDFからテキストデータへ自動で抽出することが可能となります。これまで目視での確認が必要だった工程の大幅な削減に繋がり、900の統合報告書のテキストデータ抽出を3日で完了するなど、データ整形に要する時間を削減することで情報分析の効率化が実現します。
Adobe PDF Extract APIの概念図
今回の導入に際し、三菱UFJトラスト投資工学研究所 研究部 開発第2グループ 成富佑輔様から下記のコメントをいただいています。
「三菱UFJトラスト投資工学研究所ではテキスト分析の精度向上と効率化を促進するため、PDFデータに格納された情報を高精度で自動抽出が可能な、Adobe PDF Extract APIを導入しました。当社が企業戦略の立案の際などに参照するレポートの多くがPDFで公開されており、分析にあたってPDFから正確な情報を構造データを損なうことなく抽出することは必要不可欠です。今後も、様々な資料のデータ化と分析を進め、デジタル技術を駆使した金融ソリューションを提供してまいります。」
アドビ株式会社 デジタルメディア事業統括本部 常務執行役員 統括本部長の浅野智は次のように述べています。
「世界トップレベルの金融・投資業務の研究を行う三菱UFJトラスト投資工学研究所にAdobe PDF Extract APIが採用され、業務効率化の一端を担えることを嬉しく思います。ESGといった観点から非財務情報の需要が高まるなど、今後ますますデジタル上で膨大な量のデータを、的確に取り扱うことが必須となっています。本クラウドAPI導入で、スケーラブルなデータ取り込みとAI技術を活用したデータ分析の精度向上といったPDFとデータ領域の可能性を広げる成果をあげられたことは大変素晴らしいことです。アドビはこのような先進的な取り組みの支援を、今後も続けてまいります。」
■Adobe PDF Extract APIについて
Adobe PDF Extract APIは、PDFの構造を分析することができるクラウドAPIです。AIと機械学習プラットフォームであるAdobe Senseiを活用して構造を理解し、PDFに含まれるテキストや表データ、画像といったあらゆる要素を正確に抽出します。また、アドビのAPI群は特定のプラットフォームに依存せず、自然な読み取り順で最新のプログラミング言語やプラットフォームに対応する柔軟性を備えています。本APIを含むAdobe Document Serviceに関する概要はこちらをご覧ください。
■「アドビ」について
アドビは、「世界を動かすデジタル体験を」をミッションとして、3つのクラウドソリューションで、優れた顧客体験を提供できるよう企業・個人のお客様を支援しています。Creative Cloudは、写真、デザイン、ビデオ、web、UXなどのための20以上の デスクトップアプリやモバイルアプリ、サービスを提供しています。Document Cloudでは、デジタル文書の作成、編集、共有、スキャン、署名が簡単にでき、デバイスに関わらず文書のやり取りと共同作業が安全に行えます。Experience Cloudは、コンテンツ管理、パーソナライゼーション、データ分析、コマースに対し、顧客ロイヤルティおよび企業の長期的な成功を推進する優れた顧客体験の提供を支援しています。これら製品、サービスの多くで、アドビの人工知能(AI)と機械学習のプラットフォームであるAdobe Senseiを活用しています。
アドビ株式会社は米Adobe Inc.の日本法人です。日本市場においては、人々の創造性を解放するデジタルトランスフォーメーションを推進するため、「心、おどる、デジタル」というビジョンのもと、心にひびく、社会がつながる、幸せなデジタル社会の実現を目指します。
アドビに関する詳細な情報は、webサイト(https://www.adobe.com/jp/about-adobe.html)をご覧ください。
© 2022 Adobe. All rights reserved. Adobe, Adobe Document Cloud, Adobe PDF Extract API and the Adobe logo are either registered trademarks or trademarks of Adobe in the United States and/or other countries. All other trademarks are the property of their respective owners.