情報技術およびソフトウェア工学ジャーナル

情報技術およびソフトウェア工学ジャーナル
オープンアクセス

ISSN: 2165- 7866

概要

CONDENZA: 与えられたソース文書から要約を抽出するシステム

Mgbeafulike IJ と Christopher Ejiofor

電子形式の文書がますます利用しやすくなり、デスクトップ パブリッシング ソフトウェアが利用できるようになったにもかかわらず、抄録は手作業で作成され続けています。CONDENZA の目的は、特定のソース ドキュメントから抄録を抽出するシステムを開発することです。CONDENZA は、抄録を自動的に取得する方法に関するシステムについて説明します。抄録の目的は、公開された論文のトピックを迅速かつ正確に識別できるようにすることです。その目的は、特定の記事やレポートで有用な情報を見つけるために、見込みのある読者の時間と労力を節約することです。システムは、意味を保持しながら、特定の文の短縮版を生成します。このタスクは、要約技術を使用して実行されます。CONDENZA は、キーワード頻度検出のアプリオリ アルゴリズムと、類似の文をグループ化するクラスタリング ベースのアプローチを組み合わせた方法を実装します。システムの結果は、このアプローチが、文書内の単語間の冗長性を回避することでテキスト文書を効率的に要約し、入力テキストとの関連性を最大限に高めるのに役立つことを示しています。結果の指針となるのは、要約後の入力文と出力文の比率です。

免責事項: この要約は人工知能ツールを使用して翻訳されたものであり、まだレビューまたは検証されていません。
Top