ISSN: 2165- 7866
ウォルキネ・テセマ
この論文では、アファンオロモ語の多義語の意味クラスタリングについて紹介します。この研究の主なアイデアは、意味的に関連する意味を発見する便利な方法を提供しているコンテキストをクラスタリングすることです。ターゲット単語の特定の意味の類似コンテキストは、3 つの階層的クラスタリングと 2 つのパーティション クラスタリングを使用してクラスタリングされます。関連する意味のすべてのコンテキストがクラスタリングに含まれ、コーパス内のすべてのコンテキストに対して実行されます。基本的な仮説は、クラスタリングはコンテキスト間の反映された統一性を捉え、各クラスターはコンテキスト間に存在する可能性のある関係を明らかにするというものです。実験が示すように、合計 5 つのクラスターから、階層的 (単一クラスタリング、完全クラスタリング、平均クラスタリング) よりも大幅に高い精度をもたらす EM クラスターと K-Means クラスターが生成されます。アファンオロモ語の場合、EM と K-Means は階層的クラスタリング アルゴリズムよりも意味クラスタリングの精度を高めます。各クラスターは固有の意味を表します。一部の単語には、5 つの意味に対して 2 つの意味があります。結果が示すように、テスト セットの平均精度は 85.5% で、これは教師なし機械学習の作業としては有望な結果です。このアプローチを使用すると、適切な数のクラスターを見つけることは、感覚の数を見つけることと同等になります。リソース要件が少ないにもかかわらず、達成された結果は有望でした。