日本語と英語とで独立した処理を行います。これら以外の言語には対応しておりません。 (日本語)文字種の変化を契機とした単語識別を行うものです。 (英語)冠詞、区切り文字、ストップワードを頼りにしたキーワード抽出です。 (日本語・英語)辞書を用いないので、新語、造語にも対応できます。 (日本語)かな交じり語 (漢字1文字+かな で始まる語)も抽出されます。 例 「問い合わせ」「組み合わせ」, ... (日本語・英語)単語のほか、連語(複合語)を取り出すことができます。 例 「データ記憶装置」→「データ」/「記憶装置」/「データ記憶装置」 (日本語・英語)なるべく多くの語を識別・出力しようとするものです。重要語句のみを取り出すものではありません。 (日本語・英語)20,000字程度のテキストデータ(標準的な量の特許明細書)なら瞬時に抽出・集計が完了します。 ■日本語用キーワード抽出 英文に対して