Sumasen

Contents

専門用語抽出の仕方

設定画面に入るには検索欄、横の歯車マーク⚙️をクリックしてください。

専門用語の抽出

単語操作カテゴリの中から真ん中の専門用語の抽出ボタンをクリックしてください。

専門用語抽出の画面です。

現在のDBを解析して専門用語抽出エクセルを作成します。

右のようなエクセルがダウンロードできます。

登録したい単語のチェック列に○を記入したあと、エクセルをドラッグ&ドロップすると専門用語として仮登録されます。成功すると自動で本登録画面に飛びます。

3-1_1

また、個別に登録したい単語がある場合に対応するため右のようなエクセルを用意しました。ダウンロード後、登録単語列に登録したい単語の書き込みをしてください。

同じように登録したい単語にチェックを入れたエクセルをここにドラッグ&ドロップします。成功すると自動で本登録画面に飛びます。

単語登録を省略して本登録画面に移りたいときにこのボタンを押して飛びます

専門用語抽出でエクセルアップロードされたもののみを出力しています。

単語登録ページの本登録と機能は同じです。こちらにはアップロードしたエクセルファイルに入力されていた単語を扱います。

単語登録の操作説明は▶️こちら

COLUM

専門用語とは

スマ箋全文検索では、全ての文章及び検索キーワードを辞書に存在する品詞で分解(分ち書き)し、単語単位で合致する部分を検索します。キーワードが分ち書きされた場合には、同一ページの指定単語数(デフォルトで100語以内)内に分ち書きされた単語が存在したら「ヒット」しているとみなします。しかし、連続した単語としてヒットさせたい場合には、"..." で括ってやると、見た目連続した一つの単語としてヒットさせることができます。この場合のデメリットは、連続していなくても、分ち書きされた単語も一緒にマーキングされてしまうことです。また、現在のバージョンでは、検索窓には1セットの "..." 括りしか許されません。

例えば

「コロナ対策」の検索をしたい場合、この単語は「コロナ」と「対策」に分ち書きされます。そのまま検索を続けると、100語以内に「コロナ」と「対策」が出現する部分がヒットします。「"コロナ対策"」とダブルクオーテーションでくくると、「コロナ対策」がヒットしますが、同じページにある「コロナ」と「対策」もマーキングされます。

そこで

頻繁に使用するキーワードである「コロナ対策」を専門用語としてスマ箋辞書に登録すると、「コロナ対策」というキーワードで、分ち書きされずに、「コロナ対策」の部分のみをヒットさせることができます。

専門用語登録を行う2通りの方法

この専門用語登録を行うには2通りの方法があります。一つは、検索履歴から頻繁に検索されるけど、必ず分ち書きされるものから辞書に登録する方法、もう一つは、予め登録された全文書から2つもしくは3つの品詞が並ぶものを多いもの順に並べたリストから選択して登録する方法です。

仕組みを理解して効率的な検索を

前者が「検索履歴」からの「単語登録/削除」であり、後者が「専門用語抽出」にあたります。 仕組みを理解して頂くことでより効率的な検索結果が得られますので、試してみてください。

インデックスの洗い替え

なお、単語登録を検索に反映させるには「インデックスの洗い替え」を行う必要があります。この処理は非常に重い処理になりますので、運用形態などは別途ご相談ください。