シソーラス:それは何ですか。 辞書以上のシソーラス辞書。 辞書のシソーラスをコンパイルするためのThesauriアルゴリズム

サンプル

Syn:モデル、標本、例、サンプル、標準、標準、測定、サンプル、標準、代表的な、テンプレート、ステンシル、プロトタイプ、図面、デザイン、図面、パターン、ゲシュタルト、フレーム

ロシア語のシソーラス。 2012

辞書、百科事典、参考書の解釈、同義語、単語の意味、ロシア語のサンプルとは何かも参照してください。

  • サンプル
    HAFDASA1927-アルゼンチンの22口径の自動拳銃。 軍隊でした...
  • サンプル 武器の図解百科事典:
    実験的-銃器のデザインの単一コピー、シリアルでは受け入れられません...
  • サンプル 武器の図解百科事典:
    MUSHKETA- 1849年から1855年のアメリカのカプセルライフル。 バレル付き58口径。 長さ1016..。
  • サンプル 武器の図解百科事典:
    ライフル-アメリカンカプセルライフル1849-1855 58口径。 長さ838..。
  • サンプル 武器の図解百科事典:
    70-チェコスロバキア自動拳銃、口径7、65..。
  • サンプル 武器の図解百科事典:
    63-9mm口径の15発および25発の短機関銃を磨きます。 バットありの長さ583mm、バットなしの長さ330mm。 重量 …
  • サンプル 武器の図解百科事典:
    61-チェコスロバキアの10発および20発の短機関銃口径7、65mm。 在庫ありの長さ513mm、在庫なしの長さ269mm。 ..。
  • サンプル 武器の図解百科事典:
    58P-チェコスロバキアの7.62mm口径の30発機関銃。 長さ820mm。 重量3140..。
  • サンプル 武器の図解百科事典:
    58 V-チェコスロバキアの7、62mmの30発機関銃。 在庫ありの長さ820mm、在庫なしの長さ635mm。 重量 …
  • サンプル 武器の図解百科事典:
    52 —1。 CHZET-513を参照してください。 2. 7.62mmのチェコスロバキアの10発自動自動装填式カービン銃。 長さ1003mm。 重量4100..。
  • サンプル 武器の図解百科事典:
    50-チェコスロバキア自動拳銃、口径7、62mm。 CHZET-513の縮小コピー。 サービス中だった..。
  • サンプル 武器の図解百科事典:
    25-1。チェコスロバキアの9mm口径の24発および40発の短機関銃。 在庫ありの長さ686mm、在庫なしの長さ445mm。 重量 …
  • サンプル 武器の図解百科事典:
    23-チェコスロバキアの9mm口径の24発および40発の短機関銃。 長さ686mm。 重量3270..。
  • サンプル 武器の図解百科事典:
    16 / 33-チェコスロバキアの5発マガジンカービン銃7、92mm。 バヨネットなしの長さ995mm、バヨネットあり1305mm。 重量 …
  • サンプル
    インダストリアル-インダストリアルモデルを参照してください..。
  • サンプル 経済用語の辞書:
    -広告、展示会、親しみやすさの目的で使用される製品の代表的な単一コピー、潜在的な展示...
  • サンプル 百科事典の辞書:
    、-ztsa、m。1。指標または試用製品。 サンプル(2つの値)。 06土壌サンプル。 鉱物のサンプル。 製品のサンプル。 産業について。 (新着、 ...
  • サンプル 大きなロシアの百科事典の辞書で:
    サンプル産業、産業を参照してください..。
  • サンプル Zaliznyakによる完全なアクセント付きパラダイム:
    サンプル "c、サンプル"、サンプル "、サンプル" in、サンプル "、サンプル" m、サンプル "c、サンプル"、サンプル "m、サンプル" mi、サンプル "、..。
  • サンプル ロシア語の人気のある説明と百科事典の辞書:
    -zts "a、m。1)(通常は何)製品、資料の表示または試用版。 一部の..。 物質、製品、アイデアを与える..。
  • サンプル スキャンワードを解決およびコンパイルするための辞書:
    … にとって …
  • サンプル ロシアのビジネス語彙のシソーラス:
  • サンプル アブラモフの同義語辞書:
    サンプル、プロトタイプ、プロトタイプ、タイプ、プロトタイプ、理想、モデル、オリジナル、例。 モデル。 Prot。 ..。 理想的な例を参照してください...
  • サンプル ロシア語の同義語の辞書で:
    Syn:モデル、標本、例、サンプル、標準、標準、測定、サンプル、標準、典型的な代表、テンプレート、ステンシル、プロトタイプ、図面、デザイン、図面、パターン、...
  • サンプル Efremovaによるロシア語の新しい説明辞書:
    m。1)lの概算、指示、または試用版。 製品、素材など 2)a)指標 smthの例。..。 (どのような品質、行動、..。

特に、ある言語から別の言語に翻訳し、科学的および技術的情報を検索し、自動制御システムで企業の情報モデルを作成するときに、情報処理の機械的方法の開発の結果として現れた新しい基本概念の1つは、情報システムシソーラスの概念でした。 「シソーラス」という用語は、外界に関する一連の知識を意味します。これは、いわゆる世界Tのシソーラスです。自然言語を使用して表現された外界のすべての概念は、シソーラスを構成し、そこからプライベートシソーラスを区別できます。個々の概念の従属を考慮に入れて、または世界の一般的なシソーラスの部分を分離することによって、階層的な分割によって。 情報検索システムのシソーラスは、検索において重要な役割を果たします 必要な書類キーワードで。 したがって、シソーラスの構築は困難で重要な作業です。 ただし、このタスクは自動化することもできます。

最も一般的な定義での分類は、セットの分割と順序付けです。 これは、これらの現象に固有の共通の特徴に基づいてオブジェクトをクラスに分散し、他のクラスを構成するオブジェクトや現象と区別することと呼ばれます。 各クラスは、必要に応じて細分化できます。 ルブリケーターは特別な種類の分類です。 したがって、それらは一般規定に基づいて作成されます。
分類を構築するための科学的根拠。
科学の現在の発展レベルの反映。
リンクと参照のシステム、および参照と参照装置(CCA)の可用性。

ただし、ルブリケーターは、情報の流れと専門家のニーズに基づいた実用的な分類です。 これは、UDCやIPCなどの先験的な分類との違いです。

分類、特にルブリケーターの主な機能は次のとおりです。
情報サブシステムの主題による区切り。
任意の基準による情報配列の形成。
情報資料および出版物の体系化。
現在および遡及的な検索。
ドキュメントとクエリのインデックス作成。
他の分類スキームとの関係。
規範的関数。

それらは概念を分割することによって構築されます-特定の論理的原則に従ってこれらのオブジェクトの属性間の確立された関係に基づいて分類のオブジェクト。 分類が行われる基準は、分類の分割の基礎と呼ばれます。 分類では、演繹と帰納の方法は、グループ、クラスを修正し、それらの間の接続を識別するために広く使用されています。 これは、階層的な分類では一般的です。 分類の深さ(階層内のレベルの数)は、目的によって異なる場合があります。 広く使用されているルーブリックの1つは、科学技術情報の州のルーブリック(SRSTI)です。

GRNTIルブリケーターは可能なように設計されています 共有 UDCやIPCなどの他の分類で。 国際十進分類法(UDC)は70年以上前から存在していますが、配布の幅はまだ同じではなく、世界の多くの国で使用されています。 UDCは知識の世界全体をカバーし、体系化とその後のさまざまな情報ソースの検索に使用されています。

UDCに加えて、図書館と書誌分類(LBC)が実際に広く使用されています。 LBCは論理的従属の原則に基づいて構築されており、適用されるタイプ分類を表します。
V ロシア連邦発明の分類および発明の説明の国内コレクションの体系化には、国際特許分類が使用されます。これは、機能およびセクターの原則に従って構築された、かなり複雑な多次元分類です。 同じ技術的概念は、IPCまたは特別クラス(業界による)または機能クラス(動作原理による)に見られます。 概念の配布の分岐原理には、特定の歴史的に確立された技術および技術の分岐におけるアプリケーションに応じたオブジェクトの分類が含まれます。

ルブリケーターGRNTI、UDC、LBC、IPCの特性の比較を表1に示します。

表1
ルブリケーターGRNTI、UDC、BBK、MPKの特徴

名前

構造

部門の配置の原則

パーティションスキーム

階層的

業界

一般的なものから具体的なものへ

階層的

テーマ別

階層的

機能と産業

一般的なものから具体的なものへ

科学図書館のためのLBC

階層的

業界

一般的なものから特定のものまで、種ごとに


したがって、メイン 特徴的な機能 rubricatorsとclassifiers:
それらは、適用された性質とセクターの焦点によって特徴付けられます。
これらは、科学技術の発展、専門家のニーズと要求に依存するオープンシステムです。
無機システム。オブジェクトが環境内で発生および発達し、そこからオブジェクトに侵入します。 要素は、システムの外部に独立して存在できます。 この機能は、2番目の機能と密接に関連しています。
最小要素は、環境に関連する概念です。 この概念は、定義のシステムを表しています。
概念の間には、垂直方向(属種、全体)と水平方向(タイプ種、部分部分)の両方で接続があり、システムの階層を示します。

その結果、分類とルーブリックを編成する構造と原則により、演繹法を使用してサブジェクトエリアシソーラスを構築するプロセスを自動化することが可能になります。 演繹法を用いてシソーラスを構築するためのアルゴリズムを図1に示します。 1.1。

シソーラスの形成の基礎は、オペレーターによって記入された、情報検索のための文書、タスク、またはアプリケーションの検索画像です。 したがって、最初のステップは、アプリケーションを調査および分析することです。 最初の段階で、演算子は関心のあるトピックまたは問題、考えられるキーワード、およびそれらの同義語を示します。 その結果、私たちは主題分野の表面的な理解を得ることができます。

米。 1.演繹法を使用してシソーラスを構築するためのアルゴリズム

さらに、KSキーワードのシソーラスは、演繹法を使用して形成されます。これには、次のものが必要です。
図1でMPとして指定されている、ユーザー自身が設定するKSアレイ。
検索タスクから抽出されたKSの配列、それぞれMZ。

ただし、主題領域をより完全かつ詳細に理解するために、既存のルブリケーターと分類スキーム(GRNTI、UDC、LBC、MPK)を使用します。 サブジェクトエリアのカバレッジを最大化するには、利用可能なすべてのものを表示する必要があります。 ルブリケーター配列はMRを表します。 控除検索アルゴリズムは、次の2つのステップで構成されます。
1.一般的な概念を見つける(図2)。
2.一般的な概念内で特定の用語を見つける(図3)。


米。 2.一般的な概念の処理

アレイから最初のルブリケーターをロードし、ユーザーが入力したルブリケーター内のKSの存在を確認するためのサイクルを編成します。 各KSは見出しリストで検索され、一般的な概念または「ネスト」と比較されてから、条件がチェックされます。特定の用語への参照があります。 そのような参照がある場合、KSは種の用語と比較されます。 リンクが見つからない場合は、次の一般的な概念に進みます。 オペレーターが入力したキーワードKSを表示すると、タスクから抽出されたKSの配列に移動します。 検証手順も同様です。一般的な概念に対応するCOPを探し、次に特定の用語へのリンクを探します。


米。 3.種の用語の処理

それぞれの一般的な概念の中で、問題領域を最大限に理解するために、利用可能なすべての種の用語を確認することが重要であることに注意してください。 これらのアクションの結果、KSキーワードの配列が形成されます。これは、情報を検索するタスクまたはドキュメントの検索画像に対応する完全なシソーラスです。

ドキュメントの検索画像の完全なセット(denote)に基づいて、ブランチシソーラスとライブラリの統合分類子を作成することができます。 明らかに、完全なセット自体が最も単純なシソーラスを表しています。

ただし、選択基準を使用する
, (1)
業界固有のシソーラスを構築できます。 同時に、すべての業界固有のシソーラスのセットが完全なシソーラスを形成します
, (2)
そのセクションは、主要な分類子(GRNTI、UDC、BBK、MPK)または内部の単一の分類子に従ってGOSTの要件に従って階層的に構造化できます。

シソーラスと分類を構築するプロセスの自動化により、分散型で作業するオペレーターの作業を最大限に促進することが可能になります 情報リソース.

文書検索画像に基づいてシソーラスを構築することに加えて、提案されたアプローチは、自動文書要約およびテキストクラスタリングに使用することができます。

文書の参照は、インターネットから受け取った文書の価値について経営上の決定を下すために必要な信頼できる情報を専門家に提供することを目的としたタスクの1つです。 参照は、要約の準備で終わるドキュメンタリー情報を変換するプロセスであり、要約は、経済的な記号のフォーマット、言語の不変性、および 構造的特徴科学的コミュニケーションのシステムでさまざまな情報通信機能を実行するように設計されています。 文書を要約するためのアルゴリズムを図1に示します。 4.4。


米。 4.ドキュメントを要約するためのアルゴリズム

一般に、アルゴリズムには次の主要な段階が含まれます。
1.インターネットからアップロードされ、データストレージにあるドキュメントからの文の選択は、句読点を強調表示して配列に保存することによって行われます。
2.各文は区切り文字で区切って単語に分割し、配列に保存します。配列は文ごとに異なります。
3.各文について、この文の各単語について、他の文の単語数を数えます(前後)。 各単語(前後)の繰り返しの合計が、指定された文の重みになります。
4.最大の重み係数を持つ指定された数の文を、テキストに表示される順序で要約から選択します。

情報システムのシソーラスおよび主題カタログを構築するために提案されたモデルは、意味検索を自動化するための理論的基礎であり、専門家が検索作業を実行するだけでなく、自動モードで、結果として得られた文書を抽象化することを可能にします。インターネット上の分散情報システムで検索します。

文学:
1. Barushkova R.I. 科学的および技術的情報の分類スキーム。 教科書。 手当。 -M。、1981 .-- 80年代。
2. Barushkova R.I. 科学的および技術的情報の分類スキームとしてのルブリケーター。 ツールキット。 -M。、1980 .-- 38p。
3. Trusov A.V.、Babarykin E.P. 分散型情報システムにおける主題情報要求の領域の境界の評価。 全ロシア(国際参加)会議「情報、イノベーション、投資」の資料、2004年11月24〜25日、Perm / Perm Center for Science andTechnology。 -パーマ、2004年。-P.76-79。
4. Yatsko V.A. 科学的テキストの分析と抽象化の論理的および言語学的問題。 -アバカン:ハカス州の出版社。 大学、1996 .-- 128p。

コンピューティングテクノロジー

2007年第12巻、特集2

百科事典の主題索引に基づいて主題領域のシソーラスを作成するための技術

V.B.バラクニン

計算技術研究所SBRAS、ノボシビルスク、ロシア

Eメール: [メール保護]

V.A.ネカエバノボシビルスク 州立大学、ロシアの電子メール: [メール保護]

この作品は、専門百科事典の主題見出しに基づいたオブジェクトドメインシソーラスを作成するための技術について説明しています。 このようなテクノロジーは、信頼できる用語を使用してオブジェクトドメインの高品質な記述を提供するため、この特定の知識分野の専門家の関与を最小限に抑えて、シソーラスの第1段階を構築できます。 提案されたテクノロジーには、シソーラス構築アルゴリズムと、このアルゴリズムを実装するWebベースのアプリケーションも含まれています。

序章

統合研究プロジェクトの実施を成功させるための最も重要な要素の1つは、効果的な科学的および情報的サポートです。 特に、いくつかの(さらに、常に関連しているわけではない)専門分野の研究者の共同作業では、同じ概念を異なる科学分野で異なる用語、および1つの用語(異なる概念)で表すことができるため、使用する用語を注意深く調整する必要があります。

別の課題 情報サポートプロジェクト-プロジェクトの主題に関する文書(すなわち、記事、本など)の書誌的記述の統合カードインデックスの作成。それぞれが特定のカードインデックスをすでに蓄積している共同研究者のリソースを組み合わせて編集されます。長年にわたるトピック(現在、このようなカードインデックスは、原則として電子メディアに保存されています)。 カードインデックスでの検索を容易にするために、ドキュメントを特徴付けるキーワードは、可能な限り、単一の辞書から選択されることが望ましい。 カードインデックスに含まれる、または電子データベースからカードに入力される可能性のあるドキュメントの自動分類用

©計算技術研究所、シベリア支部 ロシアアカデミー科学、2007年。

抄録誌のデータベースや「現在の内容」などの科学出版物では、座標索引付けアルゴリズムを使用するのが適切と思われます。 このアルゴリズムは、特定の主題分野を特徴付けるテキストに含まれる用語(単語やフレーズ)の分類機能を考慮に入れることに基づいています。

上記のすべてのタスクの解決は、サブジェクト領域の用語の辞書を作成しないと不可能です。この辞書では、用語間の接続を確立し、用語の分類を実行する必要があります。 このような辞書はシソーラスと呼ばれます(詳細はを参照)。 シソーラス(または標準シソーラス)は、情報検索言語のすべての字句単位を含む参照辞書です-記述子(この情報検索システム内でこれらの記述子の同義語と見なされるキーワードとともに)、辞書内の記述子は体系化する必要があります感覚に応じて、それらの間の意味的なつながりが明示的に表現されます。

ただし、シソーラスの編集は「 白紙の状態「専門家の非常に重要な労働力の投入が必要になる場合があります。専門家は、主題分野を十分にカバーするすべての用語を収集し、それらの意味に同意し、接続を確立し、分類を実行する必要があります。その解決策の見通しに悪影響を及ぼします。

専門百科事典の主題索引に基づいてシソーラスを作成する技術を開発し、実装しました。 このテクノロジーは、信頼性の高い検証済みの用語を使用して、サブジェクト領域の高度な説明を提供します。 第一段階専門家(特定の分野の専門家)の関与を最小限に抑えてシソーラスを構築する。 アルゴリズムの詳細な説明と正当化は、作業で与えられます。 以下は、アルゴリズムとそれを実装するWebアプリケーションの簡単な説明です。

1.シソーラスを作成するためのアルゴリズム

シソーラスのキーワードとフレーズのリストとして、専門の百科事典(またはいくつかの百科事典)の主題索引を使用することが提案されています。 特定の百科事典の選択は主題の専門家によって行われ、この選択はシソーラスを作成するときに追求される目標によって異なります。 したがって、複雑な環境問題を解決するには、物理​​学、化学、地質学、生物学、医学、数学などの百科事典(または、それらがない場合は百科事典の辞書)を使用することをお勧めします。キーワード。必要に応じて補充されます。

ほとんどの百科事典の主題索引は、同様の方法で構成されています。百科事典の記事の名前である用語、記事で定義されている用語、および記事で言及されている最も重要な結果が含まれています。

百科事典の記事の名前は記述子(つまり、類似した概念のクラスの名前である用語)として扱われ、対応する主題索引からの単語が見つかります

記事。 この方法の主な利点は、用語間の関係のタイプを確立するために、特定の主題分野の専門家である必要がないことです-一般的な知識は百科事典のテキストを理解するのに十分です-の過程で必要なより具体的な情報分類の概念は、特定の記事からいつでも収集できます...

作成されたシソーラスはZ39.50プロトコルを使用して機能するように設計されているため、リンクのタイプは、次のタイプを区別する/ lliesスキームの推奨事項に従って確立されます。

BT-親の用語、つまりより広い意味の用語との関係。

NTは、子用語、つまり、より狭い意味の用語とのリンクです。 BTとNTの関係は相互関係にあります。

USEは、代わりに使用される用語へのリンクです。

UF-相互フィードバックを使用します。

RTは、関連する用語を定義するリンクです。

LE-言語的に同等の用語間の関係。

FEは完全に同一の用語です。

さらに、記述子の分類は、この主題領域のセクションに従って実行されます。 特定の分類器の選択、および百科事典の選択は専門家によって行われ、異なる主題分野からの複数の百科事典を使用する場合、いくつかの特殊な分類器を使用することが可能です。 NT、RT、LE(FE)の形式の関係は、記述子と分類子セクションの間で確立されますが、分類では、可能であれば、可能な限り低いレベルのセクションを使用する必要があります。

その後、BT、USE、RT、LE、およびFEの関係によって記述子に関連付けられたキーワードには、記述子と同じ分類番号が割り当てられます。 ただし、これは、記述子が最低レベルではないクラスに割り当てられている場合、専門家のその後の作業で、BTおよびUSE関係によって記述子に関連付けられた用語をクラスに割り当てることができるという状況を排除するものではありません。より低いレベルの。 この場合、指定された用語自体が記述子になります。

その結果、主題索引に含まれるすべての用語は、この主題分野のセクションに従って分類されます。

2.Webアプリケーション操作の説明

それにもかかわらず、この方法論に従ってシソーラスを構築するプロセスは、大量の日常的な作業を伴い、さらに、プログラミングスキルを持つ人の参加を必要とします。 そのため、方法論に加えて、ユーザーフレンドリーなインターフェイスを備え、次の機能をサポートするWebアプリケーションが開発されました。

1)主題索引のデジタル化されたページからデータベーステーブルへの情報の自動翻訳。

2)用語の一般的なリストで記述子を強調表示します。

3)特定の記述子に関連付けられている用語を検索し、Zthesスキーマに従ってリンクのタイプを設定します。

上記のすべての操作を完了するためにプログラミングスキルは必要ないことに注意することが重要です。

開発されたアプリケーションは普遍的です。 さまざまな主題分野のサウリを作成するために使用できます。 現在、プログラマーは、ある百科事典の主題索引から別の百科事典の主題索引へのプログラムの再構成を実行しています(ただし、この段階でのみ、異なる主題領域のシソーラスを構築するプロセスが異なる可能性があります)。ユーザーがこの操作を実行できるようにする機能でプログラムを補足するために進行中です。 プログラミングスキルがない。

アプリケーションは次のように機能します。 デジタル化されたインデックスページは自動的に処理されます。 ユーザーは、データを含むテキストファイルの場所を指定します。その後、テキストファイルが1行ずつ読み取られ、用語自体がデータベースに入力されます。また、それらが配置されている百科事典のページ数に関する情報も入力されます(図。1)。

キーワードの一般的なリストから記述子がユーザー自身によって選択され、画面に表示されるリストに検索語がマークされます。 \¥ob-appopioは修正機能もサポートしています 考えられる間違い(図2)。 百科事典の記事にあるすべての用語は、この記述子に関連付けられていると見なされることを思い出してください。

関連する用語の検索を容易にするために、ユーザーには、選択した記述子と同じページにあるキーワードのリストのみが表示されます(実際、このために、データベースに用語のみを入力し、ページのポモールに関する情報を入力しました)。 もちろん、記事がページ全体を占めるとは限らないため、不要な用語がリストに含まれます。 ユーザーは、接続を確立することにより、

米。 1.エントリー テキストファイルインデックスからの用語で

№記述子辞書の作成-MicrosoftInternet Explorer!

ファイル編集ビューお気に入りサービスヘルプ

Q戻る "©" @ |í| &uR検索^お気に入り-。 v

住所; |¡J§http:^ localhost / math_dict / Deskj-_Slovar / Descr / gen_ss.phtml; V¡¿3遷移リンクy>

fiBárJOQQ-©-I * 1] 0 l de:*-F

1そろばん| 1、13 1111111

2アーベルオートマトン| 1、67 1111111

3アーベル群対象| 1、1149 111 1 | |

4アーベル微分11.13-15I 2、240 111111

5アーベル微分、基底| 1、13 1111111

6アーベル微分、除数| 1、15 | | | | | 1 |

7アーベル微分法線| 1、14 1111111

8アーベル微分、正規化| 1、14 1111111

9アーベル微分、極周期| 1、14 | | | | | | |

10アーベル微分、周期周期| 1、14 1111111

11アーベルべき等14、941 1111111

12アーベル積分11.15-171111111

13アーベル積分、アーベルの定理| 1、17 1111111

14アーベル積分正準| 1.16 ||||||

16アーベル積分、周期行列| 1.16 ||||||

15アーベル積分法線| 1、16 |||||||

17アーベル積分、極周期| 1.16 ||||||| 1Sアーベル積分、周期周期| 1、16 | | | | |

19アーベルポテンシャル| 2、239 1111111

20Abelevグループ11.17-201111111

21完全に分解可能なアーベル群| 1.19 ||||||

22分割可能なアーベル群| 1、19 |||||||

23有限生成アーベル群| 1.18 1111111

24アーベル群、クリコフ基準| 1、18 | | | | | |

25アーベル群、ゼロ| 3.1082 1111111

26アーベル群、周期部| 1、18 111 | |

http:// locdlhostymath_dict / Deskr_Slovar / Descr / goto、phtml?ss 1 + 4 + 1 + A + 1 + 3

j 5tartApache.bat

I Svoj.NET:PHP編集

J Adob​​e Photoshop || w

^ローカルイントラネット

EN Sch / m K 21:0;

米。 2.キーワードのリストとハイライト記述子

米。 3.関連用語の選択

米。 4.接続のタイプを確立します。

提案されたリストからキーワードの一部のみを選択しますが、そのような自動化により、日常業務の量が大幅に削減されます(図3)。

記述子とキーワードの関係の詳細は、適切なフォームに記入することで指定されます(図4)。

結論

このアルゴリズムとWebアプリケーションの操作性は、「数学」サブジェクト領域のいくつかのセクション(「微分方程式」、「偏微分方程式」、「数値解析」、「流体力学」など)のシソーラスを作成することによってテストされました。 。)主題索引「数学百科事典」に基づく。 用語の分類とそれらの間のリンクの確立には、学士号の資格で十分であることが確立されています(まれに、科学的な学位を持つ専門家が相談に参加する場合)。 これは、開発されたアルゴリズムの高効率を証明しています。

参考文献

Mikhailov A.I.、Chernyi A.I.、Gilyarevsky P.C. 情報学の基礎。 モスクワ:ナウカ、1968年。

バラクニンV.B. 主題分野「数学」のシソーラスの開発// Mater、conf。 「コンピューティングと 情報技術科学、技術および教育における」。パート1。ノボシビルスク;アルマトイ; Ust-Kamenogorsk、2003年。S.111-115。

Zthes:シソーラスナビゲーション用のZ39.50プロファイル

http://lcweb.loe.gov/z3950/agency/profiles/zthes-04.html

3.1。 シソーラスの概念

シソーラス(ギリシャ語のθήσαϋροξから-宝物、予備)またはイデオグラフィック辞書(ギリシャ語のアイデアから-概念、表現、アイデア、グラフォ-私が書いたり、説明したり)-現代の言語学:1)一般的または特別な特別な種類の辞書語彙アイテム間の意味関係が含まれる語彙。 2)他の単語との意味的なつながりによって単語を検索するための辞書。 3)辞書内の単語を整理(配置)する特定の方法。 4)字句構成を整理する方法。これにより、経済的に「世界をモデル化」することができます。

最初の、原始的な意味-リポジトリ、宝物、シソーラスという用語はL.V.によって使用されました。 記事「一般的な辞書編集の経験」のShcherba(3番目の反対:シソーラスは通常の(説明的または翻訳された)辞書です)。 科学者は次のように書いています。「彼らがシソーラスと言うとき、今日ではほとんどの場合、5つのドイツのアカデミーの企業である「Thesauruslinguae latinae」を意味し、1900年に始まり、まだ文字Mだけが省略されています。 顕著な特徴このタイプの辞書は、特定の言語で少なくとも1回出現したすべての決定的な単語が含まれ、各単語の下に特定の言語で使用可能なテキストからのすべての引用が決定的に含まれているという事実にあります。 上記の反対-シソーラス-通常の(説明または翻訳)辞書-は、「言語資料」と「言語システム」の反対に基づいています-私の記事「言語現象の3つの側面と言語学の実験について」

この用語の2番目の意味は、広く知られている辞書であるシソーラス「シソーラス」に関連しています。 英単語と表現「午後 ロジェ(ロジェの英語の単語とフレーズのシソーラス、1852年)とその続き、OVバラノフの辞書。

この解釈では、シソーラスという用語は、辞書内の字句構成を整理、配置する特定の方法を示します(用語の3番目の意味を参照)。

シソーラスという用語の4番目の意味は、語彙構成を編成するそのような方法の一般的な認識に関連しており、経済的に「世界をモデル化」することを可能にします。 この観点から、シソーラス辞書は「科学的または技術的分野の語彙の体系的な順序付けであり、最も一般的な形式では、一般的な文芸語彙、さらには特定の言語の語彙全体」です。

Yu.Nによると 一般的な言語のシソーラスであるカラウロフは、その見出し、セクション、ゾーン、領域の構造と関係を固定し、アイデアの非言語的接続の幅広い可能性を固定し、人間の価値観が考慮されることを保証します。

NS。 バラノフとD.O. 序文「編集者から」から彼の「辞書-現代ロシアのイディオムのシソーラス」のドブロボルスキーは、シソーラスに次の定義を与えています- 特別な種類言語資料の編成方法が他の辞書(特に、説明、バイリンガルなど)と異なる辞書。 シソーラスでは、言語単位は通常の辞書のようにアルファベット順に表示されませんが、その意味に基づいてグループ化されます。

L.P. Krysinは、シソーラス(表意文字辞書)を特別な種類の説明辞書、「逆に」辞書と呼んでいます。 「説明辞書で科学者が書いた場合、辞書エントリへの「入り口」は単語であり、辞書エントリの内容はこの単語の意味の解釈であり、イデオグラフィック辞書では「入力」は意味、アイデア(したがって、このタイプの辞書の名前-イデオグラフィック)、および辞書エントリの内容は、指定された意味を表す単語のリストです。 また、説明辞書がテキストを理解するための不可欠なツールである場合、テキストを生成するときに表意文字辞書を使用できます。特定の考えを表現したいが、これに適した単語を見つけられないことがよくあります。 表意文字辞書を使用すると、これらの検索が簡単になります。 シソーラスには主に2つのタイプがあります。

言語シソーラス-テキストの意味のある分析の結果として選択され、採用された分類システムに従って体系化された自然言語の単語のリストを含む辞書。

統計シソーラスは、特定のトピックに関するテキストの統計分析の結果として選択され、同じテキスト内でこれらの単語が同時に出現する頻度に基づいて辞書エントリにグループ化された単語のリストを含む情報検索辞書です。

情報検索シソーラス(IPT)は、自動処理中の情報の検索を容易にします。 IPTは、語彙ユニット間の意味関係を最大限に明らかにします。 IPTの州標準で述べられているように、「単言語情報検索シソーラスは、1つの自然言語の語彙に基づいて制御され、変化する語彙単位の辞書であり、語彙単位間の意味関係を表示し、情報処理と検索を目的としています」。

IPTの基本単位は記述子用語です。 IPTのアルファベットの語彙意味部分は、記述子エントリのコレクションです。

説明辞書は、特定の領域の語彙の完全な説明と、そこでのすべての使用法を修正することを目的としています。 利用可能なすべての関連ケースを記録します。 記述辞書の典型的な例は、V.I。による「生きている偉大なロシア語の説明辞書」です。 ダール(4巻の初版は1863-1866年に出版されました)。 その作成者の目標は、言語を標準化することではなく、方言形式の土語を含む、さまざまな偉大なロシア語のスピーチを完全に説明することでした。

各記述子辞書エントリは記述子で始まります。この記述子の同義語、および一般的または連想関係によってメイン記述子に関連付けられている他の語彙単位は、GOSTの記事内で以下に示されています。

したがって、特にシソーラス 電子フォーマットは、個々の主題分野を説明するための最も効果的なツールの1つです。

純粋なシソーラスはまれです。 実際のシソーラスでは、最初のアイデアが単純化されるか、追加情報が追加されますが、ユーザーにとって必要になる可能性があります。 今日最も有名なのは、Yu.Nによる「ロシア語意味辞書」です。 Karaulova、「同一名の辞書」N.Yu. Shvedova、L.G。による「ロシア語の主題辞書」 Smekhovaなど。

概要。 シソーラスL.V. Shcherbaは、辞書に関連してそれを使用しました。辞書は、可能な場合は常に、特定の単語が出現するすべてのコンテキストを記録しました。 シソーラスの特徴は、特定の言語で少なくとも1回出現したすべての単語が含まれ、各単語の下に特定の言語で使用可能なテキストからの引用がすべて含まれていることです。 シソーラス辞書の内容は言語資料であり、通常の辞書の内容は言語資料と言語システム(L.V.Shcherbaの用語)です。

この特性は、あらゆる種類のクロスリンクによって補完されます。多くの場合、パラダイム(同義または反論)であり、意味の共通性または反対を示しま​​す。 また、様々な連想。 リンク(つまり、構文リンク)。

したがって、シソーラス(表意文字辞書)のタスクは、主要なセマンティックフィールド、それらの内部構造、および外部接続を示す、言語資料の特定のスライスのセマンティック構成のアイデアを提供することです。 シソーラスは、言語の体系的な性質を明確に示しており、個々の言語単位と単位のグループを接続するさまざまなタイプの関係を確認できます。

3.2。 シソーラスの形で世界についての概念的知識の提示の歴史

それらの意味の類似性、隣接性、類似性によって単語を配置する必要性は、人間の思考の観察可能な歴史を通して感じられました。

世界についての概念的な知識をシソーラスの形で表現するという考えの起源をたどるために、私たちはシソーラス(表意文字辞書)の編集の歴史を参照することによって助けられます。

したがって、文明の黎明期に、人々が表意文字と記号の助けを借りてのみ書面で自分の考えを表現できるとき、唯一可能な辞書は、おそらく単語が主題グループに配置された辞書でした。 当時の辞書編集者にとって、実際に存在する関係を除いて、単語の分類に関する別の基準を見つけることは単純に困難でした。

残念ながら、表意文字を使用した人々が実際にそのような辞書を自由に使えるかどうかについての証拠はありません。 私たちに知られている表意文字分類の最も古い試みの中には、ギリシャ語文法のAttikai Lexeisと呼ばれ、ビザンチウムのアレクサンドリア図書館の館長(紀元前180年に亡くなりました)があります。

2世紀に。 NS。 NS。 辞書編集者であり、エジプトの都市ナヴクラティス出身のソフィスト、ユリウス・ポルックス(本名ポリデヴクス)がギリシャ語の資料を編集した主要な作品「オノマスティコン」が登場します。 Y. Polluxはいくつかの作品を書きましたが、私たちに残っているのは「Onomasticon」だけです(Pollux Y.Onomasticon。M。、1956)。


オノマスティコンは10冊の本で構成されています。 本は本質的に別個の論文であり、特定のトピックに関連する最も重要な単語が含まれています。 したがって、最初の本は神と王について語っています。 第二に-人々、彼らの生活と生理学的構造について。 第三に-親族と 政軍関係など。辞書の単語には簡単な説明が付いています。 現代では、辞書は1502年にヴェネツィアで最初に出版されました。

2世紀から3世紀の間 NS。 NS。 素晴らしいサンスクリット語辞書「アマラコーシャ」(アマラコーシャ、パリ、1​​839年)が出版されました。 その作者は、「ヴィクラマディティヤの王位を飾る9つの真珠の1つ」と呼ばれた、古代インドの詩人、文法、辞書編集者のアマラシーナです。 ロシア語に翻訳されたアマラコーシャは、アマールの宝庫を意味します。 辞書には1万語が含まれています。 単語の意味の解釈をよりよく覚えるために、辞書のエントリは詩の形で作成されます。 辞書のすべての資料は3冊の本に分かれています。 各本にはいくつかの章があり、その章は、必要に応じて、いくつかのセクションに分かれています。 最初の本は、空、神々、そしてそれらに直接関係するすべてのものに捧げられています。 2冊目の本には、地球、集落、植物、動物、人間に関連する言葉が含まれています(最初に人間は生き物と見なされ、次に社会的存在と見なされます;現代社会のカースト構造全体が私たちの目の前に現れます;司祭、神の親友は一番上にあり、下は軍隊と王であり、下は地主であり、一番下は職人、ジャグラー、使用人などです。 3冊目の本は、その6つの章のタイトルから明らかなように、実際には言語学的です。

この辞書は、1798年に最初の部分がローマで出版された18世紀の終わりにのみヨーロッパの学者に知られるようになりました。 それは1808年に英語のサンスクリトロジストG.T.によって英語への翻訳とともに完全に出版されました。 コールブルック。 1839年、A.L。による彼のフランス語訳 Delonshan(A.L。Deslongchamps) さらなる開発いわゆる世界言語の問題に関連する語彙の意味分類のアイデア。

概要。 これは、最も一般的な用語では、語彙の表意文字分類の伝統の発展の最初の段階です。 この段階は、表意文字辞書の先史時代と呼ぶことができます。 ここで、シソーラス辞書の最新の分類に目を向けることをお勧めします。

説明されている作品がアルファベットの辞書とどのように異なっているかは簡単にわかります。 アルファベット辞書で単語の提示がアルファベットのような条件付きで非常に中立的な手段によって規制されている場合、表意文字辞書の構築では、辞書編集者自身の世界観が決定的な重要性を獲得します。

3.3。 シソーラス辞書の分類の原則

すでに上に示したように、シソーラスの分類を編集する問題は新しいものではなく、数十年の間、多くの国内外の言語学者(K. Marello、V.V。Morkovkin、L.P。Stupin、V.V。Dubichinskyなど)の注目を集めてきました。 この分野での研究の結果は、これらの辞書式順序の作品の代替分類の作成でした。 最新の分類の1つは、次の基準に基づいています。a)語彙単位間の意味接続のタイプ。 2)語彙の量。 3)一般化された語彙。 4)語彙素の意味の開発; 5)語彙素の文法的および文体的資格。 6)語彙素の機能のデモンストレーション。 7)表現されている言語の数; 8)語彙素の意味論化に使用される記号論的手段のタイプ。 名前付き分類は、O.M。によって以前に作成された分類に基づいています。 Karpova and I. Burkhanov(Burchanov I.字句的意味の文体的および実用的に関連する側面の表意文字記述について。ロンドン、1996年); 分類に使用される用語は、辞書式順序に導入されます


V.V. モルコフキン、Yu.N。 カラウロフ、K。マレロ。 分類基準はO.M. Karpova。 同時に、K。マレロは3種類のシソーラスを区別しています。

累積。意味を定義せずに単語をグループ化したものです。

決定的で、単語グループの各語彙単位を解釈します。

旅行者のためのバイリンガルおよびマルチリンガルのthesauri(Marello C. Thesaurus // W.D.D. 1990. V. 2. P.1083)。

累積シソーラスは、特定のセマンティックフィールドにある状況で、より理解しやすく、正確で、スタイル的に正しい単語を見つける機会を提供するだけでなく、テーマ別のコンピューターデータバンクの形成の基礎にもなります。

決定的なシソーラスには、意味の定義とともに、このタイプのシソーラスの直接的な百科事典的な方向性を示す、語源情報と文学作品からの引用を含めることができます。 さらに、このタイプの辞書は、ユーザーに必要な概念のシステムを紹介し、概念の本質、類似点と相違点、それらのパラダイム的および統語的接続を説明し、発音、文法、造語、およびその他の語彙の可能性に関する情報を提供することがありますこれらの概念を示す単位。

旅行者向けのバイリンガルおよび多言語のシソーラスは、通常、テーマのセクション(番号、食べ物、交通機関、ホテルなど)に従って作成されます。 2つ以上の言語に相当するものの翻訳を伴う。

既存のシソーラス辞書のタイプを最も完全に表示するために、マルチレベルの分類が作成されます。 まず、語彙の単位間の意味接続のタイプに応じて、シソーラスは3つの大きなクラスに分けられます。

1.連想シソーラス(Yu.N. Karaulovの用語

2.同様のシソーラス(V.V.Morkovkinの用語

3.表意文字(イデオロギー)シソーラス(L.V. Scherba、V.V。Morkovkinの用語。名前の付いた3種類のシソーラスは、それぞれ次の種類の語彙素の意味接続を反映しています。

1.意味と構文の関係、これに基づいて
単語はグループまたはペアに結合され、意味と構文の二重結合によってその起源と存在が事前に決定されます。 単語の意味的なつながりは、主に、文の中で述語機能を実行する動詞と形容詞、および名詞の間で確立されます。たとえば、次のようになります。

a)アクションとそれが実行されるオルガン(楽器)の間:つかむ-手、見る-目、泳ぐ-ボートなど。

b)1つの主語を必要とする行動の動詞と主語の間:樹皮-犬、隣人-馬など。 c)動詞と特定の文法的追加の間。前者は、木を切る、食べ物を食べるなどを必要とします。

したがって、連想シソーラスは辞書シソーラスであり、それらの間に存在する意味的および構文的接続に基づいて語彙単位を編成し、単語の中心のグラフィック形式に従ってグループを配置します。

2.語彙的および意味的接続。 このタイプの接続を持つグループへの統合は、単語の主な属性である語彙の意味に従って行われます。 これは、単語の個々の意味が実現される形での語彙文法リンクも考慮に入れます。

したがって、類似のシソーラスは辞書式の参考書であり、そのマクロ構造の基本単位は語彙意味論グループです。 グループは、セマンティックドミナントのアルファベット順に体系化されています。

3.主題または主題のつながり。単語によって示されるオブジェクトとプロセスの機能の類似性または共通性のために、単語が1つのグループに結合されます。オブジェクト
家庭用品、体の部分、衣類の種類、建物など。

したがって、表意文字シソーラスは、主題(主題)グループ内の語彙単位を表し、世界に関する概念化された知識を表すように設計された階層構造にそれらを編成する辞書式作業です。

同じ基準の枠組みの中で、タイプのさらなる細分化を実行します。 したがって、表意文字シソーラスは次の4つのタイプで表されます。


表意文字のシソーラス自体。

テーマ別辞書。

体系的な辞書。

件名-体系的な辞書


表意文字シソーラス自体は特殊なタイプの表意文字語彙であり、そのマクロ構造は、言語の語彙構成に重ねられた先験的な総観マップに従って編成されています。 他のタイプの表意文字の語彙とは異なり、表意文字のシソーラス自体は、一般的な語彙が辞書式の記述の対象であっても、科学的な分類に基づいた論理的で厳密に順序付けられた分類構造によって特徴付けられます(New Webster "Thesaurus。Landoll、1991)。

主題辞書は特殊なタイプの表意文字シソーラスであり、そのマクロ構造の主要単位は主題グループであり、それらの表示(指示対象)の分類に基づいて組み合わされ、それらの関連性の観点から考慮された語彙素が含まれます特定のトピックに。

体系的な辞書は、特殊なタイプの表意文字シソーラスであり、その分類構造は、言語の語彙単位間に存在する実際の意味関係を表すことを目的としています。 中核となる分類構造は、語彙の語彙文法分類、つまり、従属と構成の観点から記述されたパラダイム構造を表します。

主題-体系辞書は、主題辞書と体系辞書を組み合わせた特殊なタイプの表意文字辞書です。

概要。 言語テサウリの考慮される分類には、次のタイプの辞書が含まれます。類似のシソーラス(VVモルコフキンの用語)。 表意文字(イデオロギー)シソーラス(L.V.ScherbaおよびV.V.Morkovkinの用語); assoc。 シソーラス(Yu.N. Karaulovによる用語)。 次にポップを紹介します。 シソーラスとその特徴が明らかになります。

3.4。 人気のシソーラスとその特徴

この用語自体がその存在に起因する、利用可能なシソーラス辞書の中で最も有名なものは、に基づいて作成されました 英語の; それはPMによって絶えず再版されたシソーラスです。 ロジェ・ロジェの英語の単語とフレーズのシソーラス(1852)。

Thesaurus of English Words and Expressionsの著者は、当時の彼の経験を最大限に活用していたことに注意することが重要です。 「単語を分類するときに私を導いた原則」とP.M.は書いています。 ロジャーは、博物学のさまざまな分野で個人を分類するために使用されるものと同じものです。 したがって、私が強調したセクションは、植物学と動物学の自然な家族に対応し、言葉の列は、植物と動物の自然な列を結合する同じ関係によって固められています。」

午後 ロジャーは、これらの単語と呼ばれる現実のオブジェクトが適切に研究され、整理されるまで、その意味による単語の説得力のある分類は不可能であると信じていました。 したがって、彼は英語の概念分野を抽象的な関係、空間、物質、精神(心、意志、感情)の4つの大きなクラスに分割することから仕事を始めます。 これらのクラスはさらにいくつかの属に細分され、次に特定の数の種に細分されます。

P.M.の表意文字辞書の欠点の中に ロジャーの科学者は次のように考えています。1)基本的な概念クラスの命名法があまり説得力がない。 2)抽象的な一貫性が言葉の自然なつながりよりも優先されます。 3)使用の相対的な不便(大部分、この欠点は後続の版で修正されます)。

現代のロシア語辞書編集では、シソーラス辞書(表意文字辞書)として分類する必要のある辞書がいくつかあります。 これは、例えば、Yu.Nのリーダーシップの下で作成されました。 カラウロフ「ロシア語セマンティック辞書」、「ロシア語セマンティック辞書」、N.Yu編集。 Shvedova、L.G。による「ロシア語の主題辞書」 Sayakhova、D.M。 KhasanovaとV.V. モルコフキナ、「ロシア語動詞の語彙意味論グループの辞書」、ed。 E.V. Kuznetsova、「ロシア語の表意文字辞書」、O.S。 バラノフ、「ロシア語での人間の内的世界の概念」V.I. Ubiyko、V.V。の指導の下での包括的な教育辞書「ロシア語の語彙的基礎」 モルコフキン。

それらのいくつかに精通しましょう。

辞書-A.N.によって編集された現代ロシアのイディオムのシソーラス バラノフとD.O. Dobrovolskyには、次の4つの主要部分が含まれます。1)概要。 2)伝説; 3)シソーラス辞書の本体。 4)ポインタ。 概要の目的は、シソーラスのメインコーパスの構造の概要を提供することです。 サブ分類群と対応するパラダイム参照を含むすべての分類群が一覧表示されます。 シソーラス辞書の主なコーパスは、記述されているイディオムの意味に従って、グループ(分類群)とサブグループ(サブ分類群)にグループ化された辞書エントリのコレクションです。 各記事には、現代ロシア語でのイディオムとその使用例が含まれています。 Synopsis、Legend、Pointersは、上記の辞書シソーラスのサービス部分であり、ユーザーに迅速かつ効率的に作業する機能を提供します。 凡例は、イディオムの使用例が必要ない場合に使用されます。 例を除くすべての情報を再現します。 実際、これは辞書の語彙です。 語彙の単位は見出語です。 この場合の見出語は、元の(辞書)形式のイディオムであり、可能であれば、すべての重要な変形が含まれます。 たとえば、静止するというイディオムは、時間をマークし、静止し、所定の位置に滑り込むという補題の一部です。

辞書には2つのポインタが含まれています。 本の最後に、このプロジェクトの科学的特徴を詳細に分析する記事「辞書の理論的概念-現代ロシアのイデオマティクスのシソーラス」があります。

Yu.N.の指導の下で作成された「ロシア語意味辞書」 Karaulovaには、1600の概念グループに分けられた1万のロシア語が含まれています。 グループの選択は、説明辞書の単語の解釈の繰り返し要素に基づいています。たとえば、「アクション」、「プロパティ」、「楽器」などです。

学者N.Yuのリーダーシップの下で作成された「ロシア語意味辞書」。 Shvedovaは、表意文字辞書と説明辞書の両方の編集に典型的なわずかに異なる原則に基づいています。 まず、言語のすべての単語は、ここでは4つのクラスに分けられます:1)単位(代名詞)を示す、2)単位に名前を付ける(重要な単語)、3)実際に接続する(接続詞、前置詞、動詞をリンクする)、4)分類する(法助動詞) 、助詞、間投詞)。 次に、各クラス内で、すべての単語が品詞に分割されます。 第三に、品詞内で、集合とサブセットは、主題の近接性、または逆に、単語の意味の反対に基づいて識別されます。

DUDENは、左側に(さまざまなソフトウェアに応じて)写真(図面)があり、詳細に番号が付けられている(最小のものまで)本です。 右側には、この番号付きリストにタイトルが付いています(2つの言語でも)。 たとえば、ページ全体に鉄道機器、駅、線路が含まれます。 右側には、矢印、セマフォ、松葉杖などの名前があります。

「ロシア語の主題辞典」L.G. Sayakhova、D.M。 KhasanovaとV.V. モルコフキナには、「男」、「社会」、「自然」の3つの大きなクラスにグループ化された、25,000の語彙ユニットが含まれており、これらは段階的に小さなサブクラスに分岐します。 たとえば、クラス「Human」では、「Human body and Organism」、「Human life」、「 外観、人間の外観 "、"人の感情的な外観 "など。各サブクラスは、さらに特定のサブクラスに分けられます。"人の感情的な世界 "-"人の精神的特性 "-"気質"、"キャラクター "-"一般的なキャラクターの特徴 "など。 各クラスに属する単語の意味と使用法は、最も一般的なフレーズで示されています。 たとえば、「人」クラスのサブグループ「感情、感情の表現」に含まれる「笑い」という単語には、陽気な笑い、楽しい笑い、子供の笑い、破裂などのこの単語との組み合わせの表示が伴います。笑いなどに。

概要。 特に電子形式で個々の主題分野を説明するための最も効果的なツールの1つは、シソーラスです。

シソーラスという用語は、言語学で長い間広く使用されてきました。 特殊タイプ「世界の絵」、「世界の言語モデル」をある程度反映した辞書(Yu.N. Karaulovによる)。 「宝庫」としてのシソーラスは、その意味論的ボリュームが成長し、新しい意味を獲得しました。 彼らは、言語のすべての語彙の豊かさを吸収するだけでなく、特定の論理的体系的な方法でそれらを整理する辞書を呼び始めました。 シソーラス辞書では、単語がグループにまとめられ、この組み合わせは、単語が特定の概念を伝える能力に基づいて行われます。

シソーラス辞書は、言語学では常に、世界に関する集合的な(特定の社会の)知識を言語形式で保存することを保証する一種の普遍的なシステムと見なされてきました。 他の辞書とは異なり、シソーラス辞書はこの知識を「世界の構造」についての私たちの考えを反映する構造化された形式で保存します。

現在最も有名で人気のあるテサウリは、O.V。によるロシア語の表意文字辞書である英語のロジャーシソーラスです。 Baranova、ロシア語意味辞書Yu.N. Karaulova、ロシアの学者N.Yuの意味論辞典 Shvedova、DUDEN、ロシア語の主題辞書L.G. Sayakhova、D.M。 KhasanovaとV.V. モルコフキン。

第1章の結論によれば、私たちの仕事が専念している編集と研究であるシソーラスは、表意文字の主題辞書「山とハイキングの観光」です。 これは、ロシア語とスペイン語の語彙で構成されます。

したがって、シソーラスを作成するには、いくつかの問題を解決する必要があります。

主題分野を説明する用語を強調します。

用語をセマンティックグループに論理的に分割します。

ロシア語とスペイン語の用語を比較します。

グループをアルファベット順に並べます。

手動シソーラスコンパイルの方法とアルゴリズム

情報検索シソーラスは、辞書とセマンティックリソースの構築の分野の専門家である専門の言語学者によって手作業で編集された辞書です。 このような辞書を編集するときのタスクは、1つまたは複数の主題分野のシソーラス記述を取得することですが、辞書を作成するための基礎となるテキストのコーパスが存在することがよくあります。 専門家はテキストコーパスを分析し、シソーラスの手動構築の技術に導かれて、特定の主題領域を説明する用語のリストを編集し、それらのシソーラスを記述子として含めます。 その後、用語は概念にグループ化され、それらの間に階層的および関連的な関係が確立されます。

シソーラスを手動で作成するプロセスは、リソースを作成するための高いコストと期間、専門家の資格からの結果の条件性、テキストのコーパス全体を手動で分析できないなどの欠点によって特徴付けられます。 明らかに、シソーラスを手動でコンパイルする場合、専門家は既存の情報検索方法を使用する必要があります。 インターネット検索エンジン-システム。

まず第一に、バイリンガルシソーラスは単語ごとの翻訳を表していない、その構造は意味的意味の近接性に基づいて編成されたロシア語の語彙素のリストです-ロシア語での概念の定義-での概念の定義 外国語-外国語のテキストオプションのリスト。 この場合、語彙単位のリストは、人には明白に見えるため、通常は辞書に表示されない表現を含めて、両側で可能な限り完全である必要があります。

従来の二か国語辞書を作成する場合の主な目標は、さまざまなテキストで最も頻繁に使用される単語の翻訳のセットを提供することです。 翻訳は余白があるかのように与えられ、翻訳のリストには正確な翻訳と、より狭い意味とより広い意味の翻訳の両方が含まれます(これがスペイン語-ロシア語とロシア語-スペイン語の辞書が元に戻せない理由です)。 読者は、どの翻訳を選択するかという文脈を理解していると想定されています。

シソーラスをコンパイルする主な手順は次のとおりです。

1)キーワードを強調するためのテキストコーパスの前処理。

2)シソーラスに含めるための単語とフレーズのセットの形成、およびシソーラスの記述子間の関係の研究。 このセットに導かれた専門家は、主題分野の主要な概念のリストを作成します。

3)記述子(この場合はアルファベット順)とそれらの分類(私たちの研究では、分類は記述子間の意味関係に基づいています)間の階層関係の割り当て。

4)ロシア語とスペイン語の記述子間の一連の関連関係を構築します。