Eş anlamlılar sözlüğü: nedir. Bir sözlükten daha fazlası olan bir eş anlamlılar sözlüğü. Sözlükten bir eş anlamlılar sözlüğü derlemek için eş anlamlılar sözlüğü Algoritması

ÖRNEKLEM

Syn: model, numune, örnek, numune, standart, norm, ölçüm, numune, standart, tipik temsilci, şablon, şablon, prototip, çizim, inşaat, çizim, model, gestalt, çerçeve

Rus dilinin eş anlamlıları. 2012

Ayrıca sözlüklerde, ansiklopedilerde ve referans kitaplarında kelimenin yorumlarına, eşanlamlılarına, anlamlarına ve Rusça'daki ÖRNEK'in ne olduğuna bakın:

  • ÖRNEKLEM
    HAFDASA 1927 - Arjantinli 22 kalibreli otomatik tabanca. bir orduydu...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    DENEYSEL - seri için kabul edilmeyen herhangi bir ateşli silah tasarımının tek kopyaları ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    MUSHKETA - 1849-1855 Amerikan kapsül tüfeği. Bir varil ile 58 kalibre. Uzunluk 1016 ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    Tüfek - Amerikan kapsül tüfeği 1849-1855 58 kalibre. Uzunluk 838 ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    70 - Çekoslovak otomatik tabanca, kalibre 7, 65 ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    63 - 9 mm kalibreli on beş ve yirmi beş atışlık hafif makineli tüfek cilalayın. Stoklu uzunluk 583 mm, stoksuz 330 mm. Ağırlık …
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    61 - Çekoslovak on ve yirmi atış hafif makineli tüfek kalibreli 7, 65 mm. Stoklu uzunluk 513 mm, stoksuz 269 mm. ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    58 P - 7.62 mm kalibreli Çekoslovak otuz atış makineli tüfek. Uzunluk 820 mm. Ağırlık 3140 ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    58 V - 7.62 mm kalibreli Çekoslovak otuz atış makineli tüfek. Stoklu uzunluk 820 mm, stoksuz 635 mm. Ağırlık …
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    52 -1. CHZET-513'e bakın. 2. 7.62 mm'lik Çekoslovak on vuruşlu otomatik kendinden yüklemeli karabina. Uzunluk 1003 mm. Ağırlık 4100 ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    50 - Çekoslovak otomatik tabanca, kalibre 7, 62 mm. CHZET-513'ün azaltılmış kopyası. hizmetteydi...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    25 - 1. 9 mm kalibreli Çekoslovakya yirmi dört ve kırk atış hafif makineli tüfek. Stoklu uzunluk 686 mm, stoksuz 445 mm. Ağırlık …
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    23 - 9 mm kalibreli Çekoslovakya yirmi dört ve kırk atış hafif makineli tüfek. Uzunluk 686 mm. Ağırlık 3270 ...
  • ÖRNEKLEM Resimli Silah Ansiklopedisi'nde:
    16/33 - 7, 92 mm Çekoslovakya beş atış dergi karabina. Süngüsüz uzunluk 995 mm, süngülü 1305 mm. Ağırlık …
  • ÖRNEKLEM
    ENDÜSTRİYEL - bkz. ENDÜSTRİYEL MODEL ...
  • ÖRNEKLEM Ekonomik Terimler Sözlüğü'nde:
    - tanıtım, tanıtım amacıyla sergilerde reklam için kullanılan ürünün temsili bir tek kopyası, potansiyele teşhir ...
  • ÖRNEKLEM Ansiklopedik Sözlükte:
    , -ztsa, m 1. Endikatif veya deneme ürünü; örnek (2 değerde). 06 toprak örnekleri. Mineral örnekleri. Ürün örnekleri. hakkında endüstriyel. (yeni, ...
  • ÖRNEKLEM Büyük Rus Ansiklopedik Sözlüğünde:
    ÖRNEK ENDÜSTRİYEL, bkz. Endüstriyel ...
  • ÖRNEKLEM Zaliznyak'ın Tam Aksanlı Paradigma'sında:
    numune "c, numuneler", numune ", numune" v, numune ", numune" m, numune "c, numuneler", numune "m, numuneler" mi, numune ", ...
  • ÖRNEKLEM Rus Dilinin Popüler Açıklayıcı ve Ansiklopedik Sözlüğünde:
    -zts "a, m. 1) (genellikle ne) Bir ürünün, malzemenin gösterge niteliğinde veya deneme kopyası; parçası... madde, ürün, fikir veren...
  • ÖRNEKLEM tarama kelimelerini çözmek ve derlemek için Sözlükte:
    … için …
  • ÖRNEKLEM Rus İş Sözlüğü Sözlüğü'nde:
  • ÖRNEKLEM Abramov'un Eş Anlamlılar Sözlüğünde:
    numune, prototip, prototip, tip, prototip, ideal, model, orijinal, örnek; modeli. koruma ... İdeal bakın, örnek, ...
  • ÖRNEKLEM Rus dilinin eşanlamlıları sözlüğünde:
    Syn: model, örnek, örnek, standart, norm, ölçüm, örnek, standart, tipik temsilci, şablon, şablon, prototip, çizim, tasarım, çizim, desen, ...
  • ÖRNEKLEM Efremova'nın Rus dilinin yeni açıklayıcı ve türetme sözlüğünde:
    m. 1) Bir l'nin yaklaşık, gösterge niteliğinde veya deneme kopyası. ürün, malzeme vb. 2) a) Gösterge niteliğinde örnek... (hangi nitelikler, davranışlar, ...

Özellikle bir dilden diğerine çeviri yaparken, bilimsel ve teknik bilgi ararken ve otomatik kontrol sistemlerinde bir işletmenin bilgi modelini oluştururken, bilgi işleme için makine yöntemlerinin geliştirilmesinin bir sonucu olarak ortaya çıkan yeni temel kavramlardan biri. , bir bilgi sistemi eş anlamlısı kavramıydı. "Eş anlamlılar sözlüğü" terimi, dış dünya hakkında bir bilgi gövdesi anlamına gelir - bu, T dünyasının sözde eş anlamlısıdır. Doğal dil kullanılarak ifade edilen dış dünyanın tüm kavramları, özel eş anlamlılar sözlüğünün ayırt edilebileceği bir eş anlamlılar sözlüğü oluşturur. Hiyerarşik bölünme ile, bireysel kavramların tabi kılınması dikkate alınarak veya dünyanın genel eş anlamlılar sözlüğünün parçalarını ayırarak. Bilgi erişim sistemlerinde eş anlamlılar aramada önemli bir rol oynar. gerekli belge anahtar kelimelere göre. Bu nedenle, bir eş anlamlılar sözlüğü oluşturmak zor ve çok önemli bir iştir. Ancak bu görev de otomatikleştirilebilir.

En genel tanımıyla sınıflandırma, kümelerin bölümlenmesi ve sıralanmasıdır. Nesnelerin, bu olgu veya nesnelerde var olan ortak bir özellik temelinde sınıflara ayrılmasına ve diğer sınıfları oluşturan nesne ve olgulardan ayırt edilmesine denir. Her sınıf gerektiği gibi alt sınıflara ayrılabilir. Puanlayıcı, özel bir sınıflandırma türüdür. Bu nedenle, genel hükümler temelinde oluşturulurlar:
 bir sınıflandırma oluşturmak için bilimsel temel;
 bilimin mevcut gelişme düzeyinin yansıması;
 bir bağlantı ve referanslar sisteminin yanı sıra bir referans ve referans aparatının (CCA) mevcudiyeti.

Ancak rubrikator, bilgi akışlarına ve uzmanların ihtiyaçlarına dayalı pragmatik bir sınıflandırmadır. UDC ve IPC gibi a priori sınıflandırmalardan farkı budur.

Sınıflandırmaların ve özellikle değerlendirme listesinin ana işlevleri şunlardır:
 bilgi alt sistemlerinin tematik sınırlandırılması;
 herhangi bir kritere göre bilgi dizilerinin oluşturulması;
 bilgi materyallerinin ve yayınların sistemleştirilmesi;
 güncel ve geçmişe yönelik arama;
 belge ve sorguların indekslenmesi;
 diğer sınıflandırma şemaları ile ilişki;
 normatif işlevler.

Kavramları - sınıflandırma nesnelerini, bu nesnelerin nitelikleri arasında belirli mantıksal ilkelere göre kurulan ilişkiler temelinde bölerek inşa edilirler. Sınıflandırmanın yapıldığı kritere, sınıflandırmanın bölünmesinin temeli denir. Sınıflandırmalarda, tümdengelim ve tümevarım yöntemleri, grupları, sınıfları sabitlemek ve aralarındaki bağlantıları belirlemek için yaygın olarak kullanılır. Bu, hiyerarşik sınıflandırmalar için tipiktir. Sınıflandırmanın derinliği (hiyerarşideki seviye sayısı) amaca bağlı olarak değişebilir. Yaygın olarak kullanılan dereceli puanlama anahtarlarından biri, bilimsel ve teknik bilgilerin devlet değerlendirme listesidir (SRSTI).

GRNTI değerlendirme listesi, mümkün olacak şekilde tasarlanmıştır. paylaşmak UDC ve IPC gibi diğer sınıflandırmalarla birlikte. Evrensel Ondalık Sınıflandırma (UDC) 70 yıldan fazla bir süredir varlığını sürdürmektedir, ancak hala dağıtım genişliğinde bir eşiti yoktur ve dünyanın birçok ülkesinde kullanılmaktadır. UDC, tüm bilgi evrenini kapsar ve sistematizasyon ve ardından çok çeşitli bilgi kaynaklarının aranması için başarıyla kullanılır.

UDC'ye ek olarak, kütüphane ve bibliyografik sınıflandırma (LBC) pratikte yaygın olarak kullanılmaktadır. LBC, mantıksal sıralama ilkeleri üzerine inşa edilmiştir ve uygulamalı bir tip sınıflandırmasını temsil eder.
V Rusya Federasyonu buluşların sınıflandırılması ve yerli buluş açıklama koleksiyonlarının sistemleştirilmesi için, uluslararası patent sınıflandırması kullanılır - işlevsel ve sektörel ilkeye dayanan oldukça karmaşık çok boyutlu bir sınıflandırma. Aynı teknik kavramlar, IPC veya özel sınıflarda (sanayiye göre) veya fonksiyonel sınıflarda (çalışma prensibine göre) bulunabilir. Kavramların dağılımının sektörel ilkesi, belirli bir tarihsel olarak kurulmuş teknoloji ve teknoloji dalındaki uygulamaya bağlı olarak nesnelerin sınıflandırılmasını içerir.

GRNTI, UDC, LBC ve IPC değerlendirme listesinin karşılaştırmalı özellikleri Tablo 1'de gösterilmektedir.

tablo 1
GRNTI, UDC, BBK ve MPK değerlendirme listesinin özellikleri

İsim

Yapı

Bölümlerin düzenlenmesi ilkesi

bölümleme şeması

Hiyerarşik

sanayi

Genelden özele

Hiyerarşik

Konu ile ilgili

Hiyerarşik

Fonksiyonel ve endüstri

Genelden özele

Bilimsel kütüphaneler için LBC

Hiyerarşik

sanayi

Genelden özele, türlere göre


Böylece, değerlendirme listelerinin ve sınıflandırıcıların ana ayırt edici özellikleri tanımlanabilir:
 uygulamalı bir nitelik ve sektörel bir odak ile karakterize edilirler;
 bilim ve teknolojinin gelişimine, uzmanların ihtiyaç ve isteklerine bağlı açık sistemlerdir;
 inorganik sistemler, nesneler çevrede ortaya çıkar, gelişir ve ondan girer. Elemanlar sistemin dışında bağımsız olarak var olabilir. Bu özellik, ikinci özellikle yakından ilgilidir;
 Asgari unsur çevre ile ilgili kavramdır. Kavram bir tanımlar sistemini temsil eder;
 Kavramlar arasında sistemlerin hiyerarşisini gösteren hem dikey (cins-tür, bütün-parça) hem de yatay (tür-tür, parça-parça) bağlantılar vardır.

Sonuç olarak, sınıflandırmaları ve değerlendirme listelerini düzenlemenin yapısı ve ilkeleri, tümdengelim yöntemini kullanarak konu alanı eşanlamlıları oluşturma sürecini otomatikleştirmeyi mümkün kılar. Tümdengelim yöntemini kullanarak bir eş anlamlılar sözlüğü oluşturma algoritması Şekil 2'de gösterilmektedir. 1.

Eş anlamlılar sözlüğünün oluşumunun temeli, operatör tarafından doldurulan bir belgenin, görevin veya bilgi arama için bir uygulamanın arama görüntüsüdür. Bu nedenle, ilk adım uygulamayı araştırmak ve analiz etmektir. İlk aşamada operatör, ilgilenilen konuyu veya sorunu, olası anahtar kelimeleri ve bunların eşanlamlılarını belirtir. Sonuç olarak, konu alanı hakkında yüzeysel bir anlayış elde ederiz.

Pirinç. 1. Tümdengelim yöntemini kullanarak bir eş anlamlılar sözlüğü oluşturmak için algoritma

Ek olarak, gerekli olduğu kesinti yöntemi kullanılarak bir KS anahtar kelime sözlüğü oluşturulur:
 Şekil 1'de MP olarak gösterilen, kullanıcının kendisi tarafından ayarlanan KS dizisi;
 arama görevinden çıkarılan KS dizisi, sırasıyla MZ.

Ancak, konu alanının daha eksiksiz ve derinlemesine anlaşılması için mevcut değerlendirme listelerini ve sınıflandırma şemalarını (GRNTI, UDC, LBC, MPK) kullanıyoruz. Konu alanının kapsamını en üst düzeye çıkarmak için, mevcut tüm olanları görüntülemek gerekir. Değerlendirme listesi dizisi MR'yi temsil eder. Kesinti arama algoritması iki adımdan oluşur:
1. Genel kavramların bulunması (Şekil 2);
2. Genel kavramlar içinde belirli terimleri bulma (Şekil 3).


Pirinç. 2. Genel bir kavramın işlenmesi

Diziden ilk rubrikatörü yüklüyoruz ve kullanıcı tarafından girilen rubrikatörlerde KS'nin varlığını kontrol etmek için bir döngü düzenliyoruz. Her KS, başlık listesinde aranır ve genel bir kavram veya "yuva" ile karşılaştırılır ve ardından koşul kontrol edilir - belirli terimlere bir gönderme var mı? Böyle bir referans varsa, KS tür terimleriyle karşılaştırılır. Bağlantı bulunamazsa, bir sonraki genel konsepte gidin. Operatör tarafından girilen KS anahtar sözcükleri görüntülendiğinde, görevden çıkarılan KS dizisine gidin. Doğrulama prosedürü benzerdir - genel kavramlara karşılık gelen COP'leri ve ardından bunların belirli terimlerle bağlantılarını arıyoruz.


Pirinç. 3. Tür terimlerinin işlenmesi

Her jenerik kavram içinde, sorunlu alanın maksimum düzeyde anlaşılmasını sağlamak için mevcut tüm tür terimlerini gözden geçirmenin önemli olduğunu unutmayın. Bu eylemlerin sonucu, bilgi arama görevine veya bir belgenin arama görüntüsüne karşılık gelen eksiksiz bir eş anlamlılar sözlüğü olan bir dizi KS anahtar kelimelerinin oluşturulmasıdır.

Belgelerin (belirtilen) eksiksiz bir arama görüntüleri setine dayanarak, şube sözlüğü ve kitaplığın birleşik bir sınıflandırıcısını oluşturmak mümkündür. Açıktır ki, tam set  en basit eş anlamlıları temsil eder.

Ancak, seçim kriteri kullanılarak
, (1)
sektöre özel eş anlamlılar sözlüğü oluşturabiliriz. Aynı zamanda, tüm sektöre özel eş anlamlılar seti, eksiksiz bir eş anlamlılar sözlüğü oluşturur.
, (2)
bölümleri, ana sınıflandırıcılara (GRNTI, UDC, BBK, MPK) veya dahili bir tek sınıflandırıcıya göre GOST gereksinimlerine göre hiyerarşik olarak yapılandırılabilir.

Bir eş anlamlılar sözlüğü oluşturma ve sınıflandırma sürecinin otomasyonu, dağıtılmış olarak çalışan bir operatörün çalışmasını maksimum düzeyde kolaylaştırmayı mümkün kılar. bilgi kaynakları.

Bir belgenin arama görüntüsüne dayalı bir eş anlamlılar sözlüğü oluşturmaya ek olarak, önerilen yaklaşım bir belgenin otomatik olarak özetlenmesi ve metinlerin kümelenmesi için kullanılabilir.

Belgelere atıfta bulunmak, İnternet'ten alınan belgelerin değeri hakkında yönetimsel bir karar vermek için gerekli güvenilir bilgileri uzman uzmanlara sağlamayı amaçlayan görevlerden biridir. Referans verme, bir özetin hazırlanmasıyla biten belgesel bilgiyi dönüştürme sürecidir ve bir özet, birincil belgenin ana içeriğinin ekonomik bir işaret biçimlendirmesi, dilsel ve yapısal özellikler ve bilimsel iletişim sisteminde çeşitli bilgi ve iletişim işlevlerini yerine getirmek üzere tasarlanmıştır. Belgeleri özetlemek için algoritma, Şek. 4.


Pirinç. 4. Belgeleri özetlemek için algoritma

Genel olarak, algoritma aşağıdaki ana aşamaları içerir.
1. İnternetten yüklenen ve veri deposunda bulunan belgeden cümle seçimi noktalama işaretlerinin vurgulanması ve diziye kaydedilmesi ile yapılır.
2. Her cümle ayırıcılar ayrılarak kelimelere bölünür ve bir diziye kaydedilir ve dizi her cümle için farklıdır.
3. Her cümle için, bu cümlenin her kelimesi için diğer cümlelerdeki (önce ve sonra) kelime sayısını sayın. Her kelimenin (öncesi ve sonrası) tekrarlarının toplamı, verilen cümlenin ağırlığı olacaktır.
4. Maksimum ağırlık faktörü ile belirtilen sayıda cümle ve bunları metinde görünme sırasına göre özette seçin.

Bir bilgi sisteminin bir eş anlamlılar sözlüğü ve tematik katalogları oluşturmak için önerilen model, anlamsal aramanın otomatikleştirilmesi için teorik bir temeldir ve bir uzmanın yalnızca arama çalışmasını değil, aynı zamanda otomatik bir modda, bir sonucu olarak elde edilen soyut belgeleri soyutlamasına izin verir. İnternette dağıtılmış bilgi sistemlerinde arama yapın.

Edebiyat:
1. Barushkova R.I. Bilimsel ve teknik bilgilerin sınıflandırma şemaları. Ders kitabı. ödenek. - M., 1981 .-- 80'ler.
2. Barushkova R.I. Bilimsel ve teknik bilgilerin bir sınıflandırma şeması olarak değerlendirme tablosu. Araç seti. - M., 1980 .-- 38s.
3. Trusov A.V., Babarykin E.P. Dağıtılmış bilgi sistemlerinde tematik bilgi talebi alanının sınırlarının değerlendirilmesi. Tüm Rusya (uluslararası katılımlı) konferansı "Bilgi, Yenilik, Yatırımlar", 24-25 Kasım 2004, Perm / Perm Bilim ve Teknoloji Merkezi. - Perm, 2004. - S.76-79.
4. Yatsko V.A. Bilimsel bir metnin analizi ve soyutlanmasının mantıksal ve dilsel sorunları. - Abakan: Hakas devletinin yayınevi. Üniversite, 1996 .-- 128 s.

bilgi işlem teknolojisi

Cilt 12, Özel Sayı 2, 2007

ANSİKLOPEDİ KONU İNDEKSİNE DAYALI BİR KONU ALANINA İLİŞKİN BİR ŞEYLER ANLAMI OLUŞTURMA TEKNOLOJİSİ

V. B. Barahnin

Hesaplamalı Teknolojiler Enstitüsü SB RAS, Novosibirsk, Rusya

e-posta: [e-posta korumalı]

V. A. Nekhaeva Novosibirsk Devlet Üniversitesi, Rusya e-posta: [e-posta korumalı]

Bu çalışma, özel ansiklopedi için konu başlığına dayanan nesne alanı eş anlamlılar sözlüğünün oluşturulması için bir teknolojiyi anlatmaktadır. Bu tür teknoloji, güvenilir terimler kullanarak nesne alanının yüksek kaliteli bir tanımını sunar, böylece bu özel bilgi alanında uzmanların minimum katılımıyla eş anlamlılar sözlüğünün ilk aşamasını oluşturmaya olanak tanır. Önerilen teknoloji aynı zamanda bir eş anlamlılar sözlüğü oluşturma algoritması ve bu algoritmayı uygulayan web tabanlı bir uygulama içermektedir.

Tanıtım

Uyum araştırma projelerinin başarılı bir şekilde uygulanmasını sağlayan en önemli faktörlerden biri etkin bilimsel ve bilgi desteğidir. Özellikle, birkaç (ayrıca, her zaman ilgili olmayan) uzmanlıktan araştırmacıların ortak çalışması, kullanılan terminolojinin dikkatli bir şekilde koordinasyonunu gerektirir, çünkü aynı kavram farklı bilim alanlarında farklı terimlerle ve bir terimle - farklı kavramlarla gösterilebilir.

Başka bir meydan okuma bilgi desteği projeler - her biri belirli bir konuda zaten bir kart dizini biriktirmiş olan işbirliği yapan araştırmacıların kaynaklarını birleştirerek derlenen, proje konusuyla ilgili belgelerin (yani makaleler, kitaplar vb.) bibliyografik tanımlarının entegre bir kart dizininin oluşturulması yıllar boyunca konu (şu anda bu tür kart endeksleri kural olarak elektronik ortamda saklanmaktadır). Kart dizininde aramayı kolaylaştırmak için, mümkün olduğunda, belgeleri karakterize eden anahtar sözcüklerin tek bir sözlükten seçilmesi arzu edilir. Kart endeksine dahil edilen veya elektronik veri tabanlarından potansiyel olarak girilen belgelerin otomatik olarak sınıflandırılması için

© Hesaplamalı Teknolojiler Enstitüsü, Rusya Bilimler Akademisi Sibirya Şubesi, 2007.

soyut dergilerin veri tabanı, "Güncel İçerik" vb. bilimsel yayınlarda koordinat indeksleme algoritmasının kullanılması uygun görünmektedir. Bu algoritma, belirli bir konu alanını karakterize eden terimlerin (kelimeler ve deyimler) metninde yer alan sınıflandırma özelliklerini dikkate almaya dayanmaktadır.

Yukarıda sıralanan tüm görevlerin konu alanına ait terimler sözlüğü oluşturulmadan çözümü mümkün değildir ve bu sözlükte terimler arası bağlantılar kurulmalı ve terimlerin sınıflandırılması yapılmalıdır. Böyle bir sözlüğe eş anlamlılar sözlüğü denir (ayrıntılara bakınız). Bir eş anlamlılar sözlüğü (veya normatif eş anlamlılar sözlüğü), bir bilgi erişim dilinin tüm sözcük birimlerini içeren bir referans sözlüktür - tanımlayıcılar (bu bilgi alma sistemi içinde bu tanımlayıcıların eşanlamlıları olarak kabul edilen anahtar kelimelerle birlikte) ve sözlükteki tanımlayıcılar buna göre sistematize edilmelidir. ve aralarındaki anlamsal bağlantılar açıkça ifade edilir.

Ancak, eş anlamlılar sözlüğünün derlenmesi "ile boş sayfa“Konu alanını yeterince kapsayan tüm terimleri toplaması, anlamları üzerinde anlaşmaları, bağlantılar kurması ve bir sınıflandırma yapması gereken uzmanların çok önemli bir işgücü girdisi gerektirebilir. Önemli ama yine de yardımcı olan bir görevi çözmede ortaya çıkan benzer zorluklar olumsuzdur. çözümüne yönelik umutları etkiler.

Özel ansiklopedilerin konu dizinine dayalı bir eş anlamlılar sözlüğü oluşturmak için bir teknoloji geliştirdik ve uyguladık. Bu teknoloji, güvenilir bir şekilde doğrulanmış terimler kullanarak konu alanının yüksek nitelikli bir tanımını sağlar. İlk aşama uzmanların asgari katılımı ile bir eş anlamlılar sözlüğü oluşturmak - verilen konu alanındaki uzmanlar. Algoritmanın ayrıntılı bir sunumu ve gerekçesi çalışmada verilmiştir. Aşağıda algoritmanın kısa bir açıklaması ve onu uygulayan web uygulaması yer almaktadır.

1. Eş anlamlılar sözlüğü oluşturmak için algoritma

Özel bir ansiklopedinin (veya birkaç ansiklopedinin) konu indeksinin, eş anlamlılar sözlüğü için bir anahtar kelime ve kelime öbeği listesi olarak kullanılması önerilir. Belirli bir ansiklopedi seçimi, bir konu uzmanı tarafından yapılır ve bu seçim, eş anlamlılar sözlüğü oluşturulurken izlenen hedeflere bağlıdır. Bu nedenle, karmaşık çevre sorunlarını çözmek için, fizik, kimya, jeoloji, biyoloji, tıp, matematik vb. alanlarda ansiklopedilerin (veya yokluğunda ansiklopedik sözlüklerin) kullanılması tavsiye edilir. gerekirse doldurulacak anahtar kelimeler.

Çoğu ansiklopedinin konu indeksleri benzer şekilde yapılandırılmıştır - ansiklopedi maddelerinin adları olan terimleri, makalelerde tanımları verilen terimleri ve makalelerde bahsedilen en önemli sonuçları içerirler.

Ansiklopedinin makalelerinin adları tanımlayıcı olarak alınır (yani, benzer kavramların sınıflarının adları olan terimler) ve ilgili dizinlerde bulunan konu dizinindeki kelimeler.

nesne. Bu yöntemin temel avantajı, terimler arasındaki ilişki türlerini kurmak için belirli bir konu alanında uzman olmanıza gerek olmamasıdır - ansiklopedi metnini anlamak için genel bilgi yeterlidir - süreçte daha özel bilgiler gereklidir. sınıflandırma kavramları her zaman belirli bir makaleden toplanabilir ...

Oluşturulan eş anlamlılar sözlüğü Z39.50 protokolü kullanılarak çalışmak üzere tasarlandığından, bağlantı türleri, aşağıdaki türleri ayırt eden / llies şemasının önerilerine göre kurulur:

BT - bir ebeveyn terimiyle, yani daha geniş bir anlam ifadesiyle bağlantı;

NT, bir alt terimle, yani daha dar bir anlama sahip bir terimle bir bağlantıdır. BT - NT ilişkisi karşılıklıdır;

KULLANIM, bunun yerine kullanılan terime bir bağlantıdır;

UF - Karşılıklı geri bildirim KULLANIN;

RT, ilgili bir terimi tanımlayan bir bağlantıdır;

LE - dilsel olarak eşdeğer terimler arasındaki ilişki;

FE tamamen aynı terimlerdir.

Ayrıca tanımlayıcıların sınıflandırılması bu konu alanının bölümlerine göre yapılır. Belirli bir sınıflandırıcı seçiminin yanı sıra bir ansiklopedi seçimi bir uzman tarafından yapılır ve farklı konu alanlarından birkaç ansiklopedi kullanılması durumunda, birkaç özel sınıflandırıcı kullanmak mümkündür. Tanımlayıcılar ve sınıflandırıcının bölümleri arasında NT, RT, LE (FE) formunun bağlantıları kurulurken, sınıflandırma mümkünse en düşük seviyenin bölümlerini kullanmalıdır.

Daha sonra BT, USE, RT, LE ve FE ilişkileri ile tanımlayıcı ile ilişkilendirilen anahtar kelimelere tanımlayıcı ile aynı sınıflandırma numarası atanır. Ancak bu, tanımlayıcının en düşük seviyede olmayan bir sınıfa atanması durumunda, uzmanın daha sonraki çalışmasında, BT ve USE ilişkileri ile tanımlayıcı ile ilişkili terimlerin sınıfa atanabileceği bir durumu dışlamaz. daha düşük bir seviyede. Bu durumda, belirtilen terimlerin kendileri tanımlayıcı olacaktır.

Sonuç olarak konu indeksinde yer alan tüm terimler bu konu alanının bölümlerine göre sınıflandırılmıştır.

2. Web uygulaması işleminin açıklaması

Bununla birlikte, bu metodolojiye uygun olarak bir eş anlamlılar sözlüğü oluşturma süreci, büyük miktarda rutin çalışmayı içerir ve buna ek olarak, programlama becerisine sahip bir kişinin katılımını gerektirir. Bu nedenle metodolojiye ek olarak, kullanıcı dostu bir arayüze sahip ve aşağıdaki işlevleri destekleyen bir web uygulaması geliştirilmiştir:

1) konu dizininin sayısallaştırılmış sayfalarından bilgilerin bir veritabanı tablosuna otomatik olarak çevrilmesi;

2) genel terimler listesinde tanımlayıcıların vurgulanması;

3) belirli bir tanımlayıcıyla ilişkili terimleri arayın ve Zthes şemasına göre bağlantı türlerini ayarlayın.

Yukarıdaki işlemlerin tümünü tamamlamak için programlama becerilerinin gerekli olmadığına dikkat etmek önemlidir.

Geliştirilen uygulama evrenseldir, yani. çeşitli konu alanlarından eş anlamlılar sözlüğü oluşturmak için kullanılabilir. Şu anda, programcı programın bir ansiklopedinin konu dizininden diğerinin konu dizinine yeniden yapılandırılmasını gerçekleştiriyor (ancak yalnızca bu aşamada, farklı konu alanlarının eş anlamlılar sözlüğü oluşturma süreçleri farklı olabilir), ancak işe yarıyor Programı, kullanıcının bu işlemi gerçekleştirmesine izin veren işlevlerle tamamlama çalışmaları devam etmektedir. programlama becerisine sahip olmamak.

Uygulama aşağıdaki gibi çalışır. Sayısallaştırılmış dizin sayfaları otomatik olarak işlenir. Kullanıcı, verilerle birlikte metin dosyasının konumunu belirtir, ardından satır satır okunur ve terimlerin kendileri veritabanına girilir ve ayrıca bulundukları ansiklopedinin sayfalarının sayısı hakkında bilgi verilir (Şek. 1).

Genel anahtar kelime listesinden tanımlayıcılar, kullanıcının kendisi tarafından seçilir ve ekranda görüntülenen listedeki arama terimlerini işaretler. \ ¥ ob-appopio ayrıca düzeltme işlevini de destekler olası hatalar(incir. 2). Ona adanmış ansiklopedi makalesinde bulunan tüm terimlerin bu tanımlayıcı ile ilişkili olarak kabul edildiğini hatırlayın.

İlgili terimleri aramayı kolaylaştırmak için, kullanıcıya yalnızca seçtiği tanımlayıcı ile aynı sayfada bulunan bir anahtar kelime listesi sunulur (aslında bunun için veritabanına yalnızca terimleri girdik ve sayfaların özellikleri hakkında bilgi girdik). ). Elbette yazı tüm sayfayı bir bütün olarak almayabileceği için listede gereksiz terimlere yer verilecektir. Kullanıcı, bağlantılar kurarak,

Pirinç. 1. Giriş metin dosyaları indeksteki terimlerle

№ Tanımlayıcı sözlüğünün oluşturulması - Microsoft Internet Explorer!

Dosya Düzenle Favorileri Görüntüle Servis Yardımı

S Geri "©" @ | í | & uR Arama ^ Favoriler -. v

Adres; | ¡J§ http: ^ localhost / math_dict / Deskj-_Slovar / Descr / gen_ss.phtml; V ¡¿3 Geçiş Bağlantıları y>

fiBár JOQQ- © - I * 1] 0 l de: * - F

1 Abaküs | 1, 13 11111111

2 Değişkenli otomat | 1, 67 11111111

3 Değişken grup nesnesi | 1, 1149 111 1 | |

4 Değişken diferansiyel 11.13-15 I 2, 240 111111

5 Değişmeli diferansiyel, temel | 1, 13 11111111

6 Değişken diferansiyel, bölen | 1, 15 | | | | | 1 |

7 Değişken diferansiyel normal | 1, 14 11111111

8 Değişken diferansiyel, normalleştirilmiş | 1, 14 11111111

9 Değişmeli diferansiyel, kutup dönemi | 1, 14 | | | | | | |

10 Değişmeli diferansiyel, döngüsel periyot | 1, 14 11111111

11 Değişken idempotent 14, 941 1111111

12 Değişken integral 11.15-17 111111

13 Abel integrali, Abel teoremi | 1, 17 11111111

14 Değişmez integral kanonik | 1.16 ||||||

16 Değişmez integral, periyot matrisi | 1.16 ||||||

15 Değişmeli integral normal | 1, 16 |||||||

17 Değişmeli integral, kutup dönemi | 1.16 ||||||| 1S Değişen integral, döngüsel periyot | 1, 16 | | | | |

19 Değişmeli potansiyel | 2, 239 11111111

20 Abelev bir grup 11.17-20 11111111

21 Tamamen ayrıştırılabilir Abelian grubu | 1.19 ||||||

22 Değişmeli grup bölünebilir | 1, 19 |||||||

23 Değişken grup sonlu olarak oluşturuldu | 1.18 11111111

24 Değişken grup, Kulikov kriteri | 1, 18 | | | | | |

25 Değişmeli grup, sıfır | 3.1082 11111111

26 Değişken grup, periyodik kısım | 1, 18 111 | |

http: // locdlhostymath_dict / Deskr_Slovar / Descr / git, phtml?ss 1 + 4 + 1 + A + 1 + 3

j 5tartApache.bat

Ben Svoj.NET: PHP Düzenleme

J Adobe Photoshop || w

^ Yerel intranet

TR Sch/mK 21: 0;

Pirinç. 2. Anahtar kelimelerin ve vurgulanan tanımlayıcıların listesi

Pirinç. 3. İlgili terimlerin seçimi

Pirinç. 4. Bağlantı türlerinin oluşturulması.

önerilen listeden anahtar kelimelerin sadece bir kısmını seçecektir, ancak bu tür bir otomasyon rutin iş miktarını önemli ölçüde azaltır (Şekil 3).

Tanımlayıcı ile anahtar kelime arasındaki ilişkinin boyutu uygun form doldurularak belirlenir (Şekil 4).

Çözüm

Bu algoritmanın ve web uygulamasının çalışabilirliği, "Matematik" konu alanının ("Diferansiyel Denklemler", "Kısmi Diferansiyel Denklemler", "Sayısal Analiz", "Akışkanlar Mekaniği" vb. .) konu endeksi temelinde " Matematik Ansiklopedisi ". Terimlerin sınıflandırılması ve aralarındaki bağlantıların kurulması için bir lisans yeterliliğinin yeterli olduğu tespit edilmiştir (nadir durumlarda bilimsel dereceye sahip bir uzmanın istişarelerde yer alması şartıyla). Bu, geliştirilen algoritmanın yüksek verimliliğini kanıtlamaktadır.

bibliyografya

Mikhailov A.I., Chernyi A.I., Gilyarevsky P.C. Bilişimin Temelleri. Moskova: Nauka, 1968.

Barakhnin V.B. "Matematik" konu alanının eş anlamlılar sözlüğünün geliştirilmesi // Mater, conf. "Bilgisayar ve bilgi Teknolojisi bilim, teknoloji ve eğitimde ". Bölüm 1. Novosibirsk; Almatı; Ust-Kamenogorsk, 2003. S. 111-115.

Zthes: Thesaurus Navigasyonu için bir Z39.50 Profili

http://lcweb.loe.gov/z3950/agency/profiles/zthes-04.html

3.1. eş anlamlılar sözlüğü

Eş anlamlılar sözlüğü (Yunanca θήσαϋροξ - hazine, rezerv) veya ideografik sözlük (Yunanca fikirden - kavram, sunum, fikir ve grafik - yazarım, tarif ediyorum) - modern dilbilimde: 1) özel bir tür genel veya özel sözlükler sözlüksel öğeler arasındaki anlamsal ilişkilerin olduğu kelime hazinesi; 2) bir kelimeyi diğer kelimelerle semantik bağlantısına göre aramak için bir sözlük; 3) sözlükte kelimeleri belirli bir şekilde organize etme (konumlandırma); 4) ekonomik olarak “dünyayı modellemeyi” mümkün kılan sözcüksel kompozisyonu organize etmenin bir yolu.

İlk olarak, ilkel, anlam - depo, hazine, eş anlamlılar sözlüğü L.V. Shcherba "Genel Sözlükbilimde Deneyim" makalesinde (üçüncü muhalefet: eş anlamlılar sözlüğü sıradan (açıklayıcı veya tercüme edilmiş) bir sözlüktür). Bilim adamı şöyle yazıyor: “Thesaurus dedikleri zaman, günümüzde en çok, 1900'de başlayan ve hala sadece M harfine ihmal edilen beş Alman akademisinden oluşan bir girişim olan“ Thesaurus linguae latinae ”yi kastediyorlar. Karakteristik bir özellik Bu tür sözlüklerden oluşur. belirli bir dilde en az bir kez geçen tüm kelimeleri kesin olarak içermeleri ve her kelimenin altında belirli bir dilde mevcut metinlerden kesin olarak tüm alıntıların bulunması. Yukarıdaki karşıtlık - eş anlamlılar sözlüğü - sıradan (açıklayıcı veya çeviri) bir sözlük - "dilsel malzeme" ve "dil sistemi" - "Dilbilimsel fenomenlerin ve dilbilim deneyi üzerine."

Bu terimin ikinci anlamı, yaygın olarak bilinen sözlük-eş anlamlılar sözlüğü "Thesaurus" ile ilişkilidir. ingilizce kelimeler ve ifadeler "P.M. Roget (Roget's Thesaurus of English Words and Phrases, 1852) ve devamı, OV Baranov'un sözlüğü.

Bu yorumda, eş anlamlılar sözlüğü terimi, sözlüksel kompozisyonu sözlüğe yerleştirerek belirli bir düzenleme biçimini belirtir (terimin üçüncü anlamına bakın).

Eş anlamlılar sözlüğü teriminin dördüncü anlamı, sözcüksel kompozisyonu organize etmenin böyle bir yolunun genel olarak tanınmasıyla ilişkilidir, bu da ekonomik olarak “dünyayı modellemeyi” mümkün kılar. Bu bakış açısından, bir eş anlamlılar sözlüğü "herhangi bir bilimsel veya teknik alanın kelime dağarcığının ve en genel biçimde - genel edebi kelime dağarcığının ve ayrıca belirli bir dilin tüm kelime dağarcığının sistematik bir sıralamasıdır".

Yu.N.'ye göre. Genel bir dil sözlüğü olan Karaulov, başlıklarının, bölümlerinin, bölgelerinin, alanlarının yapısında ve ilişkilerinde geniş fikirlerin sözel olmayan bağlantı olanaklarını sabitleyerek, insani değerlerin dikkate alınmasını sağlar.

BİR. Baranov ve D.O. Dobrovolsky, "Editörlerden", "Modern Rus deyimlerinin sözlüğü-eşler sözlüğüne" önsözünde eş anlamlılar sözlüğüne aşağıdaki tanımı verir - özel çeşit dilsel materyali düzenleme açısından diğerlerinden farklı (özellikle açıklayıcı, iki dilli vb.) bir sözlük. Sözlükte, dil birimleri normal bir sözlükte olduğu gibi alfabetik sırayla sunulmaz, anlamlarına göre gruplandırılır.

L.P. Krysin, eş anlamlılar sözlüğüne (ideografik sözlük) özel bir tür açıklayıcı sözlük, “aksine” bir sözlük diyor. “Açıklayıcı sözlükte bilim adamı yazıyorsa, sözlük girişine“ giriş ”sözcük ise ve sözlük girişinin içeriği bu kelimenin anlamının yorumlanması ise, o zaman ideografik sözlükte“ girdi ”dir. anlam, fikir (dolayısıyla bu tür sözlüklerin adı - ideografik) ve bir sözlük girişinin içeriği, verilen anlamı ifade eden kelimelerin bir listesidir. Ve açıklayıcı sözlük, metni anlamak için vazgeçilmez bir araçsa, metni oluştururken ideografik sözlük kullanılabilir: genellikle bir kişi belirli bir düşünceyi ifade etmek ister, ancak bunun için uygun kelimeleri bulamaz; bir ideografik sözlük bu aramaları kolaylaştırır. İki ana sözlük türü vardır:

dilbilimsel eş anlamlılar sözlüğü - metinlerin anlamlı analizi sonucunda seçilen ve benimsenen sınıflandırma sistemine göre sistematik hale getirilen doğal dil sözcüklerinin bir listesini içeren bir sözlük;

istatistiksel eş anlamlılar sözlüğü, belirli bir konudaki metinlerin istatistiksel analizi sonucunda seçilen ve bu kelimelerin aynı metinlerde birlikte bulunma sıklığına göre sözlük girişleri halinde gruplandırılan kelimelerin bir listesini içeren bir bilgi erişim sözlüğüdür.

Bilgi alma sözlüğü (IPT), otomatik işleme sırasında bilgi aramayı kolaylaştırır. IPT, sözcük birimleri arasındaki anlamsal ilişkileri en üst düzeyde ortaya çıkarır. IPT için Devlet Standardında belirtildiği gibi, “tek dilli bir bilgi erişim eşanlamlısı, bir doğal dilin sözlüğüne dayanan, sözlük birimleri arasındaki anlamsal ilişkileri gösteren ve bilgi işleme ve erişim için tasarlanmış, kontrollü ve değişen bir sözlük birimidir”.

IPT'nin temel birimi tanımlayıcı terimlerdir. IPT'nin alfabetik, sözlüksel ve anlamsal kısmı, tanımlayıcı girişlerin bir koleksiyonudur.

Tanımlayıcı sözlükler, belirli bir alanın kelime dağarcığının tam bir açıklaması ve oradaki tüm kullanımları sabitlemek için tasarlanmıştır; mevcut tüm ilgili vakaları kaydederler. Açıklayıcı bir sözlüğün tipik bir örneği, V.I.'nin Yaşayan Büyük Rus Dilinin Açıklayıcı Sözlüğüdür. Dahl (dört ciltlik ilk baskı 1863-1866'da yayınlandı). Yaratıcısının amacı, dili standartlaştırmak değil, diyalektik argo biçimleri de dahil olmak üzere tüm Büyük Rusça konuşma çeşitliliğini tam olarak tanımlamaktı.

Her tanımlayıcı sözlüğü girişi, bu tanımlayıcının eşanlamlılarının yanı sıra ana tanımlayıcı, genel veya ilişkisel ilişkilerle ilişkili diğer sözlük birimlerinin aşağıda GOST makalesinde verildiği bir tanımlayıcı ile başlar.

Bu nedenle, sözlükler, özellikle elektronik format, bireysel konu alanlarını tanımlamak için en etkili araçlardan biridir.

Saf eş anlamlılar sözlüğü nadirdir. Gerçek sözlükte, ilk fikir basitleştirilir veya ek bilgiler eklenir, ancak potansiyel olarak kullanıcı için gereklidir. Bugün en ünlüsü, Yu.N.'nin "Rus Semantik Sözlüğü" dür. Karaulova, "Aynı İsim Sözlüğü" N.Yu. Shvedova, “Rus Dilinin Tematik Sözlüğü”, L.G. Smekhova ve diğerleri.

Özet. Eş anlamlılar sözlüğü L.V. Shcherba bunu, mümkün olduğunda, verilen kelimenin geçtiği tüm bağlamları kaydeden sözlükle ilgili olarak kullandı. Sözlüklerin karakteristik bir özelliği, belirli bir dilde en az bir kez geçen tüm kelimeleri içermeleri ve her kelimenin altında o dilde mevcut olan metinlerden yapılan alıntıların olmasıdır. Eş anlamlılar sözlüğünün içeriği dilsel malzemedir ve sıradan bir sözlüğün içeriği dilsel malzeme ve dil sistemidir (L.V. Shcherba'nın terimleri).

Bu özellik, anlamların ortaklığını veya karşıtlığını gösteren, daha sıklıkla paradigmatik (eş anlamlı veya zıt anlamlı) her türden çapraz bağlantıyla tamamlanır. Ayrıca çeşitli Doç. bağlantılar (yani sözdizimi bağlantıları).

Bu nedenle, eş anlamlılar sözlüğünün (ideografik sözlük) görevi, ana anlam alanlarını, iç yapılarını ve dış bağlantılarını gösteren belirli bir dil malzemesi diliminin anlamsal organizasyonu hakkında bir fikir vermektir. Eş anlamlılar sözlüğü, dilin sistemik doğasının açık bir göstergesidir ve bireysel dil birimlerini ve birim gruplarını birbirine bağlayan birçok ilişki türünü görmenize olanak tanır.

3.2. Dünya hakkında kavramsal bilginin bir eş anlamlılar sözlüğü şeklinde sunulmasının tarihi

Kelimeleri benzerlik, bitişiklik, anlamlarının analojisine göre düzenleme ihtiyacı, insan düşüncesinin gözlemlenebilir tarihi boyunca hissedildi.

Dünya hakkında kavramsal bilgiyi bir eş anlamlılar sözlüğü şeklinde temsil etme fikrinin kökenini izlemek için, eş anlamlılar sözlüğü derleme tarihine (ideografik sözlükler) atıfta bulunarak yardımcı olacağız.

Dolayısıyla, medeniyetin şafağında, insanlar düşüncelerini sadece ideogramlar ve semboller yardımıyla yazılı olarak ifade edebildiklerinde, mümkün olan tek sözlük, muhtemelen kelimelerin tematik gruplar halinde düzenlendiği bir sözlüktü. O zamanlar bir sözlükbilimci için, gerçekliğin kendisinde var olan ilişkiler dışında, kelimelerin sınıflandırılması için başka bir kriter bulması zordu.

Ne yazık ki, ideografik yazı kullanan halkların gerçekten bu tür sözlüklere sahip olup olmadığına dair kanıtımız yok. Bildiğimiz en eski ideografik sınıflandırma girişimleri arasında, Bizans'ın İskenderiye Kütüphanesi Aristophanes'in müdürü (MÖ 180 öldü) Yunan gramerinden Attikai Lexeis denir.

II. Yüzyılda. n. NS. Mısır'ın Navcratis şehrinin bir yerlisi olan sözlükbilimci ve sofist Julius Pollux (gerçek adı Polidevkus) tarafından Yunan dilinin malzemesi üzerine derlenen büyük bir "Onomasticon" çalışması ortaya çıkıyor. Y. Pollux birkaç eser yazdı, ancak bize sadece "Onomasticon" kaldı (Pollux Y. Onomasticon. M., 1956).


Onomasticon 10 kitaptan oluşmaktadır. Kitaplar esasen ayrı incelemelerdir ve belirli bir konuyla ilgili en önemli kelimeleri içerir. Böylece ilk kitap tanrılardan ve krallardan söz eder; ikincisinde - insanlar, yaşamları ve fizyolojik yapıları hakkında; üçüncü - akrabalık ve medeni ilişkiler hakkında, vb. Sözlükteki kelimelere kısa açıklamalar eşlik eder. Modern zamanlarda, sözlük ilk olarak 1502'de Venedik'te yayınlandı.

2. ve 3. yüzyıllar arasında n. NS. harika Sanskritçe sözlük "Amarakosha" (Amarakosha. Paris, 1839) yayınlandı. Yazarı, "Vikramaditya tahtını süsleyen dokuz inciden biri" olarak adlandırılan eski Hint şairi, dilbilgisi ve sözlükbilimci Amara Sina'dır. Rusçaya çevrilen Amarakosha, Amara'nın hazinesi anlamına gelir. Sözlük 10 bin kelime içeriyor. Kelimelerin anlamlarının yorumlanmasının daha iyi ezberlenmesi için, sözlük girişleri ayetler şeklinde oluşturulmuştur. Sözlüğün tüm materyalleri 3 kitaba ayrılmıştır. Her kitap birkaç bölüm içerir ve bölüm, gerekirse, birkaç bölüme ayrılır. İlk kitap gökyüzüne, tanrılara ve onlarla doğrudan ilgili olan her şeye adanmıştır. İkinci kitap yeryüzüne, yerleşim yerlerine, bitkilere, hayvanlara ve insana (önce insan yaşayan bir varlık, sonra da sosyal bir varlık olarak kabul edilir; modern toplumun tüm kast yapısı gözümüzün önünde belirir; rahipler, Tanrı'nın sırdaşları, en üstte ve aşağıda ordu ve krallar, hatta aşağıda toprak sahipleri ve en altta zanaatkarlar, hokkabazlar, hizmetçiler vb.) Üçüncü kitap, altı bölümünün başlığından da anlaşılacağı gibi, aslında dilseldir.

Sözlük, Avrupalı ​​bilim adamları tarafından ancak 18. yüzyılın sonunda, ilk bölümü 1798'de Roma'da yayınlandığında tanındı. 1808'de İngiliz Sanskritolog G.T. Colebrooke. 1839'da A.L. Delonshan (AL Deslongchamps). Daha fazla gelişme sözde dünya dili sorunuyla ilişkili kelime dağarcığının anlamsal sınıflandırma fikirleri.

Özet. Bu, en genel anlamda, kelime dağarcığının ideografik sınıflandırma geleneğinin gelişimindeki ilk aşamadır. Bu aşama, ideografik sözlüklerin tarih öncesi olarak adlandırılabilir. Şimdi eş anlamlılar sözlüğü sözlüklerinin modern sınıflandırmasına dönmeniz tavsiye edilir.

Anlatılan eserlerin alfabe sözlüklerinden ne kadar farklı olduğunu görmek kolaydır. Alfabetik sözlüklerde kelimelerin sunumu alfabe gibi koşullu ve oldukça tarafsız bir araç tarafından düzenlenirse, o zaman bir ideografik sözlüğün yapımında, sözlükbilimcinin dünya görüşü belirleyici bir önem kazanır.

3.3. Eş anlamlılar sözlüğü sözlüklerinin sınıflandırılması için ilkeler

Yukarıda da gösterildiği gibi, eş anlamlılar sözlüğünün bir sınıflandırmasını derleme sorunu yeni değildir ve birkaç on yıl boyunca birçok yerli ve yabancı dilbilimcinin dikkatini çekmiştir (K. Marello, V.V. Morkovkin, L.P. Stupin, V.V.Dubichinsky, vb. ). Bu alandaki araştırmaların sonucu, bu sözlükbilimsel eserlerin alternatif sınıflandırmalarının oluşturulmasıydı. En son sınıflandırmalardan biri aşağıdaki kriterlere dayanmaktadır: a) kelime birimleri arasındaki anlamsal bağlantıların türü; 2) kelime dağarcığının hacmi; 3) genelleştirilmiş kelime dağarcığı; 4) sözlüklerin anlamının geliştirilmesi; 5) sözlük birimlerinin gramer ve üslup nitelikleri; 6) sözlüklerin işleyişinin gösterilmesi; 7) temsil edilen dillerin sayısı; 8) Sözlüklerin anlamlandırılmasında kullanılan göstergebilimsel araçların türü. Adlandırılmış sınıflandırma, daha önce O.M. Karpova ve I. Burkhanov (Burchanov I. Sözcüksel Anlamların Stilistik ve Pragmatik Olarak İlgili Yönlerinin İdeografik Tanımı Üzerine. Londra, 1996); sınıflandırmada kullanılan terminoloji sözlükbilimsel aygıta tanıtılır


V.V. Morkovkin, Yu.N. Karaulov, K. Marello. Sınıflandırma kriterleri O.M. Karpova. Aynı zamanda, K. Marello üç tür eş anlamlılar sözlüğü ayırt eder:

anlamlarını tanımlamadan kelime grupları olan kümülatif;

kelime gruplamanın her bir sözcük birimini yorumlayan tanımlayıcı;

gezginler için iki dilli ve çok dilli eş anlamlılar sözlüğü (Marello C. TheThesaurus // W.D.D. 1990. V. 2. P. 1083).

Kümülatif eş anlamlılar sözlüğü, yalnızca belirli bir anlamsal alanda bulunma durumunda daha anlaşılır, doğru, stilistik olarak doğru bir kelime bulma fırsatı sağlamakla kalmaz, aynı zamanda tematik bilgisayar veri bankalarının oluşumunun temeli haline gelir.

Tanımlayıcı eş anlamlılar sözlüğü, anlamın tanımıyla birlikte, bu tür sözlüklerin doğrudan ansiklopedik yönelimini gösteren edebi eserlerden etimolojik bilgiler ve alıntılar içerebilir. Ek olarak, bu tür sözlükler kullanıcıya gerekli kavramlar sistemini tanıtır, kavramların özünü, benzerliklerini ve farklılıklarını, bunların paradigmatik ve sözdizimsel bağlantılarını açıklar, bazen telaffuz, dilbilgisi, kelime oluşumu ve diğer sözlük olasılıkları hakkında bilgi sağlar. Bu kavramları ifade eden birimler.

Gezginler için iki dilli ve çok dilli eş anlamlılar sözlüğü genellikle tematik bölümlere göre oluşturulur: sayılar, yemek, ulaşım, otel vb. iki veya daha fazla dilin eşdeğerlerinin çevirisi ile.

Mevcut eş anlamlılar sözlüğü türlerinin en eksiksiz gösterimi için çok düzeyli bir sınıflandırma oluşturulur. İlk olarak, kelime dağarcığı birimleri arasındaki anlamsal bağlantıların türüne göre, eş anlamlılar sözlüğü üç büyük sınıfa ayrılır:

1. İlişkisel eş anlamlılar sözlüğü (Yu.N. Karaulov'un terminolojisi

2. Benzer bir eş anlamlılar sözlüğü (V.V. Morkovkin'in terminolojisi

3. İdeografik (ideolojik) eş anlamlılar sözlüğü (L.V.Scherba, V.V. Morkovkin terminolojisi. Adı geçen üç eş anlamlılar sözlüğü, sırasıyla aşağıdaki anlamsal sözlük bağlantı türlerini yansıtır:

1. Semantik-sözdizimsel ilişkiler, temelinde
kelimeler, kökenleri ve varlıkları çift bağlarla önceden belirlenmiş gruplar veya çiftler halinde birleştirilir: anlamsal ve sözdizimsel. Kelimelerin anlamsal bağlantıları, esas olarak bir cümlede tahmin işlevi gören fiiller ve sıfatlar ile isimler arasında kurulur, örneğin:

a) eylem ile gerçekleştirildiği organ (enstrüman) arasında: tut - el, gör - göz, yüzücü - tekne vb.;

b) bir konu gerektiren eylem fiilleri ile konu arasında: havlama - bir köpek, komşu - bir at, vb.; c) fiiller ve birincisinin gerektirdiği belirli bir gramer eklemesi arasında: odun kesmek, yemek yemek, vb.

Dolayısıyla, ilişkisel bir eş anlamlılar sözlüğü, sözcük birimlerini aralarında var olan anlamsal ve sözdizimsel bağlantılar temelinde organize eden ve kelime merkezlerinin grafik biçimine göre grupları düzenleyen bir sözlük-eş anlamlılar sözlüğüdür.

2. Sözcüksel ve anlamsal bağlantılar. Bu tür bir bağlantıya sahip gruplar halinde birleşme, kelimelerin ana özelliğine göre gerçekleşir - sözlüksel anlam. Bu aynı zamanda kelimelerin bireysel anlamlarının gerçekleştirildiği sözlük-dilbilgisi bağlantılarını da hesaba katar.

Bu nedenle, benzer bir eş anlamlılar sözlüğü, makro yapısının temel birimi sözlüksel-anlamsal grup olan sözlükbilimsel bir referans kitabıdır; gruplar anlamsal baskınların alfabetik sırasına göre sistemleştirilir.

3. Nesnelerin ve kelimelerle gösterilen süreçlerin işlevlerinin benzerliği veya ortaklığı nedeniyle kelimelerin bir grupta birleştirilmesinin gerçekleştiği konu veya tematik bağlantılar: nesneler
ev eşyaları, vücut parçaları, giysi türleri, binalar vb.

Bu nedenle, bir ideografik eş anlamlılar sözlüğü, konu (tematik) gruplar içindeki sözcük birimlerini temsil eden ve bunları dünya hakkında kavramsallaştırılmış bilgiyi temsil etmek üzere tasarlanmış hiyerarşik bir yapı içinde organize eden sözlükbilimsel bir çalışmadır.

Aynı kriter çerçevesinde, bir tür alt bölümü daha gerçekleştiriyoruz. Bu nedenle, ideografik eş anlamlılar sözlüğü aşağıdaki 4 türle temsil edilir:


İdeografik bir eş anlamlılar sözlüğünün kendisi.

Tematik sözlük.

Sistematik sözlük.

Konu-sistematik sözlük


İdeografik eşanlamlılar sözlüğünün kendisi, makro yapısı dilin sözlüksel bileşimi üzerine bindirilmiş a priori sinoptik haritaya göre düzenlenen özel bir ideografik kelime dağarcığı türüdür. İdeografik kelime dağarcığının diğer türlerinden farklı olarak, ideografik eş anlamlılar sözlüğünün kendisi, genel kelime dağarcığı sözlükbilimsel açıklamaya tabi olsa bile, bilimsel taksonomiye dayalı mantıklı ve kesin olarak düzenlenmiş bir sınıflandırma yapısı ile karakterize edilir (New Webster "Thesaurus. Landoll, 1991).

Tematik sözlük, makro yapısının ana birimi tematik bir grup olan, anlamlarının sınıflandırılması (referanslar) temelinde birleştirilen ve alaka düzeyi açısından düşünülen sözlükleri içeren özel bir ideografik eş anlamlılar sözlüğü türüdür. belirli bir konuya.

Sistematik sözlük, sınıflandırma yapısı dilin sözcük birimleri arasında var olan gerçek anlamsal ilişkileri temsil etmeyi amaçlayan özel bir ideografik eş anlamlılar sözlüğü türüdür. Özünde, sınıflandırma yapısı kelime dağarcığının sözlüksel-dilbilgisel sınıflandırmasını, başka bir deyişle, tabi olma ve kompozisyon açısından tanımlanan paradigmatik yapısını temsil eder.

Tematik-sistematik bir sözlük, tematik ve sistematik bir sözlüğün birleşimi olan özel bir ideografik sözlük türüdür.

Özet. Dilbilim sözlüğünün dikkate alınan sınıflandırması aşağıdaki sözlük türlerini içerir: benzer eş anlamlılar sözlüğü (VV Morkovkin terminolojisi); ideografik (ideolojik) eş anlamlılar sözlüğü (L.V.Scherba ve V.V.Morkovkin terminolojisi); doç. eş anlamlılar sözlüğü (Terminoloji Yu.N. Karaulov tarafından). Pop daha sonra sunulacak. eş anlamlılar sözlüğü ve özellikleri ortaya çıkar.

3.4. Popüler sözlükler ve özellikleri

Bu terimin varlığını borçlu olduğu mevcut eş anlamlılar sözlüklerinin en ünlüsü, temel alınarak oluşturulmuştur. İngilizce dili; P.M. tarafından sürekli olarak yeniden basılan bir eş anlamlılar sözlüğüdür. Roger Roget'in İngilizce Sözcükler ve Deyimler Sözlüğü (1852).

Thesaurus of English Words and Expressions kitabının yazarının o zamanki deneyiminden tam olarak yararlandığını belirtmek önemlidir. "Kelimeleri sınıflandırırken izlediğim ilke," diye yazıyor P.M. Roger, bireyleri doğal tarihin çeşitli alanlarında sınıflandırmak için kullanılanla aynıdır. Bu nedenle, vurguladığım bölümler, botanik ve zoolojinin doğal ailelerine tekabül ediyor ve kelime sıraları, doğal bitki ve hayvan sıralarını birleştiren aynı ilişkilerle sağlamlaştırılıyor. "

ÖĞLEDEN SONRA. Roger, kelimelerin anlamlarına göre ikna edici bir şekilde sınıflandırılmasının, bu kelimeler olarak adlandırılan gerçeklik nesneleri düzgün bir şekilde incelenip organize edilmedikçe imkansız olduğuna inanıyordu. Bu nedenle çalışmasına İngiliz dilinin kavramsal alanını dört büyük sınıfa ayırarak başlar: soyut ilişkiler, uzay, madde ve ruh (zihin, irade, duygular). Bu sınıflar ayrıca bir dizi cinse bölünür ve bunlar da belirli sayıda türe bölünür.

P.M.'nin ideografik sözlüğünün eksiklikleri arasında. Roger bilim adamları aşağıdakileri atfeder: 1) temel kavramsal sınıfların pek inandırıcı olmayan isimlendirmesi; 2) soyut tutarlılık, kelimelerin doğal bağlantılarına üstün gelir; 3) göreceli kullanım uygunsuzluğu (büyük ölçüde, bu eksiklik sonraki baskılarda düzeltilmiştir).

Modern Rus sözlükbiliminde, eş anlamlılar sözlüğü (ideografik sözlükler) olarak sınıflandırılması gereken birkaç sözlük vardır. Bu, örneğin, Yu.N. Karaulova "Rusça Anlambilim Sözlüğü", "Rusça Anlambilim Sözlüğü" N.Yu tarafından düzenlendi. Shvedova, “Rus Dilinin Tematik Sözlüğü”, L.G. Sayakhova, D.M. Khasanova ve V.V. Morkovkina, "Rusça fiillerin sözcüksel-anlamsal gruplarının sözlüğü", ed. E.V. Kuznetsova, "Rus Dilinin İdeografik Sözlüğü", O.S. Baranov, "Rus dilinde insanın iç dünyası kavramı" V.I. Ubiyko, V.V.'nin rehberliğinde kapsamlı bir eğitim sözlüğü "Rus dilinin sözcüksel temeli". Morkovkin.

Bazılarıyla tanışalım.

Modern Rus deyimlerinin sözlük-eş anlamlıları "A.N. Baranova ve D.O. Dobrovolsky dört ana bölümden oluşur: 1) özet; 2) bir efsane; 3) Thesaurus Sözlüğünün ana gövdesi; 4) işaretçiler. Özetin amacı, Thesaurus'un Ana Derlemi yapısına genel bir bakış sağlamaktır. Tüm taksonları alt taksonları ve ilgili paradigmatik referansları ile listeler. Thesaurus Sözlüğünün ana gövdesi, içinde tanımlanan deyimlerin anlamlarına göre gruplar (taksonlar) ve alt gruplar (alttaksonlar) halinde birleştirilen sözlük girişlerinin bir koleksiyonudur. Her makale bir deyim ve modern Rusça'daki kullanımına ilişkin örnekler içerir. Özet, Efsane, İşaretçiler, kullanıcıya hızlı ve verimli çalışma yeteneği sağlayan yukarıda belirtilen Sözlük-eş anlamlılar sözlüğünün hizmet parçalarıdır. Efsane, deyimlerin kullanımına ilişkin örneklere ihtiyaç duyulmayan durumlarda kullanılır, çünkü örnekler dışında tüm bilgileri yeniden üretir. Aslında, bu sözlüğün kelime hazinesidir. Kelime dağarcığının birimleri lemmadır. Bu durumda lemma, orijinal (sözlük) biçiminde bir deyimdir ve mümkünse tüm temel varyantlarını içerir. Örneğin, durma deyimi, zamanı işaretleme, hareketsiz durma ve yerinde kayma lemmasının bir parçasıdır.

Sözlük iki işaretçi içerir. Kitabın sonunda, bu projenin bilimsel özelliklerini ayrıntılı olarak analiz eden "Modern Rus ideomatiğinin Sözlük-eş anlamlılarının teorik kavramı" adlı bir makale bulunmaktadır.

Yu.N.'nin rehberliğinde oluşturulan "Rus Semantik Sözlüğü". Karaulova, 1600 kavramsal gruba ayrılmış 10 bin Rusça kelime içeriyor. Grupların seçimi, açıklayıcı sözlüklerdeki kelimelerin yorumlanmasının tekrar eden unsurlarına dayanır: örneğin, "eylem", "özellik", "araç", vb.

Akademisyen N.Yu önderliğinde oluşturulan "Rus Semantik Sözlüğü". Shvedova, hem ideografik hem de açıklayıcı sözlüklerin derlenmesi için tipik olan biraz farklı ilkelere dayanmaktadır. İlk olarak, dilin tüm kelimeleri burada dört sınıfa ayrılır: 1) belirtme birimleri (zamirler), 2) adlandırma (anlamlı kelimeler), 3) fiilen bağlama (bağlaçlar, edatlar, fiilleri bağlama), 4) sınıflandırma (kipli kelimeler, parçacıklar, ünlemler). İkinci olarak, her sınıf içinde, tüm kelimeler konuşmanın bölümlerine ayrılmıştır. Üçüncüsü, konuşmanın her bölümünde, kümeler ve alt kümeler, tematik yakınlığa veya tersine, kelime anlamlarının karşıtlığına göre tanımlanır.

DUDEN, sol tarafında (farklı yazılımlara göre) resimler (çizimler) bulunan ve detayları numaralandırılmış (en küçüğüne kadar) bir kitaptır. Sağ tarafta, bu numaralandırılmış listeye başlıklar eşlik eder (iki dilde bile). Örneğin, bir sayfanın tamamı demiryolu ekipmanı, istasyonlar, raylar içerir. Sağda okların, semaforların, koltuk değneklerinin vb. adları bulunur.

"Rus dilinin tematik sözlüğü" L.G. Sayakhova, D.M. Khasanova ve V.V. Morkovkina, üç büyük sınıfa ayrılmış 25 bin sözcük birimi içerir: adım adım daha küçük alt sınıflara ayrılan "İnsan", "Toplum", "Doğa". Örneğin, "İnsan" sınıfında "İnsan vücudu ve organizması", "İnsan yaşamı", " Dış görünüş, insan görünümü "," Bir kişinin duygusal görünümü ", vb. Alt sınıfların her biri sırayla daha da özel olanlara ayrılır:" Bir kişinin duygusal dünyası "-" Bir kişinin zihinsel özellikleri "-" Mizaç "," Karakter "-" Genel karakter özellikleri " vb. Her sınıfa ait kelimelerin anlamı ve kullanımı en yaygın ifadelerle gösterilmiştir. Örneğin, “Kişi” sınıfının “duyguların, duyguların ifadesi” alt grubunda yer alan “kahkaha” kelimesine, bu kelime ile neşeli kahkaha, neşeli kahkaha, çocuk kahkahası, patlama gibi kombinasyonların belirtilmesi eşlik eder. gülmek vb.

Özet. Bireysel konu alanlarını, özellikle elektronik formatta tanımlamak için en etkili araçlardan biri, sözlüklerdir.

Eşanlamlılar sözlüğü terimi, uzun zamandır dilbilimde bunu belirtmek için yaygın olarak kullanılmaktadır. özel Tip sözlükler, bir dereceye kadar "dünyanın resmini", "dünyanın dilsel modelini" (Yu.N. Karaulov'a göre) yansıtan. Bir “hazine” olarak eş anlamlılar sözlüğü, anlamsal hacminde büyümüş ve yeni bir anlam kazanmıştır. Sadece dilin tüm sözcük zenginliğini özümsemekle kalmayıp, onları belirli bir mantıksal-sistemik şekilde organize eden bir sözlük demeye başladılar. Eş anlamlılar sözlüğünde kelimeler gruplar halinde bir araya getirilir ve bu kombinasyon bir kelimenin belirli bir kavramı iletebilme yeteneği temelinde oluşur.

Thesaurus sözlüğü dilbilimde her zaman dünya hakkında kolektif (belirli bir toplum için) bilginin sözlü biçimde depolanmasını sağlayan bir tür evrensel sistem olarak kabul edilmiştir. Diğer sözlüklerin aksine, eş anlamlılar sözlüğü bu bilgiyi "dünyanın yapısı" hakkındaki fikirlerimizi yansıtan yapılandırılmış bir biçimde saklar.

Şu anda en ünlü ve popüler eş anlamlılar sözlüğü, O.V.'nin Rus Dilinin İdeografik Sözlüğü olan İngilizce Roger Thesaurus'tur. Baranova, Rusça Anlam Sözlüğü Yu.N. Karaulova, Akademisyen N.Yu'nun Rusça Semantik Sözlüğü. Shvedova, DUDEN, Rus Dilinin Tematik Sözlüğü L.G. Sayakhova, D.M. Khasanova ve V.V. Morkovkin.

Bölüm 1'in sonuçlarına göre, derleme ve çalışmamızın ayrıldığı eş anlamlılar sözlüğü, "Dağ ve Yürüyüş Turizmi" ideografik tematik sözlüğüdür. Rusça ve İspanyolca dillerinin kelime dağarcığından oluşacaktır.

Bu nedenle, bir eş anlamlılar sözlüğü oluşturmak için bir takım problemleri çözmek gerekir:

Konu alanını tanımlayan terimleri vurgulayın;

Anlamsal gruplara mantıksal bir terim bölümü yapın;

Rusça ve İspanyolca dillerinin terimlerini karşılaştırın;

Grupları alfabetik olarak düzenleyin.

Manuel eş anlamlılar derlemesi için yöntemler ve algoritma

Bilgi alma eş anlamlıları sözlüğü, sözlükler ve anlamsal kaynaklar oluşturma alanında uzman bir dilbilimci tarafından elle derlenen bir sözlüktür. Böyle bir sözlük derlerken, görev, bir veya daha fazla konu alanının eş anlamlılar sözlüğü açıklamasını elde etmektir, ancak genellikle bir sözlük oluşturmanın temeli olan bir metinler topluluğu vardır. Uzman, metin derlemini analiz eder ve eş anlamlılar sözlüğünün manuel yapım teknolojisinin rehberliğinde, belirli bir konu alanını tanımlayan terimlerin bir listesini derler ve tanımlayıcılar olarak eş anlamlılar sözlüğü içerir. Daha sonra terimler kavramlara göre gruplandırılır ve aralarında hiyerarşik ve çağrışımsal ilişkiler kurulur.

El ile bir eş anlamlılar sözlüğü oluşturma süreci, bir kaynak oluşturmanın yüksek maliyeti ve süresi, bir uzmanın niteliklerinin sonucunun koşulluluğu, tüm metin külliyatını manuel olarak analiz etmenin imkansızlığı ve diğerleri gibi dezavantajlarla karakterize edilir. Açıkçası, bir eşanlamlılar sözlüğü derlerken, bir uzmanın mevcut bilgi alma yöntemlerini kullanması gerekir. internet arama motorları- sistemler.

Her şeyden önce, iki dilli bir eş anlamlılar sözlüğü, kelime kelime çevirileri temsil etmez, yapısı, anlamsal anlamın yakınlığına göre düzenlenmiş Rusça sözlüklerin bir listesidir - Rusça'da bir kavramın tanımı - Rusça'da bir kavramın tanımı yabancı Dil- yabancı dilde metin seçeneklerinin bir listesi. Bu durumda, sözlüklerde genellikle temsil edilmeyen ifadeler de dahil olmak üzere, sözlük birimlerinin listeleri her iki tarafta da mümkün olduğunca eksiksiz olmalıdır, çünkü bir kişiye açık görünüyorlar.

Geleneksel iki dilli sözlükler oluştururken, temel amaç, çeşitli metinlerde bir kelimenin en sık çevirilerini sağlamaktır. Çeviriler sanki kenarda kalmış gibi verilir, çeviri listesi hem tam çevirileri hem de daha dar ve daha geniş bir anlama sahip çevirileri içerir (bu yüzden İspanyolca-Rusça ve Rusça-İspanyolca sözlükleri tersine çevrilemez). Okuyucunun hangi çevirinin bağlamını seçeceğini anlayacağı varsayılmaktadır.

Bir eş anlamlılar sözlüğü derlemenin ana adımları şunlardır:

1) Anahtar kelimeleri vurgulamak için metin külliyatının ön işlemesi.

2) Eş anlamlılar sözlüğüne dahil edilmek üzere bir dizi kelime ve kelime öbeğinin oluşturulması ve eş anlamlılar sözlüğünün tanımlayıcıları arasındaki ilişkilerin incelenmesi. Bu set tarafından yönlendirilen uzman, konu alanındaki temel kavramların bir listesini yapar.

3) Tanımlayıcılar arasındaki hiyerarşik ilişkilerin tahsisi (bizim durumumuzda - alfabetik sıra) ve bunların sınıflandırılması (çalışmamızda sınıflandırma, tanımlayıcılar arasındaki anlamsal ilişkilere dayanmaktadır).

4) Rusça ve İspanyolca tanımlayıcılar arasında bir dizi ilişkisel ilişki kurmak.