İyi bir sözlük, derlem tabanlı olmalıdır. Sözlüklerin derlem tabanlı olması, bir sözcüğün içinde bulunmuş olan sözcüklerin gerçek hayatta kullanıldığına dair araştırmacıya kesin kanıtlar sunmasıdır.

Sözlükbilim, sözcüklerin kullanım ve anlamlarıyla ilgilenir. Geleneksel bakış açısıyla sözlükbilimsel araştırmalar sözcüklerin anlamlarını ve eş anlamlılıklarını vb. kendine konu edinmiştir. Son zamanlarda ise benzer çalışmalar derlem tabanlı yöntemlerle sözcüklerin dağılımları, bir sözcüğün yüklendiği farklı anlamları, diğer sözcüklerle olan dizgesel bağlılıkları vb. kendine konu edinmekte, tüm bu çalışmalar ise sözlük oluşturma merkezinde gerçekleştirilmektedir. (Biber vd. 2002’ den aktarılan, Bülent, Ö., 2002: 161)


Derlem (bütüncü, corpus) çeşitli, sözlü ya da yazılı metin türlerinin belirli ölçütlere göre bir araya getirildiği bir havuzdur. Farklı amaçlarda ve biçimlerde derlemler bulunabilir. Dile ait verileri düzenli bir şekilde toplayıp derlemler oluşturmak ve bunlar üzerinde çalışmaktır. Derlemlerin en büyük avantajı, genel anlamda nicel bilgiye ulaşmamızı sağlamasıdır. En sık kullanılan sözcük hangisidir? En sık kullanılan ek hangisidir? En sık kullanılan ses hangisidir? En sık kullanılan sözcük dizileri nelerdir? Hangi ek hangi bir diğer ekle en sık bir araya gelmektedir? Sıklığın rolü ne olabilir ve neden böyledir? gibi soruların yanıtını bulmamızı sağlayan bir bilimdir.


Her bir araya getirilen metinler topluluğu derlem değildir. Derlem olabilmesi için bazı ilkeler vardır:

1. Temsil yeterliliği olması gerekir.

2. Olabildiğince fazla alana yayılması gerekir.

3. Dengeli olması gerekir. Örneğin derlem, romanlardan ele alındıysa, bu romanların tamamı Dostoyevski’nin romanlarından olmamalıdır.

4. Veriler belgelenmelidir.

5. Toplanan verilerin kaynağının belirtilmesi gerekmektedir.

Dilbilimsel ölçütlere göre hazırlanmış derlemler, arşiv, indeks veya sözcük sitesi değildir.

Derlem çalışmalarına belli bir soru ile başlanmalıdır. Bir sözcüğün kullanım sıklığını, yerini, bağlamını bulmak istiyorsak derlem tabanlı bir çalışma yapmamız gerekmektedir. Diğer türlü bu aramayı yaparken hiç aklımızda olmayan bir diziyi görebiliriz.


Derlem hazırlamak için sözcük listeleri oluşturulabilir; anahtar sözcük, sözcük-ek sıklıkları, bağımlı dizin satırları oluşturulabilir ve daha sonra istatistiksel yöntemlerle o bağlantı kurulabilir. Verdiğimiz örneklerin çok farklı ortamlarda, farklı kişilerce kullanıldığına, genel, sık rastlanan örneklerine, en tipik örneklerine ulaşmamızı sağlar. Sözlük hazırlayıcıların anlam farklılıklarını belirlemelerine yardımcı olur.


1980’li yıllarda derlemlere olan ilginin artmasıyla, 1990’lardan sonra bilgisayar derlemleri oluşmaya başlamıştır. Bilgisayar derlemlerinin milyarlarca kelimeyi barındırması büyük bir avantajdır. Bu sayede metinler üzerinde etiketleme, düzenleme ve araştırma yapılabilmektedir. Aynı anda, dünyanın herhangi bir yerinden verilere ulaşabilmemizi sağlamaktadır. Bilgisayar derlemlerinde verilerin doğruluk değeri yüksektir.

Derlemlerin kullanımı alanı da oldukça geniştir. Dilbilimi ile ilgili çalışan araştırmacılara farklı metinlerden örnekler sunabilir. Sözlük yazarları ve sözlükbilimi ile uğraşanlar için veri kaynağı olabilirler. Dil eğitimi alanında kullanılabilir. Derlemleri doğrudan öğretim için bir araç olarak da görebiliriz. Konusu doğal dil işleme olan bilgisayar yazılımları için malzeme sağlar. Ses tanıma yazılımları için malzeme sağlar. Konuşmanın istatistiksel etiketleme ve ayrıştırıcıları için malzeme sağlar. Çeviri sistemlerinin oluşturulmasında yardımcı olur. (Oktay, A., 2016: 674)


1990’lı yıllardan sonra bilgisayar derlemlerinin ortaya çıktığını söylemiştik. Bunlardan TUD, Türkçenin oluşturulmuş en iyi derlemlerinden birisi olarak bilinmektedir. Bunun yanında 1990 yılı ve sonrasında yayımlanan ODTÜ Türkçe Derlemi, 2011 yılında başlatılan TS Corpus Projesi, 2010 yılında Uppsala Üniversitesi’nin hazırladığı İngilizce-İsveççe-Türkçe Derlem, Tokyo’da 2006’da geliştirilen Çok Dilli Konuşma Derlemi, Eski Türkçe ve Karahanlı Türkçesinin Tarihsel Derlemi, Google Books, Twets Corpus, Academia. Edu, Google Scholar, Çevrim İçi Sözlükler gibi birçok derlem bulunmaktadır.


Kaynakça:

Oktay, A. Sözlükçülük Çalışmalarında Türkçe Bilgisayar Derlemlerinin Kullanımı, III. Uluslararası Sözlükbilimi Sempozyumu Bildiri Kitabı, 2016, 672-685. Özkan, B. Yöntem Ve Uygulama Açısından Türkiye Türkçesi Sözlük Varlığının Derlem Tabanlı Sözlüğü, BILIG, 2013, 66, 149-178.