Türkçe kelimeleri üzerine..

{Not: Güncelleme ile ilgili bilgiler yazının sonundadır.} Zaman zaman içinde, otlar saman içinde.. ben dedemin yazdıklarını ufak ufak gözden geçirir iken, aşağıdaki şey ortaya çıktı. Türkçe Kelime Çözümleyici Tamam, Ortadoğu'da barış, ayrılanlara vuslat, dermansızlara deva gibi iddiaları yok --hiç de olmadı-- ama, yapabildiği şeyler açısından bakarsanız, hiç de fena sayılmaz. 'İyi de, ne yapabilir ki?' diyebilirsiniz.. ben de, 'siz onu boşverin de, nasıl ve ne gibi işlere yarayabileceğini kısaca anlatayım' derim.. İlk aklıma gelen şeylerden birisi, mesela, Türkçe öğrenmek isteyenlerin çaresizliklerine derman olmak.. Düşünün bir kere, herifçinin el oğlu bizim kızımızı sevmiş, ya da tersi --bizim oğlana bir el kızı meftun olmuş-- ve kayınvalide, kayınpeder ve geriye kalan onca akraba vü taâlukat ile artık abuk sabuk el hareketleri veya Tarzanca ile değil de, doğru dürüst bir Türkçe konuşarak anlaşmak istiyor.. İyi de, garibimin başı belâdadır.. Ne bizim kızlar, oğlanlar ne de bizim dil başkalarına benzer.. Gökyüzünden upuzun kelimeler yağar Türkçe bilmeyen gariplerin başına.. Şöyle bir kelime ile karşılaştığını düşünün bu el evladının: 'karşılaştırılabilirmişcesineydiler'... Şimdi... bunun kökü nedir, eki nedir, nerede ne başlar nerede ne zaman ve nasıl biter meselesi Türkçe bilenler için kolaydır da, yeni öğrenenler için tam anlamıyla felakettir... İşte, bu gönül kurbanları dil fakirlerine çare bu programdır.. yani, azıcık daha üzerinde çalışırsam olabilir demek istiyorum. Peki... başka kimlere yardımcı olabilir? Walla.. ilköğretim sıralarında oturan kaç milyon bin bebemiz var ki, Türkçenin ne menem ve bnice zor olduğunu ozmoz yoluyla öğrenmeğe çalışıyor.. Ağzı olanın konuşması kolay da, hâlâ daha maçlarda 'ölmeğe geldik' demesi gerekirken 'ölmeye geldik' diyen yetişkin gençlerimizin halini bir gözünün önüne getirin.. Sadece o masum ve karacahil gençleri değil; koskoca bilim adamlar, askerler, mühendisler, doktorlar ve dahi hocalar, öğretmenler bile 'mek/mak' eki gibi 'fiillerden hareket isimleri' yapan eklerle, 'me/ma' eki gibi 'fiillerden iş(lem) isimleri' yapan ekleri hala daha birbirine karıştıranları bir düşünün.. Bir de şunu düşünün:.. Sizce, danışmaya danışmaya gidenler mi, yoksa danışmaya danışmağa gidenler mi acaba doğru Türkçe konuşurlar?.. Veya, bunları 'bilMEmezlikten' gelmek midir doğrusu 'bilmezlikten' gelmek mi? Herneyse.. bütün bunların cevapları tabii ki bir yerlerde var. Var da, pek erişilebilir değil.. Bilmemek ayıp değil derler.. herzaman doğru değil bu. Bazan ayıptır; ve sormağa utanırsınız. Fakat, cesaretinizi toplayıp sormak isteseniz bile, soracak ve cevap alacak birisini pek bulamazsınız. Aldığınız cevaplar da çoğu zaman size bilgi değil; aksine, daha yoğun bir cehalet aşılar: 'Bilmiyorum' demek yerine, bilirmiş gibi ve bir de 'başka şey kalmamış da önemsediğin şeye bak' cinsinden bir ses tonuyla fuzuli şeylere kafa yorduğunuzu da ekleyerek.. Sizi bilmem, ama ben bu 'bulaşıcı cehalet'ten bıktım usandım. O yüzden, yıllar önce, yaklaşık on sene önce, verilen her Türkçe kelimenin çözümlemesini yapacak bir program yazmağa koşuldum. Epeyi de mesafe aldım ve yukarıda gördüğünüz (görüntüsünü yakın zamanda azıcık daha modernize ettiğim) program ortaya çıktı. Biliyorum, bu iddialı bir sözdür; ama, Türkçe hakkında başkaslarına sormağa utanılacak soruları bu programa sormak ve öğrenmek mümkün olacak. Yinde --şu haliyle-- bu program henüz eksiksiz değil; kusursuz hiç değil, çünkü on sene kadar önce üzerinde bir-iki sene (part-time) çalıştım ama daha sonra araya gerçek hayat girdi ve ilgilenemedim. {Şimdi yeniden, ya da tekrar başlıyorum.} Bu haliyle, bu programdaki fonksiyonalite kolayca yazım hatalarını bulabilir. Yani, yanlış yazılmış kelimeleri bulabilir ve size doğrusunu önerebilir. Bunu yapabilmek önemli; ama daha önemli şeyler de var. Bunlardan birisi, eşanlamlılar, zıtanlamlılar konusu.. Bundan da kastım bir eşanlamlılar, zıtanlamlılar sözlüğü değil. Daha farklı bir şey. Şöyle bir senaryo düşünün: Siz, bir metinde, 'kıyaslanabilir' diye bir kelime arıyorsunuz.. Fakat, yok. Öyle bir kelime arattığınızda bulamıyorsunuz. Çünkü, metinde 'kıyaslanabilir' yok ama, 'mukayese edilebilir' var. Halbuki, ikisi de aynı anlama geliyor.. Eğer arama yapan program bu kadarcık bir şeyi bilseydi, sizi eli-boş geri çevirmezdi. Aynı şekilde, 'akılsız' kelimesini ararken 'aklı yok'un da aynı anlama geldiğini bilseydi hayat daha kolay olurdu.. Benzer şeyi 'deli' ve 'akılsız' için de diyebiliriz, tabii ki. Bunlar arama-tarama yaparken faydalı olabilecek şeyler. Başkaları da var. Mesela: Daha geçenlerde, hepimizin bildiği Google, çok yetenekli bir OCR (optik yazı okuyucu) yazılımını ('OcrOpus') kamuya açık gelitirmeğe karar verdi. Bu önemli, çünkü yakın zamanda artık eski kitapları bilgisayar ortamına kavuşturmak çok kolaylaşacak. Tek yapmak gereken, ilgili sayfayı bir tarayıcıdan geçirmek veya artık çoktandır cep telefonlarında ve neredeyse yakında çakmaklarda da olacak olan sayısal fotoğraf makinaları ile resmini çekmek olacak. OCR bu denli yaygın ve kolay olunca, Türkçe sözkonusu olunca, OCR'in kelime tahmnlerinin sağlamasını yapmak için bu program gibi bir şeye ihtiyaç artacak. Bunun gibi daha bir sürü şey yazabilirim. Bir kısmını da bu yazılımın kendisindeki tanıtım sekmesinde bulabilirsiniz. Bütün bunları okuduktan sonra, şu soruyu sorabilirsiniz: Niçin bu yazılımı açık kaynak hale getirmiyorum? Sebebi basit. Birinci sebebi, bunun yazıldığı dili yeteri kadar bilen yeteri kadar sayıda kişinin olmadığını düşünüyorum. Merak edenler, ilgilenenler olur mutlaka, ama geçmişteki tecrübelerime bakarsam, pek de verimli olacağını sanmıyorum. Anlamlı bir sayı ve seviyeye ulaşıldığında bunu düşünebilirim. Aslında kaynak koddan daha önemli olan, verinin (datanın) kendisi. Yani, ilgili eklerin şunun bunun tasnifi. Bunun kamusal ortamda olması ve kamunun katılımıyla olması gerekiyor. Bu konuda birşeyler yapmam lazım; ya da başka birilerinin yaptıklarına katkıda bulunmak isterim. Neyse. Şimdi.. yukarıda resmini gördüğünüz yazılımın bir kopyasını indirmek isterseniz, aşağıdaki seçeneklerden birisini kullanabilirsiniz:

  • SevenZip (v4.4 ya da daha yukarı sürüm) ile sıkıştırılmış halini indirmek isterseniz bu linki tıklayınız. {~ 750 kB}
  • WinRAR (v3.51 ya da daha yukarı sürüm) ile sıkıştırılmış halini indirmek isterseniz bu linki tıklayınız. {~ 830 kB}
  • WinACE (v2.61 ya da daha yukarı sürüm) ile sıkıştırılmış halini indirmek isterseniz bu linki tıklayınız. {~ 860 kB}
  • WinZip (v10.0 ya da daha yukarı sürüm) ile sıkıştırılmış halini indirmek isterseniz bu linki tıklayınız. {~ 1 MB}
  • Doğrudan doğruya exe'yi indirmek isterseniz bu linki tıklayınız. {~ 5 MB}
Notlar:
  1. Herhangi bir tür veya cinste zararlı unsur içermez.
  2. Bilgisayarınızın diskine veya 'registry'sine herhangi bir şey yazmaz.
  3. Konu ile ilgili yazışma adresi programda verilmiştir.
  4. Herhangi bir yere kaydedip 'turkce.exe'yi tıklamanız yeterlidir.
Güncelleme: 1) Algoritmada bazı değişiklikler. Bu değişiklikler programın hızını, şimdilik, biraz yavaşlatıyor. 2) Dosyadan kelime listesi okuma eklendi. 'Çözümleyici' menüsünün altındaki 'Dosyadan Çözümle' seçeneği ile (her satırında bir kelime olan) dosyayı bir bütün olarak çözümletebilrisniz. Tanımadığı kelimelerin rengi kırmızı gösterilir. Diğer renkler ise bulduğu kelime yapısı alternatiflerine göre değişir. herhangi bir kelimeyi kopyalamak isterseniz, o kelimeyi seçip sağ-tıklamanız gerekir. 3) Daha önce indirmiş iseniz, yeniden indirmenizde bence fayda var. Ek Notlar: 1) Bu bilgileri henüz programın 'Tanıtım' sekmesine eklemiş değilim. 2) Bu böyle olmayacak. Bu kadar kısa zamanda bu kadar güncelleme yapacağımı beklemiyordum. Sürüm bilgisini de bulunduracak ayrı bir sayfa açmam gerekecek gibi görünüyor.