Dizin (Index)

Doğal Dil İşleme

1. Bölüm

◊    Önsöz, Giriş, Dil

◊    Sesbilim

◊    Biçimbilim

◊    Sözdizimi

◊    Anlambilim

2. Bölüm

◊     Doğal Dil İşleme

◊     Metin Seslendirme

◊     Konuşmayı Yazıya Dökme

◊     Yazım Hatalarını Düzeltme

◊     Bul Değiştir

◊     Bilgisayarlı Çeviri




Önsöz
Günlük hayatýmýzda kullandýðýmýz dil, bazýlarýmýz için sadece bir
iletiþim aracý; bazýlarýmýz için sanat; bazýlarýmýz için ise bir araþtýrma
alanýdýr. Dilbilimciler, dilin geçmiþini, yapýsýný, diðer dillerle iliþkisi
gibi konular üzerinde uðraþýrlar. Bilgisayar teknolojisindeki geliþmeler,
biliþimcilerin de dil alanýna ilgi duymasýný saðlamýþtýr. Böylece, Doðal
Dil Ýþleme (DDÝ) adý verilen yeni bir bilim dalý doðmuþtur.
DDÝ bilim dalý içinde aþaðýda sýralanan konular günceldir:
• Metni Seslendirme
• Konuþmayý Yazýya Dökme
• Yazým Hatalarýný Giderme
• Bilgiye Eriþim
• Bilgi Çýkarma
• Özetleme
• Anlama
• Soru Yanýtlama
• Çeviri
Sesbilim konusu, “metin seslendirme” ve “konuþmayý yazýya dökme”
süreçlerinin temelini oluþturur. Metni seslendirmek üzere çalýþacak
olan bir araþtýrmacý, öncelikle ses üretme yöntemlerini öðrenmek
zorundadýr. Ardýndan üzerinde çalýþtýðý dilin ses özelliklerini bilmesi
gerekir. Sesçil bir dil olan Türkçe için, metni seslendirmek kolay gibi
görünse de sanýldýðý kadar kolay olmadýðý, iþin içine girildikçe
anlaþýlmaktadýr.
Bir konuþmayý yazýlý metin haline dönüþtürmek, biliþimcilerin önemli beklentilerinden biridir.
Kalýp sözcükleri veya tümceleri yazýya dönüþtüren çalýþmalar yaygýn olmakla beraber, bir
konuþmayý metne hatasýz dönüþtüren yöntemler üzerinde hala çalýþýlmaktadýr.
Günümüzde, yazýlý metinlerin büyük çoðunluðu bilgisayar ortamýnda hazýrlanmaktadýr; artýk
daktilo kullanýmý çað dýþý kalmýþ sayýlabilir. Bilgisayar ortamýnda bulunan bir metnin yazým
hatalarýný bulmak ve düzeltmek, biliþimciler için ilginç bir alan olarak görülmektedir. Bir
metindeki yazým hatalarýný bulmak için deðiþik yöntemler kullanýlabilir. Yöntemlerden biri,
metnin yazýldýðý dilin söz varlýðýný bilgisayarda bir veri tabanýna yerleþtirmek olarak
düþünülebilir. Bitiþken olmayan diller için olasý görülen bu uygulama, Türkçe gibi gibi bitiþken
diller için ilk seçenek olmamalýdýr. Türkçe yazýlmýþ bir metinde yazým hatalarýný bulmak için;
• Ses uyum kurallarý
• Hece yapýsý
• Eklerin uyumu
özellikleri kullanýlabilir.
Bir metin içindeki bir sözgüðün bir baþka sözcük ile deðiþtirilmesi de sýkça karþýlaþtýðýmýz bir
durumdur. Örneðin, metin içinde geçen tüm “elma” sözcüklerini “erik” sözcüðü ile deðiþtirmek
istediðimizi düþünelim. Ýngilizce yazýlmýþ bir metinde elma karþýlýðý olan “apple” sözcüðü ya
yalýn halde “apple” ya da çoðul halde “apples” bulunabilir. Dolayýsýyla, metnin içindeki tüm
“apple” lar “plum” ve “apples” larý “plums” olarak deðiþtirmek yeterli olacaktýr. Türkçe gibi
bitiþken bir dilde aþaðýdaki durumlar söz konusudur:
elma erik
elmalar erikler
elmacýk erikcik
elmacý erikci
elmacýlýk erikcilik
elmam eriðim
elman eriðin
elmasý eriði
elmamýz eriðimiz
elmanýz eriðiniz
elmalarý erikleri
elmayý eriði
elmaya eriðe
elmada erikde
elmadan erikden
elmanýn eriðin
elmasýz eriksiz
Dolayýsýyla, metnin içinde geçen tüm elma sözcüklerini erik ile yer deðiþtirmek istediðimizde,
ekleri de göz önüne almamýz gerekir. Bir sözcüðün kök ve eklerini bulmak için biçimbilimsel
çözümlemesinin yapýlmasý gerekmektedir. Böyle bir çözümleyiciyi tasarlayabilmek için, dilin
biçimbilimsel özelliklerini en iyi þekilde bilmemiz gerekir.
Bilgiye eriþim, Ýnternet kullanýmýnýn yaygýnlaþmasýna koþut olarak gündeme gelmiþ bir
konudur. Ýnternet’te bulunan bilgi kaynaklarýna eriþirken, gerçekten aradýðýmýz bir kaynaða
eriþmek isteriz. Beklentimiz dýþýnda kalan kaynaklarý görnek istemeyiz. Bilgiye eriþim
alanýndaki çalýþmalar, bir metnin ana konusunu ortaya çýkarmaya çalýþýr.
Günlük konuþma dilimizde kurduðumuz tümceler, isteklerimizi açýklamaya yeterlidir. Ancak
bu tümceleri bir makinenin, örneðin bir bilgisayarýn veya bir robotun anlamasýný bekleyemeyiz.
“Eren Bartu’ya yarýn 1.000 TL göndereceðini söyledi” tümcesini bilgisayarýn anlayacaðý yapýsal
bir kalýba dönüþtürdüðümüzde aþaðýdaðýdaki sonuç ortaya çýkacaktýr:
Taraflar Eren, Bartu
Eylem Para gönderme
Miktar 1.000,- TL
Zaman 15 Þubat
Doðal dilimizde ürettiðimiz tümcelerden, yapýsal biçimde bilgi türetmeye “bilgi çýkarma” adý
vermekteyiz. Tümcelerden bilgi çýkarabilmek için, komþu tümcelerden de yararlanmak
gerekebilir. Dolayýsýyla, dilim sözdizim özelliklerini ve tümce yapýsýný bilmek gerekir.
Okuyucu, kendisi için gerekli gördüðü bilgiyi araþtýrýrken, her metni tüm ayrýntýsýyla
okuyamaz; buna zamaný yetmez. Dolayýsýyla, varsa özetlerini okuyup en gerekli olan metinleri
seçmek ister. Bu istek, bilþimcileri, metinlerin özetlerini bilgi teknolojileri kullarak çýkarmaya
yöneltmiþtir. Özet çýkarma yöntemleri, aðýrlýklý olarak metin içinde sýkça geçen sözcükleri
ortaya çýkarmak ve bu sözcüklerden yararlanarak, düzgün tümcelerle bir özet yazmaya dayanýr.
Ýnsanlar isteklerini belirtmek için tümceler kurarlar ve bunlarý sözlü ya da yazýlý olarak ilgili
kiþiye iletirler. Teknolojinin geliþmesi ile, söz dinleyen makinelerin de üretileceði açýktýr. Basit
emir tümcelerini anlayan ve yerine getiren robotlar üretilmeye baþlanmýþtýr. Ýnsan emirlerinin
anlaþýlmasý, günümüzde baþka alanlarda da uygulanabilmektedir: Örneðin bankalara
gönderilen yazýlý emirlerin anlaþýlýp, gerekli eylemin gerçeþtirilmesi önemli bir emek tasarrufu
saðlayacaktýr.
Yaklaþýk bir asýrdan beri kullandýðýmýz telefon, hayatýmýzýn önamli bir parçasý olmuþtur.
Yolculuk bileti almak, otelde yer ayýrtmak, banka iþlemi yapmak için telefonu kullanýr olduk.
Telefon ile yapýlan iþlerde doðal olarak telefonun öbür ucunda bizim isteklerimizi anlayacak ve
ona göre eylem gerçekleþtirecek vaya yanýtlayacak biri olmalýdýr. Günümüzde, telefonla
sorulan sorularý anlayacak ve gerekli yanýtý verecek veya eylemi yerine getirecek bilgisayar
dizgeleri gerçeklenmektedir. Bu sistemlerin temeli;
Önsöz – 3
• Konuþmayý yazýya dökmek
• Yazýlý metnin anlamýný çýkarmak
• Anlama uygun eylemi yerine getirmek
• Anlama uygun bir tümce olurþturmak ve bunu seslendirmek
aþamalarýndan oluþmaktadýr.
Diller arasý çeviri makinesi insanlýðýn önemli düþlerinden biridir. Günümüzde, DDÝ alanýnda
araþtýrma yapanlar için en çekici konular arasýnda sayýlabilir. Diller arasý çevir konusu, iki dilin
sesbilim, biçimbilim ve anlambilim özelliklerini bilmeyi gerektirir. Çeviri yapýlacak diller
birbiriyle akraba ise çözüm yöntemi daha kolay olabilmektedir. Doðal olarak farklý dil
ailelerinden olan diller için çeviri çalýþmalarý oldukça zordur.
Þu ana kadar anlattýklarýmýz göz önüne alýndýðýda þu yorumlar yapýlabilir:
• DDÝ alanýnda çalýþmak isteyen biri, öncelikle dilin dilbilgisi hakkýnda derinlemesine
bilgiye sahip olmalýdýr.
• Bilgi teknolojilerinin saðladýðý teknik olanaklarý bilip bunlarý doðal dil üzerinde
uygulayabilir.
Yukarýdaki açýklamaya uygun olarak bu kitap iki kýsma ayrýlmýþtýr: Dilbilgisi Temelleri ve DDÝ
Dilbilgisi konularýnýn iþlendiði kýsýmda, bir biliþimci için gerekli olan, ancak yeterli ayrýntýda
dilbilgisi bilgilerine yer verilecektir. Bu baðlamda;
• Sesbilim
• Biçimbilim
• Sözdizim
• Anlambilim
konularý tanýtýlacaktýr. DDÝ’ye ayrýlan kýsýmda aþaðýdaki konular iþlenecektir:
• Metni Seslendirme / Konuþmayý Yazýya Dökme
• Yazým Hatalarýný Giderme
• Bilgiye Eriþim
• Bilgi Çýkarma
• Özetleme
• Anlama
• Soru Yanýtlama
• Çeviri
4 – Önsöz
1. Kýsým
Türkçenin Temel
Dilbilgisi
Dil – 5
6 – Dilbilgisi
1
Dil
Ýnsanlýðýn geliþmesine en çok neyin katký saðladýðý araþtýrýldýðýnda, en
olasýl yanýt dil olacaktýr. Dil olmasaydý, insanlar birbirini anlayamaz;
teknik geliþmeler olamaz; sanat ve kültür oluþamazdý. Bu denli etkin
olan dilin geliþmiþliði, o dili kullanan toplumlarýn geliþmiþliði ile
koþutluk gösterir. Bir baþka deyiþle, geliþmiþ bir dili olan toplumlarýn
ilerlemeleri daha kolay ve hýzlý olabilir.
Bir dilin geliþimi, uzun bir zamana yayýlýr ve sürekli geliþim gösterir.
Zaman içinde, yeni sözcükler dile eklenirken, bazý sözcükler unutulur.
Zaman içinde dilin tümce kurma biçimi de deðiþebilir. Bu nedenlerle,
geçmiþ yüzyýllarda yazýlmýþ metinler günümüzde anlaþýlmaz olabilir.
Bu düþünceler, çoðu dil bilimci tarafýndan kabul görmektedir. Bu
düþünceye ters düþen bir dil olabilir mi? Örneðin bir bilge heyeti
tarafýndan kurallarý konmuþ ve binlerce yýl kurallarý bozulmamýþ bir dil
olabilir mi? Evet böyle bir dil vardýr ve bu dil Türkçe’dir.
Dil ve toplum iliþkisini Konfüçyüs þöyle açýklamaktadýr:
“… Bir ülkenin yönetimini ele alsaydým, yapacaðým ilk iþ, hiç kuþkusuz dilini gözden geçirmek
olurdu. Çünkü dil kusurlu ise, sözcükler düþünceyi iyi ifade edemez. Düþünce iyi ifade
edilemezse, görevler ve hizmetler gereði gibi yapýlamaz. Görev ve hizmetin gerektiði þekilde
yapýlamadýðý yerlerde âdet, kural ve kültür bozulur. Âdet, kural ve kültür bozulursa adalet
yanlýþ yollara sapar. Adalet yoldan çýkarsa, þaþkýnlýk içine düþen halk ne yapacaðýný, iþin
nereye varacaðýný bilemez. Ýþte bunun içindir ki, hiçbir þey dil kadar önemli deðildir !..”
Türkçede sözcüklerin zaman içinde deðiþtiði bilinmektedir. Hatta Osmanlý Türkçesinde, Türkçe
sözcüklerin, toplam söz varlýðýnýn yarýsýna kadar düþtüðü söylenebilir. Bu dönemde, dilbilgisi
kurallarýnda da deðiþimlerin olduðu bilinmektedir. Ancak 12 Temmuz 1932 yýlýnda Dil
Devrimiyle baþlatýlan çalýþmalar sonunda, Türkçeden yabancý sözcükler atýlmaya baþlanmýþtýr.
Atatürkün dil üzerine söylediklerinden bazýlarý þunlardýr:
“Türk milletinin dili Türkçe’dir. Türk dili dünyada en güzel, en zengin ve en kolay olabilecek bir
dildir. Onun için her Türk dilini çok sever ve onu yükseltmek için çalýþýr. Bir de Türk dili, Türk
milleti için kutsal bir hazinedir. Çünkü Türk milleti, geçirdiði bunca tehlikeli durumlarda,
ahlakýnýn, geleneklerinin, anýlarýnýn, çýkarlarýnýn, özetle, bugün kendi ulusallýðýný yapan her
þeyin dili aracýlýðýyla korunduðunu görüyor. Türk Dili, Türk milletinin kalbidir, zihnidir.”
“Türk demek dil demektir. Ulusallýðýn çok belirgin özeliklerinden birisi dildir. Türk
ulusundaným diyen insanlar, her þeyden önce ve ne olursa olsun Türkçe konuþmalýdýr. Türkçe
konuþmayan bir insan, Türk ekinine, topluluðuna baðlýlýðýný öne sürerse buna inanmak doðru
olmaz.”
Ülkesini, yüksek istiklâlini korumasýný bilen Türk Milleti, dilini de yabancý diller
boyunduruðundan kurtarmalýdýr.”
“Türk Dili’nin sadeleþtirilmesi, zenginleþtirilmesi ve kamuoyuna bunlarýn benimsetilmesi için
her yayýn vasýtasýndan faydalanmalýyýz. Her aydýn hangi konuda olursa olsun yazarken buna
dikkat edebilmeli, konuþma dilimizi ise ahenkli, güzel bir hale getirmeliyiz.”
Osmanlý döneminde, özelikle kamusal alanda Türkçe bozulmuþtur. Ancak Türkçenin saðlam
olan kurallarý bozulmadýðýndan, bugün, Selçuklu ve erken Osmanlý dönemi eserlerini
anlayabilmekteyiz. Bu durum Türkçenin kurallarýnýn, yaklaþýk bin yýldýr bozulmamýþ
olduðunun bir kanýtýdýr.
Dilin yapýsý, o toplumun, temel özelliklerini, ilgi alanýný, düþünce dünyasýný ve bilimsel
geliþmesini gösterir. Örneðin, Türkçede aile baðlarýný gösteren sözcüklerin (amca, dayý, eniþte,
teyze, hala, bacanak, baldýz, yeðen, elti, görümce, vb) bolluðu, aile iliþkilerine verdiðimiz
önemi gösterir. Türkçede sayýlar ve sayma düzeni çok dikkat çekicidir. Günümüzde, Dünyada
genelinde onluk sayý düzeni yaygýn olarak kullanýlmaktadýr. Çünkü insan mantýðýna en uygun
sayý düzeni olarak kabul görmektedir. Türkler onluk sayý düzenini çok eski çaðlardan beri
kullanmaktadýr. Türkçede 11’e onbir, 12’ye oniki adý verilmiþtir. Onbir, on ve bir
sözcüklerinden oluþturulmuþtur. Bir baþka deyiþle, sayýlar onluk düzene uygun olarak
8 – Dil
isimlendirilmiþtir. Türkler için çok kolay ve kafa yormaya bile gerek duyulmayan bu sayma
düzeni, diðer dillerde oldukça karmaþýktýr. Örneðin Hint-Avrupa dillerinden Ýngilizcede
yirmiye kadar onluk düzende bir sayma yöntemi yoktur. Daha sonra düzenli saymaya geçilir.
Fransýzcada durum daha da karmaþýktýr: Yirmiye kadar düzensiz bir sayma; ardýndan elliye
kadar düzenli sayma; atmýþ için elli-on ve seksen için dört yirmi denilmektedir. Bu açýdan
deðerlendirdiðimizde, Türkçenin eski geliþmiþ ve önemli bir bilim dili olduðu sonucuna
varabiliriz.
Dilin yapýsý, insanlarýn düþünme yeteneklerine de etki etmektedir. Çok basit bir anlatýmla, elma
sözcüðünü bilmeyen birinin aklýna elma yemek gelemez. Özenme sözcüðü olmayan bir dilde,
kiþi bir þeye özendiðini anlatamaz. Bir dilin sözlük varlýðý, o dilin geliþmiþliðinin bir ölçüsü
olabilir. Ancak, sadece, bir dildeki sözcüklerin sayýsýna bakarak bir dilin diðer bir dile göre daha
geliþmiþ olduðu söylenemez. Dillerin yapýlarý göz önüne alýnarak geliþmiþlik derecesine karar
verilebilir. Örneðin, Ýngilizcede göz, gözlük, gözlükçü sözcükleri için birbiri ile iliþkisi olmayan
üç sözcük (eye, eyeglasses, optician) gerekirken, Türkçede göz sözcüðünden türetilmiþ üç
sözcük (göz, gözlük, gözlükçü ) yetmektedir. Türkçe bitiþken bir dil olmasý nedeniyle, bir kökten
deðiþik anlamlar ifade eden sözcükler türetilebilir. Buna karþýn, Hint-Avrupa dillerinin bu
yöndeki yetenekleri çok kýsýtlýdýr. Bu nedenle, her þeye yeni bir sözcük karþýlýk düþürmek
zorundadýr. Sami dilleri de bir kök sözcükten çok sayýda sözcük türetme özelliðine sahiptir. Bu
açýdan deðerlendirildiðinde, bitiþken ve Sami dillerin yeni sözcük üretme açýsýndan diðer dillere
oranla üstün olduklarý görülmektedir. Daha önemlisi, bu dillerde, türetilen sözcüðün anlamý,
kolayca çýkarýlabilmektedir. Örneðin, “kýrmýk” sözcüðünü ilk duyan kiþi bunun kýrma
eyleminden türetildiðini; kýrma iþlemi sonunda elde edilen bir nesne olduðunu anlayabilir.
Kýrmýðýn Ýngilizce karþýlýðý olan “chip” sözcüðü türetilmek istendiðinde aðaçtan kýymýk
çýkarma veya patetesten parça kesme iþlemine benzetilmeye çalýþýlmýþtýr. Sözcük türetme
yeteneði kýsýtlý olan dillerde bazý sözcüklerin ilginç yöntemlerle türetildiðine tanýk
olmaktayýz. Örneðin “kuþluk vakti” vakti için Ýngilizcede “late morning” yerine “breakfast”
ve “lunch” sözcüklerinin karýþýmý olan “brunch” sözcüðü kullanýlmaktadýr. Nylon
sözcüðünün “Now You Lousy Old Nippons” tümcesinde yer alan sözcüklerin ilk harflerin
türetildiði söylenmektedir.
1.1 Dil Aileleri
Günümüzde, Dünya genelinde yüzlerce dilin konuþulduðu bilinmektedir. Bu dillerden bazýlarý
yaygýn olarak kullanýlýrken, bazýlarý sayýca çok küçük kavimler tarafýndan konuþulmaktadýr.
Yaygýnlýðý olan diller kümelendiðinde, diller aþaðýdaki gibi dil aileleri ortaya çýkmaktadýr:
• Ural-Altay Dilleri
• Hint-Avrupa Dilleri
• Çin-Tibet Dilleri
1.1 Dil Aileleri – 9
• Sami Dilleri
• Bantu Dilleri
1.1.1 Ural-Altay Dilleri
Ural-Altay dilleri, Ural ve Altay olmak üzere iki kümeye ayrýlýr. Ural Dilleri, önce iki kümeye
ayrýlýr:
• Fin-Ugor dilleri
• Samoyed Dilleri
Fin-Ugor dil ailesi içinde, Fince, Macarca, Ugorca ve Permce bulunmaktadýr. Altay dil ailesi
içinde, Türkçe, Moðolca ve Mançu-Tunguz dilleri yer almaktadýr.
1.1.2 Hint-Avrupa Dilleri
Hint-Avrupa dilleri, Asya ve Avrupa kýtalarýna yayýlmýþ bir dil ailesidir. Asya kýtasýnda
konuþulan ve bu dil ailesi içinde Sanskritce, Hintçe, eski Avestçe, Farsça, ve Ermenice bulunur.
Avrupa kýtasýnda konuþulan, Hint Avrupa dilleri üç ana kümeye ayrýlýr:
• Germen dilleri
• Roman dilleri
• Slav dilleri
Germen dilleri arasýnda, Almanca, Felemenkçe, Ýngilizce, Norveççe, Ýsveççe, Danimarkaca,
Roman dilleri arasýnda, Latince, Fransýzca, Ýtalyanca, Ýspanyolca ve Romence, Slav dilleri
içinde Rusça, Bulgarca, Sýrpça ve Lehçe yer almaktadýr.
1.1.3 Çin-Tibet Dilleri
Çin, Japon, Tibet ve Korede kullanýlan diller bu dil ailesine girmektedir.
1.1.4 Sami Dilleri
Arapça ve Ýbranice bu dil ailesi içinde yer alýr. Bu dil ailesi içinde Akadca da bulunmaktadýr.
1.1.5 Bantu Dilleri
Afrika kýtasýnda en yaygýn olarak konuþulan dil ailesidir.
10 – Dil
1.2 Dil Yapýlarý
Diller yapýsal özellikleri açýsýndan da kümelere ayrýlýrlar. Bu kümeler;
• Yalýnlayan diller
• Bitiþken diller
• Bükümlü diller
• Kaynaþtýran diller
1.2.1 Yalýnlayan Diller
Yalýnlayan dillerin bir diðer adý tek heceli dillerdir. Çünkü bu dil ailesi içinde yer alan dillerde
sözcükler, genellikle tek hecelidir.Yalýnlayan dil ailesinde, sözcükler ek almazlar. Tümce
içinde vurguya baðlý olarak anlam kazanýrlar. Çince, Vietnamca, Himalaya dili yalýnlayan
diller kümesinde sayýlýr.
1.2.2 Bitiþken Diller
Bu tür dillerde, sözcüðün temeli kök sözcüktür. Kök sözcüðe yapým ekleri eklenerek yeni
sözcükler oluþturulur. Kök sözcüðe eklenebilecek eklerin sayýsýnda bir sýnýrlama yoktur. Bu
nedenle, bir kök sözcükten çok sayýda sözcük üretilebilir. Türkçe, bitiþken bir dildir. Bitiþken
dil kümesi içinde, Macarca, Fince, Moðolca, Japonca gibi diller yer almaktadýr. Bitiþken
dillerde bir sözcük sanki bir tümce gibi olabilir. Örneðin
Almanyalýlaþtýramadýklarýmýzdanmýþ (Almanya lý laþtýr ama dýk lar ýmýz dan mýþ)
1.2.3 Bükümlü Diller
Hint-Avrupa ve Sami dilleri, bükümlü dil yapýsý içinde deðerlendirilmektedir. Hint-Avrupa
dilleri gövde bükümlü ve Sami dilleri kök bükümlü olarak adlandýrýlmaktadýr.
Hint-Avrupa dillerinde, gövde sözcük ön ve son ek alarak yeni anlam kazanýr. Bir gövdeye
eklenen ön ek ve son ek sayýsý genelde biri aþmaz. Dolayýsýyla ekler, gövde sözcüðe kýsýtlý katký
saðlarlar. Ýngilizceden örnek verirsek sözcük ön ek ile olumsuz hale dönüþtürülür: happy
(mutlu), unhappy (mutsuz) son ek alarak nitelik deðiþtirebilir: happy (multlu) happiness
(mutluluk)
Sami dil ailesinde kök sözcük genelde üç ünsüz (ZZZ : Z ünsüz harfi göstermektedir) harften
oluþur. Bu üç ünsüze eklenen ünlü harfler (S : ünlü harfi göstermektedir) sözcüðe yeni anlamlar
kazandýrýr. Arapçadan bir örnek vererek durumu açýklayabiliriz. Kök sözcük ktb olsun, bu kök
harflerin arasýna ünlü harfler eklenerek kitab, katib, kutub, mekteb, mektub, kütübhane
1.2 Dil Yapýlarý – 11
sözcükleri üretilebilmektedir. Bu özellik, Sami dillerine yeni sözcük üretme konusunda önemli
bir yetenek saðlamaktadýr.
1.2.4 Kaynaþtýran Diller
Yaygýnlýðý olmayan bu tür dillerde, eylem tümcenin diðer öðeleri ile kaynaþmaktadýr.
Dolayýsýyla eylem tümcenin tamamý olabilmektedir. Amerika yerlilerinin dilleri bu küme içinde
sayýlmaktadýr.
12 – Dil
Kaynaklar
Tan, Nail “Atatürk ve Türk Dil Kurumu”TDK yayýnlarý:863, 2006
1.2 Dil Yapýlarý – 13
2
Sesbilim
Dilin en temel bileþeni, ses ve bu seslere karþýlýk düþen harflerdir. Ses
üretiminde, ciðerlerimiz körük, gýrlak ve dilimiz ses üretim aygýtý
olarak çalýþýrlar. Sesler, üretiliþ biçimlerine ve üretim yerlerine göre
sýnýflandýrýlýrlar. Sesler için ilk genel sýnýflama;
• Ünlüler (sesliler) ya da ünsüzler (sessizler)
biçiminde yapýlýr. Türkçe abecesinde toplam 29 harf bulunur. Bu
harflerden ” a, e, ý, i, o, ö, u, ü ” ünlü, ” b, c, ç, d, f, g, ð, h, j, k, l, m, n, p, r,
s, þ, t, v, y, z ünsüz olarak adlandýrýlýr. Ünlüler ve ünsüzler çýkýþ
yerlerine ve çýkýþ biçimlerine göre kendi içlerinde alt kümelere
ayrýlýrlar.
Ünlüler, ciðerden gelen hava akýmýnýn, ses yolunda ve aðýzda bir engel
ile karþýlaþmadan çýkardýðý seslerdir. Bu nedenle, ünlülere özgür sesler
de diyebiliriz. Ciðerden gelen hava akýmýnýn, ses telleri süzgeçinden
geçerek oluþturduðu sesleri ünsüz sesler denir. Ünsüzlere, engelli sesler
de denilmektedir.
2.1 Ünlüler
Ünlüler, ses yolunda hiçbir engele uðramadan ses organlarýnýn ortaklaþa iþlemesiyle oluþurlar.
Türkçede ünlüler dilin, alt çenenin ve dudaklarýn aldýklarý durumlara göre üçe ayrýlýrlar.
• Dilin aldýðý duruma göre ya kalýn ya da ince
• Alt çenenin aldýðý duruma göre ya dar ya da geniþ
• Dudaklarýn aldýðý duruma göre ya yuvarlak ya da düz
Dilimizdeki sekiz ünlünün dördü kalýn, dördü ince ünlü olarak kümelenir. Kalýn ünlüler a, ý, o, u
ve ince ünlüler e, i, ö, ü sesleridir. Kalýn ünlüler, aðýzýn geri kýsmýnda üretilirler. Ýnce ünlüler
aðýzýn ön kýsmýnda üretilir.
Ünlülerin ikinci kümeleniþi, bu sesleri çýkarýrken dudaklarýn aldýðý biçime göre yapýlýr. Bu
kümeleme biçiminde a, e, ý, i ünlüleri düz ve o, ö, u, u ünlüleri yuvarlak ünlü olarak
adlandýrýlýr.
Üçüncü küme, çenenin açýklýðýna göre yapýlýr: Geniþ ve dar ünlüler. Çenemizin açýlmasý,
dolayýsýyla aðýz boþluðunun geniþlemesi ile üretilen ünlüler, a, e, o, ö geniþ ünlüler olarak
adlandýrýlýr. ý, i, u, ü ünlülerinin çýkýþý sýrasýnda çene biraz kapalý, dolayýsýyla aðýz boþluðu
dardýr. Bu nedenle bu seslere dar ünlüler denir.
Türkçedeki ünlüler iki türlü kümelenebilir.Tablo-2.1’de kalýn ve ince ünlüler gösterilmiþtir.
Tablo-2.2’de Türkçenin ünlüleri aðýz içinde oluþtuklarý yere göre kümelenmiþlerdir.
Tablo-2.1:Türkçede Ünlülerin Kalýn ve incelik açýsýndan Kümelenmesi
Düz Yuvarlak
Geniþ Dar Geniþ Dar
Kalýn a ý o u
Ýnce e i ö ü
Tablo-2.2:Türkçede Ünlülerin Çýktýklarý Yer Açýsýndan Kümelenmesi
Ön Orta Arka
Düz Yuvarlak Düz Yuvarlak Düz Yuvarlak
Kapalý i ü ý u
Açýk e ö a o
16 – Sesbilim
2.2 Ünsüzler
Oluþumlarý sýrasýnda ses yolunda belirli bir temas, bir engel, bir takýntý ile oluþan seslere
ünsüzler denir. Ünlü seslerde olduðu gibi ünsüzler de aþaðýda gösterildiði gibi bazý kümelere
ayrýlýrlar.
• Ses kiriþlerinin titreþmesine göre sert ve yumuþak ünsüzler
• Ses kiriþlerinden sonra ses yolunun týkalý ya da açýk oluþuna göre sürekli ve süreksiz
ünsüzler
• Sesin çýktýðý yere göre dudak, damak, diþ ve gýrtlak ünsüzleri.
Ünsüzlerin genel durumu Tablo-2.3’de gösterilmiþtir.
Tablo-2.3 Türkçenin Ünsüzlerinin Kümelenmesi
Sert Yumuþak
Sürekli Süreksiz Sürekli Süreksiz
Dudak f p m, v b
Diþ s, þ ç, t j, l, n, r, z c, d
Damak k ð, y g
Gýrlak h
2.3 Türkçenin Ses Kurallarý
Türkçede tüm kurallar seslere iliþkin organlarýn hareketlerine uygun yapýdadýr, herhangi bir
zorlanma durumunda, sözcük içindeki sesler deðiþime uðrar. Bu da Türkçenin seslerinin
kurallarýný izlemeyi kolaylaþtýrmaktadýr. Ünsüzlerin yanyana gelmesi, eklerin ulanmasý ve
yabancý sözcükleri uyarlamada bu kurallara sýkýca uyulur. Türkçenin ses kurallarý, biçimbilim
özeliklerinin belirlemesi bakýmýndan son derece önemlidir.
Ses uyum kurallarýna uyulurken bazý olaðandýþý ses olaylarý ile de karþýlaþýlmaktadýr. Bunlar
aþaðýda belirtilmiþtir.
• Türkçede bulunan ve bulunmayan sesler
• Ses deðiþmeleri
• Ünlü uyumu
• Ünsüz uyumu
2.2 Ünsüzler – 17
2.3.1Türkçede Bulunan ve Bulunmayan Sesler
Türkçe sözcüklerde ünsüzler Bölüm-2.2’de belirtilen kurallarýn yaný sýra aþaðýda açýklanan
kurallara da uyarlar:
• Sonda bulunamayan ünsüzler
• Baþta bulunamayan ünsüzler
2.3.1.1 Sonda Bulunamayan Ünsüzler
Türkçe bir sözcüðün sonunda süreksiz yumuþak ünsüz (b, c, d, g) bulunmaz, böyle sesler
süreksiz sert ünsüzlere (p, ç, t, k) dönüþür. ilac yerine ilaç, kitab yerine kitap denir.
2.3.1.2 Baþta Bulunamayan Ünsüzler
Türkçe sözcüklerin baþýnda “c, f, ð, h, l, m, n, p, r, v, z” sesleri bulunmaz. Ancak doða taklidi
yapan Türkçe þözcükler ve yabancý kökenli sözcükler bu kuralýn dýþýnda kalýrlar.
• “c” sesi Türkçede sadece doða taklidi sözcüklerde kullanýlýr. cývýl cývýl,
cýzýrtý, civciv, ciyaklamak gibi. ”caymak” ve “cici” sözcükleri bu
kurala uymazlar. Cümle, cebir, cuma sözcükleri yabancý kökenlidir.
• “f” sesi ile baþlayan Türkçe sözcük yoktur. Fikir, fasýl, fener, felsefe
gibi sözcükler yabancý dillerden alýnmýþtýr.
• “ð” sesi sözcük baþýnda hiç bulunmaz. Ancak sözcük ortasýnda bulunan bu ses “k-h”
ünsüzlerinin iki ünlü arasýnda kalýp yumuþamasý sonucu ortaya çýkmýþtýr. kàgàð,
hàkàgàð kürekiàküregiàküreði gibi. Kendisinden önceki ünlünün uzun
okunmasýna neden olur.
• “h” sesi ile baþlayan Türkçe sözcük yoktur. Haber, hadise, hafif, hakim gibi
sözcükler yabancý dillerden alýnmýþtýr. Hakan, hatun, hangi sözcükleri Türkçe
sözcüklerdir. Bu sözcüklerin eski halleri K harfi ile baþlar.
• “j” sesi ile baþlayan Türkçe sözcük yoktur. Söz varlýðýmýzda bulunan ve “j” ünsüzü ile
baþlayan sözcükler yabancý dillerden alýnmýþtýr. Örneðin jandarma, jüri, jilet,
jalatin. Bu sözcükler “j” yerine “c” ünsüzü ile de okunur.
• “l” sesi Türkçede sadece doða sözcüklerin baþýnda bulunur. löp löp, lokur
lokur, lýk lýk gibi. Lise, limon, liman gibi sözcükler dilimize yabancý
dillerden girmiþtir.
• “m” sesi Türkçe sözcüklerin baþýnda ancak bozulmuþ tekrarlarda ve doða taklidi
sözcüklerde bulunur. masmavi, mosmor, miyavlamak, mýrýldanmak gibi.
Mektup, melek, mürekkep gibi sözcükler yabancý kökenlidir.
18 – Sesbilim
• “n” sesi Türkçe sözcüklerin baþýnda “ne” ile yapýlmýþ birleþik sözcüklerle doða taklidi
sözcükler dýþýnda kullanýlmaz. ne, neden, niçin, nasýl, ninni, nine
gibi.
• “p” sesi ile baþlayan Türkçe sözcüklerin yoktur. Ancak eski dönemde “b” ünsüzü ile
baþlayan bazý sözcüklerde “pb” ünsüzü “p” ye dönüþmüþtür. Örneðin parmak,
pastýrma.
• “r” sesi sadece doða taklidi sözcüklerde baþta kullanýlýr; rap rap gibi. Roman,
rahip, ramazan gibi sözcükler yabancý kökenlidir.
• “v” sesi Türkçe sözcük baþýnda, doða taklidi sözcüklerle, aslýnda “b” olan ve sonradan
deðiþikliðe uðrayan sözcüklerde kullanýlýr. výzýrtý, výzýldamak gibi.
baràvar, birmekàvermek gibi.
• “z” sesi sadece doða taklidi sözcüklerin baþýnda kullanýlýr. zýr, zonk,
zonklamak, zýrýltý gibi.
2.3.2 Ses Deðiþmeleri
Sonu geniþ düz (a, e) bir ünlü ile biten eylem kök veya gövdelerine -en, -ecek, -erek, -e, -yor
eklerinden biri getirilirse eylem kök ya da gövdesinin sonundaki geniþ düz ünlü dar düz (ý, i)
ünlüye dönüþür. Bu dar düz ünlü iki yuvarlak ünlü arasýna düþerse dar yuvarlak ünlüye (u, ü)
dönüþür. Bu kural -yor eki için hem yazý dilinde hem konuþmada diðerleri ise konuþmada
geçerlidir.
anla+yoràanlýyor,aðla+yoràaðlýyor,dinleàdinliyor,
söyle+yoràsöyliyoràsöylüyor,kokla+yoràkoklýyoràkokluyor,
dinle+erekàdinleyerek (okunuþu dinliyerek’tir.) gibi.
2.3.3 Ünlü Uyumu
Türkçede bir sözcük içinde ünlülerin diziliþi belli kurallara baðlýdýr. Bu kurallar Þekil-2.1’de
gösterilmiþtir.
Kural olarak, ince ünlülerden sonra ince ünlüler, kalýn ünlülerden sonra kalýn ünlüler gelir; buna
büyük ünlü uyumu denir. Ünlüler için bilinen ikinci kural þöyledir: Bir sözcüðün ilk hecesinin
ünlüsü düz ünlülerden biri ise sonraki hecelerin ünlüleri de düz ünlü olur. Ýlk hecesinin ünlüsü
yuvarlak ünlülerden biri ise sonraki hecelerin ünlüleri ya dar yuvarlak ya da düz geniþ
ünlülerden biri olur. Bu kurala da küçük ünlü uyumu denir. Sözcüklere eklenen yapým ve
çekim ekleri de bu kurallara uyarlar.
2.3.3.1 Ünlü Uyumunda Kuralsýzlýklar
Ünlü uyumu kuralýna uymayan durumlar aþaðýda sýralanmýþtýr:
2.3 Türkçenin Ses Kurallarý – 19
• Bileþik sözcüklerde küçük ünlü uyumu aranmaz. Bu sözcüklerde büyük ünlü uyumu
da olmayabilir. kocatürk, karasinek, gecekondu, vatansever gibi.
• Büyük ünlü uyumu, yabancý dillerden dilimize geçmiþ sözcüklere de uygulanarak bu
sözcükler dile katýlmýþtýr. Buna karþýn bir çok yabancý sözcük ünlü uyumuna uymaz.
Bundan baþka yabancý sözcüklere ulanan Türkçe ekler çoðu kez o sözcüklerin son
hecelerindeki ünlülere uyarak ünlü uyumunu sürdürürler: demokrasilerde,
kitaplýk, kalemlik gibi.
• Ancak sonu -ol ya da -alp ile biten yabancý sözcüklere eklenen ekler, sözcüðün son
hecesinde ‘o’ ve ‘a’ kalýn ünlüleri bulunmasýna karþýn ince ünlü içerirler: kalbinde,
alpin, golün, roller gibi.
• Bazý ekler (-yor, -ken, -ki, -leyin, -imtrak, -gil) ünlü uyumuna uymazlar.
akþamleyin, sabahki, koþarken, babamgil, yeþilimtrak gibi.
• Türkçe sözcüklerin pek azý bu kurala uymaz. kavuk, armut, çamur, avuç,
yaðmur gibi.
2.3.3.2 Ünlüler Çatýþmasýnýn Giderilmesi
Dilimizde bileþik sözcükler dýþýnda iki ünlünün yan yana gelmesine izin verilmez. Bu kural iki
þekilde uygulanmaktadýr :
• Bir sözcük sonu ünlü ile biter ve o sözcüðe yine ünlü ile baþlayan bir ek ulanýrsa
sözcük ile ekin arasýna ‘n’, ‘s’, ‘y’, ‘þ’ harflerinden birisi girer. Buna ses türemesi,
kaynaþma denir.
20 – Sesbilim
a
e
u
ü
o
ö
ý
i
Þekil-2.1 : Türkçede ünlülerin uyum kurallarý
kapý+iàkapýyý, bahçe+eàbahçeye, yedi+eràyediþer gibi.
• Sonu ünlü ile biten bir sözcüðe -(H)dH, -(H)mHþ, -(H)sA, -(H)ken ek eylemleri veya
ile ilgeci ulanýr ve birleþik yazýlýrsa bu eklerin “I” leri -y’ye dönüþür.
kapý+ileàkapýyla, yazý+imiþàyazýymýþ gibi.
Eklerin yazýlýþ kalýbýnda aþaðýdaki gösterimler kullanýlmýþtýr:
a veya e için A (Dar yuvarlak-Alçak sesli)
c veya ç için C
d veya t için D
g veya k için G
ý, i, u, ü için H (Dar düz-Yüksek sesli)
yumuþamayan ç için Ç
yumuþamayan k için K
yumuþamayan t için T
2.3.4 Ünsüz Uyumu
• Türkçede ünsüzlerin sözcük içinde diziliþleri de kurallýdýr. Türkçede ünsüz uyumu
sözcüklerde yanyana gelen ünsüzlerin ton bakýmýndan birbirine uygun olmasýna
dayanýr. Bu uyum kuralýna göre :
• Yumuþak ünsüzlerden sonra yumuþak ünsüz veya yumuþak karþýlýðý bulunmayan bir
sert ünsüz gelebilir.
• Yumuþak ünsüzlerden sonra tüm ünsüzler gelebilir.
• Yumuþak karþýlýklarý bulunan sert ünsüzlerden sonra sert ünsüzlerden biri gelebilir.
Bu kurala iliþkin ünsüz sýnýflandýrmasý Tablo-2.4 ve durum gösterimi Þekil-2.2’de verilmiþtir.
Örneðin “toprak” sözcüðü bu kurala uymaktadýr. ‘p’ bir sert ünsüz ‘r’ ise bir sert karþýlýðý
olmayan yumuþak ünsüz olduðundan kurala uyar. Yabancý kökenli sözcükler de bu kurala
uymaya zorlanýrlar. Takdim yerine taktim, tezkere yerine teskere, müsbet yerine
müspet kullanýlýr. Aþaðýda anlatýlacak olan ünsüzler benzeþmesi kuralý da bu uyum kuralýný
desteklemektedir. Bu kural sert karþýlýðý bulunan yumuþak ünsüzlerden biri ile baþlayan eklerin
bu ilk harflerini bu kurala koþut olarak sertleþtirmeyi gerektirmektedir. Örneðin , “kümesde”
deðil “kümeste” doðrudur.
2.3 Türkçenin Ses Kurallarý – 21
Tablo-2.4: Ünsüz Uyumu Ýçin Ünsüzlerin Sýnýflandýrýlmasý
Sert Ünsüzler (SZ) ç, f, h, k, p, s, þ, t
Sert Karþýlýðý Bulunmayan Yumuþak Ünsüzler (YZM) l, m, n, r, y
Sert Karþýlýðý Bulunan Yumuþak Ünsüzler (YZB) b, c, d, g, ð, j, v, z
Bu kuralý destekleyen bir baþka kural da þudur: Türkçede birleþik sözcük ve yer adlarý dýþýnda
‘n’, ‘b’ ünsüzleri yan yana bulunmaz. Bu nedenle “çarþanba” deðil “çarþamba”, “anbar”
deðil “ambar” kullanýlýr. Ancak “Ýstambul” deðil “Ýstanbul” dur.
2.3.4.1 Sözcük ve Hece Sonunda Bulunabilecek Çift Ünsüzler
Türkçede sözcüklerin sonunda iki ünsüz belli kurallara uygun olarak bulunabilir. Türkçede
sözcük ve hece sonunda bulunan ünsüz çiftlerine iliþkin durum Tablo-2.5’te verilmiþtir. Ölç,
kýskanç, kalp, hiþt sözcükleri bu kurala uyarlar.
Sözcük sonunda ikiden fazla ünsüz bulunmaz.
Tablo-2.5: Hece ve Sözcük Sonunda Çift Ünsüz Kuralý
ilk harf ikinci harf
l ç, k, p, t
n ç, k, t
r ç, k, p, s, t
s t
þ t
22 – Sesbilim
SZ YZM YZB
Þekil-2.2: Türkçede ünsüzlerin uyum kuralý
2.3.4.2 Yanyana Gelebilecek Ünsüz Sayýsýna Ýliþkin Kurallar
Türkçede sözcük baþýnda birden fazla ünsüz bulunamaz. Ancak yabancý dillerden alýnmýþ bazý
sözcüklerde bu durum oluþabilir; tren ve stratosfer örneklerinde olduðu gibi. Yine
Türkçede sözcük içinde üçten fazla ünsüz yanyana bulunamaz ancak yabancý sözcüklerle
oluþturulan bileþik sözcüklerde bu durum görülebilir.
2.3.4.3 Süreksiz Sert Ünsüzlerin Yumuþamasý
Süreksiz sert ünsüzlerle (p, ç, t, k) biten sözcüklere ünlü harflerle baþlayan bir ek ulandýðýnda
sert ünsüzler yumuþar ve (b, c, d, g) ‘ye dönüþür. Bu kural uygulandýðýnda gözlenen ses
dönüþümleri ve örnekleri aþaðýda verilmiþtir.
• pàb : dolapàdolabý, kitapàkitaba gibi
• çàc : taçàtacý, yamaçàyamacý gibi
• tàd : gitàgidiþ, seyretàseyreden gibi
• tàdd : cetàceddimiz gibi
• tàt : sepetàsepeti, atàatý gibi
• tàtt : setàsetti, hatàhattý gibi
• kàk : gecikàgecikiþ, aþkàaþka gibi
• kàkk : hakàhakký gibi
• kàð : sokakàsokaðý, açýkàaçýða gibi
• kàg : renkàrengi gibi
k ünsüzü iki ünlü arasýna düþerse k, kk, ð olur. Aksi durumda g’ye dönüþür. Eylemlerin
sonundaki k ünsüzü g’ye, adlarýn sonundaki k ünsüzü ð’ye dönüþür. Ancak bazý aykýrý
durumlar söz konusu olabilir:
Tek heceli sözcüklerin çoðu bu kurala uymazlar.
• iç, ok, sap, et, kaç, kýrk, dik, yat, ak, kork, üç, kat gibi.
Bazý yabancý sözcükler bu kurala uymazlar.
• aþk, gayret, ehemmiyet, merhamet, hukuk, millet, not gibi.
2.3.4.4 Ünsüz Benzeþmesi
Ünsüzlerin benzeþmesinde iki kural bulunmaktadýr:
1. Kural: Sert ünsüzlerden biri ile sonlanan bir sözcüðe yumuþak ünsüzlerden biri ile baþlayan
bir ek ulandýðýnda yumuþak ünsüz sertleþir.
2.3 Türkçenin Ses Kurallarý – 23
kebap+ciàkebapçý, kümes+deàkümeste gibi
Ancak özel adlara ulanan -dA, -dAn, -dHr, -dH ekleri ünsüzler benzeþmesine uymaz.
Ahmet’den, Siirt’de gibi.
2. Kural: Türkçe bir sözcüðün sonunda süreksiz yumuþak ünsüz (b, c, d, g) bulunmaz. Böyle
sesler süreksiz sert ünsüzlere (p, ç, t, k) dönüþür.
• b sessesi sözcük sonunda bulunmaz. Eski devirlerde kullanýlanlar da
deðiþtirilmiþlerdir.
ebàev, sabàsav gibi.
• Sözcük ve hece sonunda bulunan d sesi günümüzde t ya da y’ye dönüþmüþtür.
kodàkoy gibi.
• Hece ve sözcük sonunda bulunan g sesleri günümüzde yerini k, ð, y ve v ünsüzlerinden
birine býrakmýþtýr.
dögàdöðàdöv, ögàöðàöv, begàbey gibi.
Türkçe olmayan bazý sözcüklere de bu kural uygulanmýþtýr. ilacàilaç,
kitabàkitap, ahengàahenk, derdàdert gibi.
Bu kurala aykýrý durumlar da görülmektedir.
• Anlam karýþýklýðýna sebep olacak bazý sözcüklerde bu deðiþiklik yapýlmamýþtýr.
ad-at, od-ot, sac-saç, kalb-kalp, harb-harp, haç-hac gibi.
• Sadece yabancý dilden geçmiþ sözcüklerin sonunda g ünsüzü bulunabilir. diyalog,
radyolog, arkeolog gibi
2.4 Ses Düþmeleri
Türkçede, bazý seslerin düþtüðü bilinmektedir. Bu durumlar aþaðýda açýklanmýþtýr.
2.4.1 Orta Hece Düþmesi
Birinci hecesi açýk (ünlü harfle biten) ikinci hecesi kapalý (ünsüz harfle biten) bazý iki heceli
sözcüklerde ünlüyle baþlayan bir yapým veya çekim ekinin sözcüðün orta hecesinin ünlüsünün
düþürmesi olayýdýr. Bu ses olayýnýn meydana geldiði durumlarý aþaðýdaki gibi
sýnýflandýrabiliriz.
• Organ adlarý: alýn, aðýz, burun, omuz, baðýr, göðüs, karýn, boyun. burun+iàburnu
gibi.
• Akraba adlarý: kayýn, oðul. oðul+iàoðlu gibi.
24 – Sesbilim
• Yabancý soylu sözcüklerden bazýlarý: fikir, zikir, þükür, asýr, sabýr, akýl, usul, gönül.
gönül+iàgönlü gibi.
• Bazý eylem kökleri: devir-, kývýr-, çevir-, ayýr-, sýyýr-, kavur-, savur-, yayýl-.
kavrul+ulàkavrul gibi.
• Bu eylem köklerine -i, -ik, -im türetme ekleri veya -il edilgenlik eklerinden biri
getirildiðinde bu kurala uyarlar. yayýl+imàyaylým, devir+iàdevri,
sýyýr+ýkàsýyrýk gibi
2.4.2 Diðer Ses Düþmeleri
Baþka bazý nedenlerden dolayý da ses düþmeleri görülebilir. Bunlar aþaðýda örnekleri ile
açýklanmýþtýr:
• Sonu ünlü harflerden biri ile biten sýfat köklerine addan eylem yapma eki -Al ulanýrsa
yapým ekinin ünlüsü düþer. ince+elàincel, kýsa+alàkýsal,
doðru+elàdoðrul gibi.
• Bu yapým eki sonu “k” ile biten sýfat köklerine ulanýrsa kendi ünlüsü dýþýnda sýfattaki
“k” ünsüzini de düþürür. alçak+elàalçal, yüksek+elàyüksek,
küçük+elàküçül gibi.
• Sonu ünlü harflerden biri ile biten sýfat köklerine addan eylem yapma eki -Ar ulanýrsa
sýfat kökünün son sesi düþer. sarý+aràsarar-, kara+aràkarar- gibi.
• Sonu ünsüz ile biten sýfat köklerine addan eylem yapma eki -Ar ulanýrsa sýfat kökünün
son sesi ve sonrasý (genellikle ‘l’)düþer. kýzýl+eràkýzar-,
yeþil+eràyeþer- gibi.
2.5 Heceler
Seslerin öbekleþmesiyle heceler ve sözcükler oluþur. Bir solukta çýkan bir tek ya da bileþik sese
hece denir. Her ses hecenin bir öðesidir. Hecelerin anlamlý olmasý gerekmez; nitelikleri bir
solukta söylenebilmeleridir. E/li/miz/de/ki/ler/den.
Bir sesin boðumlanmasýnda üç basamak olduðu gibi bir hecenin boðumlanmasýnda da üç
basamak vardýr. Türkçede her hecede bir tek ünlü bulunur. Her ünlü kendinden önceki ünsüzü
kendi hecesi içine alýr. Bir sesin boðumlanmasý Þekil 2-3 te gösterilmiþtir.
2.5.1Türkçenin Heceleri
Türkçede altý temel hece yapýsý bulunmaktadýr. Ses kurallarý bu hece yapýlarýna izin
vermektedir. Buna göre Türkçe hecelerin içinde en az bir, en çok dört ses bulunabilir. Hece
yapýlarý aþaðýda verilmiþtir. (S : ünlü ve Z : ünsüz harfi göstermektedir.)
2.5 Heceler – 25
• Bir ünlüden meydana gelen hece yapýsý ( S ) : o
• Bir ünlü ve bir ünsüzden meydana gelen hece yapýsý ( SZ ) : al
• Bir ünsüz ve bir ünlüden meydana gelen hece yapýsý ( ZS ) : ye
• Bir ünlü, bir ünsüz ve bir ünlüden meydana gelen hece yapýsý ( SZS ) : gök
• Bir ünlü ve iki ünsüzden meydana gelen hece yapýsý ( SZZ ) : alt
• Bir ünsüz, bir ünlü ve iki ünsüzden meydana gelen hece yapýsý ( ZSZZ ) : Türk
Bir ünlü ile biten hecelere açýk hece ünsüz ile biten hecelere ise kapalý hece denir. Türkçede tek
heceli sözcükler de bu altý biçimden birine uymak zorundadýr. Tek heceli kök sözcüklerin çoðu
birer kapalý hecedir. Al, vur, sev, at, kuþ, aþ gibi.
Þekil 2-4’te, hecelerdeki ses iniþ ve çýkýþlarý modellenmiþtir. Þekilden görüldüðü gibi, Türkçede
doruðun solunda ancak bir, saðýnda ise en çok iki ünsüz bulunur.
Türkçede bazý sözcüklerin hece yapýlarý bu altý tipe uymaz, bunlar yabancý sözcüklerdir. Gram,
tren, kravat, Slav, Slovak … gibi.
26 – Sesbilim
S S S S S S
Z Z Z Z Z Z Z
Z Z
Þekil 2-4: Hecelerdeki ses iniþ ve çýkýþlarý
A L A C A Ð I M
Þekil 2-3: Bir sesin boðumlanmasý
2.6 Türkçenin Sesbilim Teknik Özellikleri
Bu bölüm içinde, Türkçe bir sözcük içinde ünlü ve ünsüzlerin belli kurallara göre dizildiði
anlatýlmýþtýr. Ünlü ve ünsüzlerin belli kurallara göre diziliþleri, Türkçeye þu özelikleri
kazandýrmaktadýr:
Kulaða Hoþ Gelme
Sözcük içinde ünlü ve ünsüzlerin kurallý olarak dizilmesini, bir müzik eserindeki
notalarýn diziliþine benzetebiliriz. Piyano tuþlarýna geliþigüzel bastýðýmýzda çýkan
sesler kulaðýmýza hoþ gelmez. Buna karþýn, bir müzik eserini çalmaya baþladýðýmýzda,
herkesin hoþuna giden bir ses oluþur. Çünkü, müzik eserinde, notalar belli bir düzen
içinde dizilirler. Türkçede, ünlü ve ünsüzlerin belli kurallara uygun olarak dizilmiþ
olmasý, Türkçenin kulaða hoþ gelmesini saðlar.
Enerji Sakýnýmý
Türkçede ünlü ve ünsüzlerin diziliþindeki kurallar, ses organlarýmýzýn yapýsýnýn doðal
sonucudur. Ses organlarýmýzý yormadan ve zorlamadan ses çýkarmak istediðimiz
zaman, ünlü ve ünsüz kurallarýna uymamýz gerekir. Bu açýdan deðerlendirdiðimizde,
Türkçe enerji sakýnýmlýdýr diyebiliriz, Türkçe konuþan bir insanýn çenesi yorulmaz.
Türkçe sesbilimi ile ilgili bazý istatistiksel veriler, dilin teknik özelliklerini yansýtmaktadýr.
Ünlü, Ünsüz Kullaným Sýklýðý
Türkçe ünlü sesler açýsýndan zengin olduðu bilinmektedir. Türkçede ünlü harfler diðer
dillere oranla daha çok kullanýlýr. N. M. Yusuf tarafýndan gerçekleþtirilen bir
çalýþmanýn sonucu Tablo-2.6’da gösterilmiþtir.
Tablo-2.6: Türkçede Harflerin Kullaným Sýklýðý
En sýk rastlanan ünlü harfler a, i, e, ý
Orta sýklýkta rastlanan ünlü harfler u, o ,ü
En az rastlanan ünlü harfler ö
En sýk rastlanan ünsüz harfler r, n, l, k ,d, y
Orta sýklýkta rastlanan ünsüz harfler m, t, s, þ, z, h
En az rastlanan ünsüz harfler g, t, ð, v, c, p, f, j
2.6 Türkçenin Sesbilim Teknik Özellikleri – 27
Bu çalýþmanýn sonuçlarýna göre Türkçede kullanýlan ünlü seslerin tüm harflere oraný
%43,36 ünsüzlerin oraný ise %56,64 tür. Bu sonuç, Türkçede ünlülerin kullaným
oranýnýn yüksek olduðunu göstermektedir. Diðer dillerde yapýlan araþtýrmalarda
bulunan deðerler Tablo 2.7′ de görülmektedir.
Tablo 2.7 Deðiþik Dillerin Ünlü ve Ünsüz Kullaným Oranlarý
Diller Ünlü Harf Kullaným sýklýðý
(%)
Ünsüz Harf Kullaným sýklýðý
(%)
Romence 49,4 49,74
Ýtalyanca 47,74 52,27
Fransýzca 43,42 56,58
Türkçe 43,36 56,64
Macarca 41,91 58,09
Ýsveççe 41 59
Çekçe 40,73 59,13
Almanca 38,86 61,14
Ýngilizce 37,4 62,6
2.7 Sözcükler
Anlamý ya da cümlede bir dilbilgisi görevi bulunan bir ya da birkaç heceli ses kümeleridir. Her
sözcük bir anlam taþýr. Türkçe, sesbilim açýdan deðerlendirildiðinde, sözcüklerin rastgele
türetilemeyeceði açýktýr. Ses uyum kurallarý, hece yapýlarý bir sözcüðü türetirken etkin olurlar.
Akla þöyle bir soru gelebilir: “Türkçenin ses kurallarýna uygun olarak yapay sözlük
oluþturulabilir mi?” Bu soruya karþýlýk bulmak amacýyla yapýlan bir çalýþmanýn sonuçlarý
aþaðýda tanýtýlmýþtýr: Türkçe metinler üzerinde yapýlan incelemeler sonunda, kök sözcüklerin
ortalama boyunun yaklaþýk beþ olduðu görülmüþtür. Þekil-2.5’te kök sözcüklerin boy uzunluðu
verilmiþtir.
Bir baþka incelemede, sözcüklerin ilk ve son harfleri araþtýrýlmýþtýr. Buna göre elde edilen sonuç
Þekil-2.6 ve Þekil-2.7’de verilmiþtir.
Bölüm-2.5’te açýklandýðý gibi, Türkçede altý tür hece yapýsý bulunmaktadýr: S, SZ, SZZ, ZS,
ZSZ, ZSZZ. Tek ve iki heceli olasý sözcükleri oluþturmak amacýyla gerçeklenen çalýþmanýn
sonuçlarý oldukça ilginçtir. Tek heceden oluþan sözcüklerin yapýlarý;
[S] (o), [SZ] (at), [SZZ] (üst), [ZS] (su), [ZSZ] (tam), [ZSZZ] (Türk)
28 – Sesbilim
ve iki heceden oluþan sözcüklerin hece yapýlarý þöyledir:
[S + ZS] ( aba), [S + ZSZ] (ocak), [S + ZSZZ] (avurt)
[SZ + ZS] (ayna), [SZ + ZSZ] (aþkýn), [SZ + ZSZZ] (aldanç)
[ZS + ZS] (baba), [ZS + ZSZ] (tabak), [ZS + ZSZZ] (kazanç)
[ZSZ + ZS] (bohça), [ZSZ + ZSZ] (bostan), [ZSZ + ZSZZ] (baþkurt)
Sonuç olarak iki heceden oluþan Türkçe sözcükler 18 türlü kurulabilir. Bu arada, bu bölümde
anlatýlan temel ses özelliklerine ek olarak aþaðýdaki temel kurallar unutulmamalýdýr:
• Üç ünsüz yanyana olamayacaðýndan SZZ ve ZSZZ hece türleri ilk heceyi oluþturamaz.
• Ýki ünlü yanyana gelmez dikkate alýnmýþtýr.
2.7 Sözcükler – 29
1110
966
235
443
775
499 456 508
0
589
89
697
17
1802
266
1092
250 282 230
711
300
1148
264
1243
145 96
222
464
181
0
200
400
600
800
1000
1200
1400
1600
1800
2000
a b c ç d e f g ð h ý i j k l m n o ö p r s þ t u ü v y z
Þekil-2.6: Ýlk harflerine göre Türkçe sözcüklerin istatistik sonuçlarý
0
500
1000
1500
2000
2500
3000
3500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Harf sayýsý
Sözcük
sayýsý
Þekil-2.5: Türkçedeki sözcük uzunluðunu gösteren istatistik çalýþmanýn sonucu
• Ayný hecede iki ünsüz harf varsa bu ünsüz harf çifti aþaðýdakilerden biridir. “lç, lk, lp,
lt, nç, nk, nt, rç, rk, rp, rs, rt, st, þt”
• “j” Türkçe kökenli sözcüklerde bulunmaz o yüzden ünsüzler içine alýnmasý gerekmez.
• “ð” ile baþlayan Türkçe sözcük yoktur. Eðer ünsüz ile biten bir heceye ünsüz ile
baþlayan bir ek geliyorsa o zaman ikinci hece “ð” ile baþlamaz.
• Heceler oluþturulurken sert ünsüzlerin benzeþmesi kuralý uygulanmalýdýr.
• “o” harfi sadece sözcüðün ilk hecesinde olabilir.
• Ünsüz ile biten heceye ünlüyle baþlayan ek geldiðinde bunlar ayný harf olamaz.
Tüm bu kurallara uygun olarak oluþturulan sözlükte bulunan sözcüklerin sayýsý Tablo-2.8’de
verilmiþtir.
Tablo-2.8: Ýki heceli sözcüklerin sayýsý
Sözcük yapýsý Sözcük sayýsý Sözcük yapýsý Sözcük sayýsý Sözcük yapýsý Sözcük sayýsý
S 8 SZS 342 ZSZS 6498
SZ 128 SZSZ 5202 ZSZSZ 98838
SZZ 112 SZSZZ 4788 ZSZSZZ 90972
ZS 152 SZZS 4914 ZSZZS 88794
ZSZ 2312 SZZSZ 74574 ZSZZSZ 1347534
ZSZZ 2128 SZZSZZ 68796 ZSZZSZZ 1243116
Ýki heceli sözcüklerin sayýsýnýn grafiði Þekil-2.8’de verilmiþtir. Tablo-2.8’e dikkat edilirse,
Türkçede iki heceden oluþan toplam 3.039.208 sözcük olabilir. Yapay olarak oluþturulan bu
sözlük incelendiðinde þu yorumlar yapýlabilir:
30 – Sesbilim
1554
20 2
319
80
1432
212
22 56 126
511
841
72
1467
693
1154
1550
207
4
110
1359
410
253
1357
204 126 56 126
448
0
200
400
600
800
1000
1200
1400
1600
1800
a b ç d e f g c ð h ý i j k l m n o ö p r s þ t u ü v y z
Þekil-2.7: Son harflerine göre Türkçe sözcüklerin istatistik sonuçlarý
Ýkinci hece olarak ZSZZ kalýbýný kullanan Türkçe sözcüklerin sayýsý yüksek görünmekte, ancak
bu kalýba uyan sözcüklere dilimizde az rastlanmaktadýr. Bu kalýba uyan tüm sözcükler yok
sayýldýðýnda bile iki heceli sözcüklerin sayýsý 1.636.324 olmaktadýr.
2.8 Sesçil Abece
Türkler, tarihlerinde deðiþik abeceler kullanmýþlardýr. Bunlar sýrasýyla Köktürk, Uygur, Arap ve
Latin temelli Türk abecesidir. Latin temelli Türk abecesi 1928 yýlýnda kullanýlmaya
baþlanmýþtýr. Latin temelli Türk abecesinin kullanýlmasýna karar verildiðinde, sesçil olmasýna
özen gösterilmiþtir. Sesçil yazým yönteminde, her sese karþýlýk tek bir harfin düþürülmesi temel
ilkedir.
Günümüz Türk abecesi, olabildiðince sesçil sayýlsa da, özelikle yabancý dillerden alýnmýþ
sözcüklerin seslendirilmesinde sýkýntý yaþanmaktadýr. Örneðin; kar ve hala sözcükleri en çok
bilinen sorunlu örneklerdir. Bu sözcüklerin farklý anlamda kullanýmlarý uzatma iþaretleri ile
giderilebilmektedir. Kar (donarak yaðan su buharý), kâr (ticarette elde edilen fayda), hala
(babanýn kýz kardeþi), hâlâ (þimdiye kadar). Kar ve kâr örneklerinde, þapka ” a ” sesini
inceltirken, hâlâ sözcüðünde hem inceltme hem de uzatma iþlevini yerine getirmektedir.
Her dilde bulunan sesler için geçerli olacak bir abece IPA (International Phonetic Association)
tarafýndan hazýrlanmýþtýr. Benzer bir sesçil abece SAMPA’dýr (Speech Assessment Methods
Phonatic Alphabet). IPA’nýn yüzyýl kadar geçmiþi olmasý nedeniyle (baþlangýcý 1886)
bilgisayara uyumluluðu düþünülmemiþtir. SAMPA bu açýðý kapatmak üzere düzenlenmiþtir.
Her iki abecede de bir sesi uzatmak için harfin peþine “:” konulmaktadýr. Örneðin uzatýlacak “a”
2.8 Sesçil Abece – 31
0
200000
400000
600000
800000
1000000
1200000
1400000
1600000
S S
Z
S Z Z
ZS
ZS Z
ZS Z Z
S Z
S
S Z
S Z
S Z
S Z Z
S Z Z
S
S Z Z
S Z
S Z Z
S Z Z
ZS ZS
ZS Z
S Z
ZS Z
S Z Z
ZS Z ZS
ZS Z Z
S Z
ZS Z Z
S Z Z
Hece çeþidi
Sözcük
sayýsý
Þekil-2.8: Hece türlerinin istatistik sonuçlarý
için “a:” yazýlmaktadýr. Türkçe harflerin IPA ve SAMPA karþýlýklarý Tablo-2.9 ve
Tablo-2.10’da verilmiþtir.
Dildeki seslerin bilinmesi, yazýlý bir metni seslendirme iþleminde gerekli olmaktadýr. Bu
konunun iþlendiði bölümde, konu ayrýntýlý biçimde ele alýnacaktýr.
Tablo-2.9: Türkçenin Ünlüleri ve Bunlarýn IPA ve SAMPA Karþýlýklarý
Türk
abecesi
IPA
abecesi
SAMPA
abecesi Özellik Örnek
a
a A geniþ, düz, artdamaksýl aný
a a geniþ, düz, öndamaksýl laf
e
e e geniþ, düz, öndil : kaplý elma
e E geniþ, düz, öndil : açýk dere
ý ^ ý dar, düz, arkadil ýsý
i
i i dar, düz, öndil : açýk iðde
ý I dar, düz, öndil : kapalý simit
o
d O geniþ, yuvarlak, arkadil : açýk soru
o o geniþ, yuvarlak, arkadil : kapalý oðlak
ö
É 2 geniþ, yuvarlak, öndil : açýk örtü
f 5 geniþ, yuvarlak, öndil : kapalý öðren
u
U u dar, yuvarlak, arkadil : açýk kulak
u u dar, yuvarlak, arkadil : kapalý uður
ü
Y y dar, yumuþak, öndil : açýk ümit
y y dar, yumuþak, öndil : kapalý düðme
32 – Sesbilim
Tablo-2.10: Türkçenin Ünsüzleri ve Bunlarýn IPA ve SAMPA Karþýlýklarý
Türk
abecesi
IPA
abecesi
SAMPA
abecesi Özelik Örnek
b b b ötümlü, patlamalý, çift dudak bal
c dz dz ötümlü, sýzýcý, dil ve ön damak cam
ç tI tS ötümsüz, sýzýcý, dil ve ön damak çam
d d d ötümlü, patlamalý, dilucu dýþarýda dede
f f dar, düz, arkadil fasýl
g
gj dar, düz, öndil : açýk genç
g dar, düz, öndil : kapalý karga
h h dar, düz, öndil : kapalý hasta
j Z geniþ, yuvarlak, arkadil : açýk müjde
k
k geniþ, yuvarlak, arkadil : kapalý akýl
c geniþ, yuvarlak, öndil : açýk kedi
l
l geniþ, yuvarlak, öndil : kapalý kul
L dar, yuvarlak, arkadil : açýk leylek
m m dar, yuvarlak, arkadil : kapalý dam
n n dar, yumuþak, öndil : açýk aný
p p dar, yumuþak, öndil : kapalý ip
r
r ötümlü, çok vuruþlu, dilucu ve diþeti raf
R ötümlü, tek vuruþlu, dilucu ve diþeti ýrmak
4 ötümsüz, sýzýcý bir
s s ötümsüz, sýzýcý, dilucu ve diþeti ses
þ S ötümsüz, sýzýcý, dil ve öndamak aþý
t t ötümsüz, patlamalý, dilucu dýþarýda ütü
v
v ötümlü, sýzýcý, dudak ve diþ var
w ötümlü sýzýcý tavuk
y j ötümlü, dil ve öndamak yat
z
z ötümlü, sýzýcý, dilucu ve diþeti azýk
zz ötümsüz, sýzýcý, dilucu ve diþeti yoz
2.8 Sesçil Abece – 33
3
Biçimbilim
Biçimbilim bir dilin sözcük yapýlarýný, türetme yollarýný, çekim
biçimlerini inceleyen dilbilgisi koludur. Her sözcüðün bir ses yapýsý ve
bir de biçimi vardýr.
Diller biçimbilim açýsýndan incelendiðinde, bazý diller için söylenecek
fazla birþey bulunamazken Türkçe için söylenecek çok söz vardýr.
Türkçe bir sözcük ele alýndýðýnda, ilk göze çarpan özelliði, ses
kurallarýna uygunluðudur. Bunun ardýndan hece yapýsýnýn uygunluðu
göze çarpar. Türkçe bitiþken bir dil olmasý nedeniyle bir sözcük kök ve
eklerden oluþur. Köke gelecek eklerin eklenmesi iþleminde de geçerli
kurallar vardýr. Tüm bu özellikler göz önüne alýndýðýnda, Türkçenin
biçimbilimsel özellikleri konusunda söylenecek çok þeyin olduðu
anlaþýlmaktadýr.
Türkçede kullanýlan ekler dile çok geniþ bir sözcük türetme yeteneði
kazandýrýr. Bu nedenle, Türkçeyi bilmek için ekleri bilmek gerektiðini
söyleyen çok sayýda dil bilimciye rastlanýr.
– 35
3.1 Kökler ve Ekler
Türkçe bitiþken ya da diðer bir deyiþle eklemeli bir dildir. Türkçede ekler kökten sonra gelir ve
sayýsýnda bir sýnýr yoktur. Eklerin sayýsýnda sýnýr olmamasý nedeniyle sözcük türetme açýsýndan
oldukça üretken bir dildir. Öncelikle bitiþken bir dil oluþu, eklerin kabarýk sayýsý ve eklerin
ulandýklarý sözcük çeþidine göre sözcüðe çok farklý anlamlar katabilmesi Türkçenin
çözümlenmesini karmaþýklaþtýrmaktadýr. Ancak diðer yandan ona önemli bir esneklik ve
zenginlik kazandýrmaktadýr.
Sözcüklerde biçim yapýsý bakýmýndan iki birim bulunmaktadýr.
• Anlamlý birimler
• Anlamsýz veya görevli birimler
3.1.1 Anlamlý Birimler
Anlamlý birimler kök veya gövde olabilir. Kök, bir sözcüðün anlamý ve yapýsý bozulmadan, daha
küçük parçalara ayrýlamayan kýsmýdýr. Kökler bir dilde önceden var olan sonradan
uydurulmayan ses birlikleridir ve türetmenin temel taþlarýdýr.
Öztürkçede, köklerin genellikle birer heceli olduðu bilinmektedir. Bununla birlikte günümüz
Türkçesinde iki ve üç heceli kökler de bulunmaktadýr. Ancak üç heceli sözcüklerin sayýsý
oldukça azdýr.
Kökler anlamlarý bakýmýndan ad (isim) soylu ve eylem soylu olmak üzere iki temel sýnýfa
ayrýlýrlar:
Ad Soylu Kökler
Bir nesne ya da nitelik adý olan, ya da bir ilgi, bir duygu bildiren köklerdir. Örneðin
göl bir nesne adý, yeþil bir renk adý, güzel bir nitelik adý, sen bir ilgi adý, ah bir
duygu bildirme adýdýr. Bir baþka deyiþle, ad kökleri; ad, sýfat, adýl, belirteç, ilgeç,
baðlaç, ünlem gibi sözcüklerin kökleridir.
Eylem Soylu Kökler
Bir eylemin adý olan köklerdir. Geç- geçme eyleminin adý, beze- bezeme eyleminin
adý, yýka- yýkama eyleminin adýdýr.
Ad ve eylem köklerinin ortak özelikleri þunlardýr:
• Bir kök ya ad ya da eylem köküdür.
• Ad kökleri sözcük içinde ya da tek baþlarýna kullanýlabilirler. Eylem kökleri ise tek
baþlarýna kullanýlamazlar.
36 – Biçimbilim
• Türkçede baþtaki hecenin yinelenmesi dýþýnda bütün kökler daima sözcük baþýnda
bulunur, sözcük ortasýnda ya da sonunda bulunamazlar.
• Bileþik sözcüklerin her altsözcüðünün ayrý bir kökü olduðu unutulmamalýdýr.
• Ad kökleri genellikle bir nesnenin adý, eylem kökleri ise bir nesne ile oluþmuþ bir
eylemin adýdýr. Bu yüzden, ad kökleri kendi baþlarýna eylem kökleri ise bir nesne ile
bulunurlar.
3.1.2 Anlamsýz Birimler
Anlamsýz birimler eklerdir. Bunlar sözcük türetmekte ya da sözcüklere durum, ilgi, nicelik, kip,
zaman ve kiþi ile ilgili birer anlam katmakla görevli dilbilgisi öðeleridir. Dilbilgisi
açýklamalarýnda ekleri göstermek için, ekin çeþitli biçimleri arasýndan ünlü harfi yanlýzca “e”,
“i” ve bu ek ünsüz harfle baþlýyorsa bu harfin hem yumuþak hem de sert ünsüzü varsa yumuþak
olanýný söylemek ve yazmak gerekir.
Ekler genellikle büyük ve küçük ünlü uyumuna uyarlar ve ses olaylarýna (sert ünsüzlerin
yumuþamasý ve yumuþak ünsüzlerin sertleþmesi) duyarlýdýrlar. Bu nedenle ve ayrýca
algoritmalarýn oluþturulmasýnda ve gerçekleþtirilmasinda bir esneklik ve kolaylýk saðlayacaðý
görülerek bir gösterilim oluþturulmuþtur. Eklerde kullanýlan gösterimler aþaðýda açýklanmýþtýr:
a veya e için A (Dar yuvarlak-Alçak ünlü)
c veya ç için C
d veya t için D
g veya k için G
ý, i, u, ü için H (Dar düz-Yüksek ünlü)
ý, i I
yumuþamayan ç için Ç
yumuþamayan k için K
yumuþamayan t için T
( ) içerisindeki harf duruma göre kullanýlabilir ya da
kullanýlmayabilir
3.1 Kökler ve Ekler – 37
3.2 Sözcük Çeþitleri
Yapý bakýmýndan sözcükler üçe ayrýlýr:
Kök Durumundaki Sözcükler
Parçalandýðýnda anlamý ve yapýsý bozulan bir ya da birkaç heceli sözcüklerdir.
Dil,el, keþ, göz, sarý, ak, ben, kalk(mak), yat(mak),
koþ(mak), aðaç, kadýn, çiçek, kelebek…vb.
Türemiþ Sözcükler (Gövdeler)
Ad kök ya da gövdelerine ad ya da eylem kök veya gövdelerinden yapým ekleriyle
üretilmiþ sözcüklerdir. Birlik, birey, birli, birden, birer,
bireysel, biricik, birik(mek), birikinti, birim, birinci,
birleþ(mek), birleþim, birlikte, çalýþtýr(mak),
çalýþýl(mak), çalýþtýrýl(mak), çalýþkan, kunduracý,
kunduracýlýk…vb.
Birleþik Sözcükler
Ýki ya da daha çok sözcüðün birleþip kaynaþmasýndan oluþan yeni anlamdaki
sözcüklerdir. Aðaç/kakan, imam/bayýldý, haným/eli, Çanak/kale,
beþ/býyýk, bir/takým, yüz/baþý, açýk/göz, hiç/biri,
Afyon/kara/hisar…vb.
Anlam bakýmýndan sözcükler bir takým bölümlere ayrýlýr: Amlam bakýmýndan sözcük
çeþitleri þunlardýr: adlar, sýfatlar, adýllar, belirteçler, ilgeçler, baðlaçlar, ünlemler,
eylemler.
Türkçede bulunan sözcükler öncelikle ad soylu ve eylem soylu olarak ikiye ayrýlýrlar.
Ad soylular kendi içinde yedi türe bölünürler.
Ad soylular
• Ad
• Sýfat
• Adýl
• Belirteç
• Ýlgeç
• Baðlaç
• Ünlem
Eylem soylular
• Eylem
38 – Biçimbilim
3.3 Adlar
Varlýklarý ya da eylemleri bildiren sözcüðe ad ya da isim denir. Sokak, bulut, düþünce,
Osman, Ayþe birer varlýk adý, uyumak, gülüþ, anlatma ise birer eylem adýdýr. Adlar
çeþitli açýlardan bazý kümelere ayrýlabilir.
Varlýklara veriliþlerine göre adlar özel ad ve cins ad olarak ikiye ayrýlýrlar.
Özel ad
Bir tek varlýða , bir tek kavrama verilmiþ olan addýr. Ýnsan adlarý ve unvanlar ile yer
adlarý özel adlarý oluþturur. Göztepe, Asya, Çalýkuþu, Türkiye, Hünkar
Suyu, Büyük Millet Meclisi …vb.
Cins ad
Ayný cinsten varlýklar ve kavramlara verilen ortak adýdýr. Kuþ, aðaç, yemiþ,
yaprak, insan, hayvan, baþ, ruh, zeka, serçe, kartal, pençe,
kanat birer cins dir.
Varlýklarýn oluþlarýna göre isimler soyut ve somut ad olarak ikiye ayrýlýrlar.
Somut ad
Nesne durumundaki kavramlara verilen addýr. Koku, soluk, renk, bitki,
Ankara, çiçek, aðaç, ot, toprak, rüzgar ..vb.
Soyut ad
Nesne durumunda bulunmayan ancak var oluþlarýný zihnimizde kavrayabildiðimiz
kavramlara verilen addýr. Sevinç, anlayýþ, üzüntü, acý, çocukluk,
cesaret, zeka, sevgi …vb.
Varlýklarýn sayýlarýna göre adlar tekil ve çoðul ad olmak üzere ikiye ayrýlýr.
Tekil ad
Adýn tek varlýða ya da kavramý anlatan biçimidir. Kedi, çiçek, insan,
sevinç, üzüntü, duygu, toprak …vb.
Çoðul ad
Adýn birden çok varlýðý ya da kavramý anlatan biçimidir. Kediler, çiçekler,
insanlar, sevinçler, üzüntüler, duygular, topraklar…vb.
3.3 Adlar – 39
Topluluk adlarý
Çoðul eki almadýklarý halde, birden çok birey ya da nesneden oluþan topluluðu belirtir.
Sürü, dizi, takým, ordu, bölük..vb
Olaðan durumlarda, özel adlar çoðul eki almazlar. Ancak çoðul eki aldýklarýnda, yakýnlýk veya
benzerlik belirtir. Mehmetler, Ýsmet Ýnönüler.. vb
3.3.1 Adýn Durumlarý
Adlar tümce içinde görevlerine ve genellikle eylemle olan iliþkilerine göre;
• Yalýn durum (nominative) ev
• “(y)H” (i durumu – accusative : belirtme durumu) evi
• “(y)A” (e durumu – dative : yönelme durumu) eve
• “-DA” (de durumu – locative : bulunma durumu) evde
• “-DAn” (den durumu – ablative : uzaklaþma durumu) evden
• “-(n)Hn” (in durumu – genetive : tamlayan durumu) evin
çekim eklerinden birini alýrlar. Adlarýn bulunabilecekleri bu altý durumdan her birine adýn
durumlarý denir. Yalýn durum, doðal olarak ek almaz; eylemi yapan ya da yapýlaný gösterir. Kim
sorusuna yanýt olduðundan kim durumu olarak da adlandýrýlýr.
Ali okula gitti
Kitap kayýp oldu
Ev yýkýldý
Belirtme durumu, eylemden doðrudan etkilenme ve ilgi durumunu yansýtýr. Kim ve neyi
sorularýnýn yanýtýný oluþturduðundan, kimi durumu olarak da adlandýrýlýr.
Okulu gördüm
Kitabý buldum
Evi göremiyorum
Yönelme durumu, br nesneye yönelme ya da girme durumunu belirtir. Kime ve nereye
sorularýnýn yanýtýdýr. Bu nedenle kime durumu olarak da bilinir.
Okula gittim
Ali’ye gidiyorum
Eve gidiyorum
40 – Biçimbilim
Bulunma ya da kalma durumu olarak adladýrýlan durum, bir yerde bulunma ya da kalma
durumunu gösterir. Nerede ve ne zaman sorularýnýn yanýtýdýr. Kimde durumu olarak da bilinir.
Okulda kaldýk
Akþam yedide gidiyorum
Evde uyudum
Uzaklaþma ya da çýkma durumu, uzaklaþýlan, ayrýlýnan ya da çýkýlan bir yeri gösterir. Nereden
ve kimden sorusuna yanýt verir. Bu nedenle kimden durumu olarak da adlandýrýlýr.
Okuldan geliyorum
Ayþe’den ayrýldým
Evden koþarak geldim
Tamlayan durumu, bir adýn ilgili olma durumunu gösterir. Kimin ve neyin sorusuna yanýt verir.
Kimin durumu olarak da anýlýr.
Ayþe’nin evi güzeldir
Okulun camýný kýrdýrlar
Evin bacasý yýkýldý
Eþitlik durumu belirten “ce” ekinin de, adlarýn durumu olarak yorumladýðýgörülmektedir.
Ancak bu ekin kullanýmý, önce tanýtlan ekler kadar geçerli deðildir. Cansýzlara iliþkin adlar için
kullanýlamaz. Bu ek nasýl sorusuna yanýt verir.
Güzelce bir çocuk
Hava bugün daha iyice
Bence bu ders kolay
3.3.2 Ad Durumlarýnda Ses Benzeþmesi
Adlara durum ekleri eklenirken, Türkçenin ses uyum kurallarýna uyulur. Bir ünsüz ile biten cins
adlar durum eklerini ünlüler uyumu ve ünsüzler benzeþmesine göre alýrlar.
evi, avý, küpü, suçu
eve, ava, küpe, suça
evde, avda, küpte, suçta
evden, avdan, küpten, suçtan
evin, avýn, küpün, suçun
Ünlü harfle biten cins adlar ise i ve e durumlarýnda (y) kaynaþtýrmasýný alýrlar.
3.3 Adlar – 41
iðneyi, tarlayý
iðneye, tarlaya
3.3.3 Ad Tamlamalarý
Ýki ad arasýnda iyelik ilgisi kurmak amacýyla oluþturulan ad öbeklerine ad tamlamalarý denir.
Ad tamlamalarý tanýmlayýcý öðe olan birinci öðeye tamlayan (belirten), ana öðeye yani ikinci
öðeye tamlanan (belirtilen) denir. Pencerenin camý örneðinde, pencerenin tamlanan ve
camý tamlayandýr. Ad tamlamalarý, belirtili ad tamlamalarý ve belirtisiz ad tamlamalarý olmak
üzere ikiye ayrýlýr.
Belirtili Ad Tamlamasý
Belirtileni söz söyleyen ve dinleyence bilinen ve belirteni ile belirtileni arasýnda geçici
bir ilgi bulunan tamlamalardýr. Bu tamlamalarda belirten “-in” eki ve belirtilen “-i”
eki alýr. Her iki ek de ünlü uyumu ve ünsüzler benzeþmesine baðlý olarak ulanýr.
kýzýn eldiveni, kuyu(n)un kova(s)ý, çocuðun bisikleti,
kapý(n)ýn zili…vb.
Belirtisiz Ad Tamlamasý
Belirtileni söz söyleyen ve dinleyen tarafýndan belirli olmayan ve belirteni ile
belirtileni arasýnda sürekli bir bað bulunan tamlamadýr. Belirten ek almaz ve belirtilen
“-i” eki alýr. Bu ek de ses uyumu kurallarýna uygun olarak ulanýr. Ev duvarý, kapý
zili, kuyu kova(s)ý, çocuk bisikleti, dað tepe(s)i …vb.
Bir de zincirleme ad tamlamalarý bulunmaktadýr. Belirtileni ya da belirteni veya her
ikisi ad tamlamasý olan ad tamlamalarýna zincirleme ad tamlamalarý denir.
Dilbilgisi kitabý(n)ýn kabý, okulun bahçe kapý(s)ý, adamýn
kýzkardeþi(n)in sokak elbise(s)i …vb.
3.3.4 Yapýlarýna Göre Adlar
Adlar yapýlarýna göre üçe ayrýlýrlar.
Kök Adlar
Yapýlarý ve anlamlarý bozulmadan parçalanamayan bir ya da birkaç heceli adlardýr.
Kuþ, taþ, göz, aðaç, gölge, çiçek, kelebek …vb. Dilimizde kök adlarýn
çoðu tek hecelidir, bununla birlikte iki ya da daha çok heceli olanlar da vardýr.
42 – Biçimbilim
Türemiþ Adlar
Ad ya da eylem kök ya da gövdelerine ya da yansýma sözcüklere bir takým yapým ekleri
getirilerek yapýlan adlardýr.
Bileþik Adlar
Ýki ya da daha çok sözcüðün aralarýna bir ek ya da baðlaç giremeyecek kadar birleþip
kaynaþmasýndan oluþan yeni anlamdaki addýr. Uzunköprü, Taþkasap,
sivrisinek, tahtakurusu, dedikodu, balkabaðý …vb.
3.4 Sýfatlar
Bir adý, nitelik, nicelik, yer ve sýra bakýmýndan niteleyen, belirten sözcüklere sýfat ya da ön ad
denir. Mavi gök, beyaz bulutlar, birinci sýnýf, bir milyon insan, altýþar
elma …vb. Sýfatlar niteleme ve belirtme sýfatlarý olarak temel iki kümeye ayrýlýrlar. Bu temel
sýfat kümeleri kendi içlerinde alt kümelere ayrýlýrlar.
3.4.1 Niteleme Sýfatlarý
Adlarý niteleyen sýfatlar bu kümeye girer.
Temiz ev, uzun deðnek, kara toprak, süzgeçli bahçe kovasý,
Büyük evin büyük kapýsý …vb.
Verilen örneklerden de görüldüðü gibi, sýfatlar niteledikleri adlardan önce yer alýrlar. Niteleme
sýfatlarý kendi içlerinde,
• Karþýlaþtýrma sýfatlarý
• Pekiþtirme sýfatlarý
• Küçültme sýfatlarý
• Unvan sýfatlarý
olarak dört alt kümeye ayrýlýrlar.
3.4.1.1 Karþýlaþtýrma Sýfatlarý
Varlýklarýn birbiriyle karþýlaþtýrýlmasýný saðlayan sýfatlardýr. Türkçede, karþýlaþtýrma için üç
derece bulunmaktadýr: iyi, daha iyi ve en iyi.
Güzel kýz, Ayþe kadar güzel kýz
Daha güzel kýz, Ayþeden daha güzel kýz
En güzel kýz
3.4 Sýfatlar – 43
3.4.1.2 Pekiþtirme Sýfatlarý
Bir adýn derecelendirilmesinde en üst düzeyi vurgulamak için kullanýlan sýfat türüdür. Var olan
sýfatlardan, kurallara uygun olarak türetilirler. Pekiþtirme sýfatý türetilirken, asýl sýfatýn önüne
m, p, r, s ünsüzü ile bitan bir hece eklenir:
m beyaz bembeyaz
yeþil yemyeþil
sýcak sýmsýcak
p acý apacý
dar dapdar
ýslak ýpýslak
r temiz tertemiz
çýplak çýrçýplak
s mavi masmavi
mor mosmor
koca koskoca
3.4.1.3 Küçültme Sýfatlarý
Bir varlýðýn derecelendirilmesinde, küçültmeye gidilmesi durumunda kullanýlan sýfatlardýr. Bu
sýfatlar, var olan sýfatlara eklenen eklerle oluþturulurlar: Küçültme ekleri þunlardýr:
– cA : -ca, -ce
-cHk : -cýk, -cik, -cuk, -cük
-HmsH : -ýmsý, -imsi, -umsu
-HmtHrak : -ýmtýrak, -imtýrak, – umtýrak
Küçültme ekleri kullanýlarak üretilmiþ sýfatlardan bazý örnekler aþaðýda verilmiþtir:
ak : akca, mavi: mavice
ufak : ufacýk, iri : iricik, kuru : kurucuk, küçük: büçücük
sarý : sarýmsý, mavi : mavimsi, mor : morumsu
sarý : sarýmtýrak, yeþil : yeþilimtýrak, mor : morumturak
44 – Biçimbilim
3.4.1.4 Unvan Sýfatlarý
Birey adlarý önüne konulan, meslek, unvan ve saygý bildiren sýfatlardýr.Unvan sýfatlarý, adlardan
önce ve sonra gelebilirler.
Bay Ahmet
Sayýn Adalý
Prof. Dr. A. Kaya
Ahmet bey
Ayþe haným
3.4.2 Belirtme Sýfatlarý
Adlarý göstererek, sayarak, sorarak belirten sýfatlardýr. Bu sýfatlar kendi içlerinde alt kümelere
ayrýlýrlar:
• Ýþaret sýfatlarý
• Sayý sýfatlarý
• Belgisiz sýfatlar
• Soru sýfatlarý
3.4.2.1 Ýþaret sýfatlarý
Adlarý iþaret eden sýfatlardýr. Temelde, bu, þu ve o sözcüklerinden oluþur.
Bu kalem, beriki adam, böyle iþ,öbür gün, öte taraf …vb
3.4.2.2 Sayý sýfatlarý
Adlarý nicelik açýsýndan niteleyen sýfatlardýr. Sayý sýfatlarý, asýl sayý sýfatlarý, sýra sayý sýfatlarý ve
üleþtirme sayý sýfatlarý olarak sýnýflanýrlar.
Asýl Sayý Sýfatlarý : on iki ay, yüz milyon lira, iki çocuk …vb.
Sýra Sayý Sýfatlarý : birinci kat, altýncý ev, sonuncu aday,ilk gelen
…vb.
Kesir Sayý Sýfatlarý :yarým ekmek,çeyrek ekmek, yüzde elli pay,yarý
yol …vb.
Üleþtirme Sayý Sýfatlarý : birer portakal, iki yüzerlira,altýþar
kalem, ikiþer bin lira …vb.
3.4 Sýfatlar – 45
3.4.2.3 Belgisiz sýfatlar
Adlarý kesin biçimde nitelemeyen sýfatlardýr.
bazý insanlar, kimi yazarlar, birçok öðrenci, bir adam, çoðu
görevli, baþka çözümler, bütün anneler …vb.
3.4.2.4 Soru sýfatlarý
Adlarý soru açýsýdan niteleyen sýfatlardýr.
kaç insan, hangi varlýk, nasýl kaðýt, ne kadar asker, neredeki
ev, ne gün …vb.
3.4.3 Sýfat Tamlamalarý
Sýfat tamlamasý bir adla bir sýfattan oluþan takýmdýr. Bazý insanlar, altýncý ev,
evdeki saat, on iki öðrenci, hangi iþ … gibi.
3.4.4 Yapýlarýna Göre Sýfatlar
Yapýlarýna göre sýfatlar üçe ayrýlýr:
• Basit sýfatlar
• Türemiþ sýfatlar
• Bileþik sýfatlar
Basit Sýfatlar
Yapýsý ve anlamý bozulmadan parçalanamayan bir ya da birkaç heceli sýfatlardýr. Bol
ýþýk, kara tahta, yumuþak huy, sert buðday, dar yol …vb.
Türemiþ Sýfatlar
Ad veya eylem kök ve gövdelerine yapým ekleri ulanarak yapýlan sýfatlardýr.
Addan türetilmiþ sýfatlar: Askerce selam, boyacý iþçi, evcil hayvan,
tavada yumurta, kýrçýl sakal, candan arkadaþ, kocaman ev
Eylemden türetilmiþ sýfatlar: duyulmadýk söz, ödünç para, kýzgýn kapak,
kesici silah, buruþuk yüz, dökme demir, geçmiþ günler,
görünmez kaza…vb.
46 – Biçimbilim
Bileþik Sýfatlar
Canciðer arkadaþ, camgöz ihtiyar, çenebaz çocuk, uluslararasý
gerginlik, vurdumduymaz adam, baþýbozuk kalabalýk …vb.
3.5 Adýllar
Tümcelerde gerektikçe adlarýn yerini tutan onlara elçilik eden sözcüklere adýl denir. Ben,
siz, kim, bu …vb. Adlar varlýklarý tanýmlayan sözcüklerdir, adýllar ise varlýklarýn adý
deðil o adlara geçici olarak elçilik eden, onlarýn yerini tutan sözcüklerdir. Adýllarýn kendi
baþlarýna anlamlarý yoktur, tümcelerin dýþýnda hiçbir kavramý doðrudan doðruya vermezler.
Adýl hangi ismin yerini tutuyorsa anlamý o adla ilgisi sýrasýnda belirir, kavranýr.
Adýllar dört kümeye ayrýlýr:
Kiþi Adýllarý : ben,siz,sen,siz,o,onlar,kendi.
Ýþaret Adýllarý :bu, þu, o, bunlar, þunlar, onlar, bura (bu ara), ora
(o ara), þura (þu ara), buracýk, þuracýk, oracýk.
Soru Adýllarý : kim, kaçý, kaçýmýz, kaçýnýz, hangisi, hangileri,
hangimiz, hanginiz,ne.
Dönüþlü Adýllar : Kemdim, kendin, kendisi, kendimiz, kendiniz,
kendileri
Belgisiz Adýllar: herkes, kimse, biri, hepsi, birtakýmý, baþkasý,
bazýsý, bazýlarý, herbirimiz, kimisi, kimileri, birkaçý, her
birimiz, her biri, birçoðu …vb.
3.5.1 Ek Durumundaki Adýllar
Ýyelik Adýllarý
Belirtileni kiþi adýlý olan ad takýmlarýnda belirtilene ulanan ve o belirtilenin ben,
sen, o, biz, siz, onlar’dan biri ile ilgisi ve iliþkisi bulunduðunu anlatan
eklerdir. Ýyelik ekleri þunlardýr:
1. tekil kiþi : “-(H)m”: ev-im, çanta-m …
2. tekil kiþi : “-(H)n” : iþ-in, iðne-n …
3. tekil kiþi : “-(s)H”: iðne-si, iþ-i …
1. çoðul kiþi : “-(H)mHz” : ev-imiz, sopa-mýz . . .
3.5 Adýllar – 47
2. çoðul kiþi : “-(H)nHz” : baþ-ýnýz, Çaký-nýz …
3. çoðul kiþi : “-lArH” : ev-leri, okul-larý …
Ýlgi Adýllarý
Bir belirtili ad takýmýndan, kaldýrýlmýþ olan bir belirtilenle ilgisini göstermek üzere
belirtilene ulanan “-ki” ekine denir. Elif’in kitabý temizdir, Cem’inki kirlidir, onlarýn
evi ahþaptýr sizinki kagir. “ki”” eki ünlü uyumuna aykýrý olarak ulanýr.
3.6 Belirteçler
Bir sýfatýn, bir eylemin ya da bir baþka belirtecin önüne gelerek onun anlamýný nitelik, nicelik,
durum ve zaman bakýmýndan tanýmlayan sözcüðe belirteç denir. Bunlar tek baþlarýna ad
olmalarýna karþýn sözcük kümesi içindeki iþlevlerine göre belirteç adýný alýrlar. Örneðin;
Daha sýcak süt.
belirteç sýfat
Bakarak yazdý.
belirteç eylem
Belirteçler çekimsiz unsurlardýr. Ad olduklarý durumda çekim eki almalarýna karþýn, belirteç
durumuna girince yanlýzca durum ve yer bildiren ekler alabilirler. Bu ekler ise eþitlik-benzerlik
(equative), araç (instrumental), ve yön (directive) bildiren eklerdir. Bunlardan “-cA”,
“-cAsHnA” eþitlik, “-n” araç, “-rA”, “-ArH” yön ekleridir. Bu ekler ilgeç iþlevindedir ve
çekim ekleri içinde belirteç yapým ekleri gibi görünürler.
Kardeþçe atýþtýlar.
Kýþýn gidecek.
Dýþarý çýkmadý.
Belirteçler özelikle eylemlerin anlamlarýný belirlemek için kullanýlýr. Bunun için belirteçlere
eylemlerin sýfatýdýr denebilir. Belirteçler bu görevi yaparken yanýndaki tümce öðesine çekimsiz
olarak doðrudan baðlanýrlar. Eðer belirteç özeliðindeki sözcükler eyleme sözü edilen ekler
dýþýnda ek almadan baðlanmýþsa belirteç aksi halde ad öðesi olarak kalýr.
“Dýþarýya çýk. Ýleriye git. Bahçede gez.” tümcelerindeki sözcükler ad öðeleridir.
48 – Biçimbilim
3.6.1 Belirteçlerin Çeþitleri
Belirteçlerin beþ türü bulunmaktadýr.
• Yer Belirteçleri
• Zaman Belirteçleri
• Durum Belirteçleri
• Azlýk Çokluk Belirteçleri
• Soru Belirteçleri
Yer Belirteçleri
Eylemin yönünü gösterirler. Yön ekleri ile adlardan türetilen bazý belirteçler de bu
sýnýfa girer. ileri, içeri, dýþarý, beri, alt, yan, karþý, doðru,
kadar yön belirteçleridir.
Zaman Belirteçleri
Bunlar çeþitli zaman adlardýr. Dün, yarýn, þimdi, gece, gündüz, er,
geç, erken, demin, daha, akþam, sabah, artýk, sonra… zaman
belirteçleridir. Araç eki “-n” eki ile yapýlan yazýn, kýþýn, güzün, ilkin
sözcükleri ile önce sözcüðü de bu gruba girer. Belirteçler eþitlik, yön ve araç ekleri
dýþýnda ek alamazlar ancak bazý hallerde bu kurala aykýrý olmasýna raðmen sözcüðün
tümüyle belirteç olduðu görülmektedir. Örneðin; Sabahlarý uðrar. Akþamlarý
gelir. Önceden almýþtý. tümcelerinde bu eklerin asýl fonksiyonlarýný
kaybetmiþ ve kalýplaþmýþ olduklarýna dikkat edilmelidir.
“-dAn beri” ve “-A kadar”, “dA bir”, yapýlarýyla da zaman belirteçleri oluþturulabilir.
Dün geceden beri gelmedi. Akþama kadar uyudu. Haftada bir
temizliyor.
Arapça ve Farsçadan Türkçeye geçmiþ bir çok sözcük zaman belirteci olarak
kullanýlmaktadýr. Örneðin, hep, henüz, hemen, derhal, nihayet … gibi.
Durum Belirteçleri
Tüm durum ve tavýr anlatan adlar bu gruba girdiði için sayýlarý çok fazladýr. Bunlarýn
dýþýnda eþitlik ve araç ekleri alarak nasýllýk ve nicelik belirtme durumuna gelen adlar
de durum belirteci olarak kullanýlýrlar. Ýyice inceledi. Çocukça
düþünüyorsun.
3.6 Belirteçler – 49
Durum ve tavýr anlatan niteleme sýfatlarý da belirteç olarak kullanýlýr. Ýyi yaptý.
Yavaþ geçti. Doðru yaz. Güzel giyin. O böyle düþünüyor. O öyle
olmalý.
Azlýk Çokluk Belirteçleri
Bunlar miktar ve derece bildirirler. En, daha, pek az, çok, biraz, kadar …
gibi sözcükler bu kümeye girer. Bunlar dýþýnda yabancý dillerden dilimize geçmiþ bazý
azlýk çokluk ifade eden belirteçler vardýr. Fazla, gayet, fevkalade,
harikulade bu tür sözcüklerdir.
Soru Belirteçleri
Bir eylemin, belirtecin veya sýfatýn anlamýný belirleyen, sýnýrlayan belirteçlerdir. Ne,
nasýl, niçin, nereden, nice, hani, ne kadar bu kümeye giren
sözcüklerdir. Sen buraya nereden düþtün? Niçin bizi aradýn?
Buraya nasýl geldiniz?
3.7 Ýlgeçler
Tümcede sözcük ya da sözcük öbekleri arasýnda ilgi kuran anlam ve görevi tümce içinde
birlikte bulunduðu sözcüklerle beliren öðelere ilgeç denir. Karþý, kadar, için, yana,
dolayý, ile, dek, deðin, gibi, üzere sözcükleri bu kümeye girerler.
Baðlaçlarýn daha çok tümceleri birbirine baðlama görevinde bulunmasýna karþýn ilgeçler sadece
sözcükler arasýnda ilgiler kurarlar, genel olarak baðlama görevinde bulunmazlar. Yine baðlaçlar
sözcük kümesi oluþturmamalarýna karþýn ilgeçler sözcük kümeleri oluþtururlar. Örneðin ad ve
adýllarla tamlama oluþtururlar, taþ gibi elma, gece kadar karanlýk kümelerinde
olduðu gibi.
Ýlgeçlere en yakýn sözcük çeþidi belirteçlerdir. Çünkü ilgeçler yükleme baðlandýklarýnda
ilgeçlikten çýkýp belirteç olurlar.
3.8 Baðlaçlar
Eþ görevli ya da birbirleri ile ilgili sözcük ya da sözcük kümelerini ya da tümceleri birbirine
baðlayan öðelere baðlaç denir. ile, ancak, bile, oysa, oysaki, gerek ..
gerek, çünkü, hatta, yani bu tür sözcüklerdir. Bazý ilgeç ve belirteçler baðlaç olarak
kullanýlabilir.
50 – Biçimbilim
3.9 Ünlemler
Korku, sevinç, üzüntü, hasret, acýma, gibi duygularý ifade eden sesleniþleri karþýlayan veya doða
taklidi sesleri yansýtmaya çalýþan sözcüklere ünlem denir. Ünlem tümcelerinin sonuna her
zaman “!” iþareti konur. Aman!, Bire!, Eyvah!, Hey!, Ey!, Þýkýr þýkýr!,
Vah!, Ah!, Yaþasýn! … gibi.
Türkçede bu özelliðe sahip sözcüklerle kiþi adlarý, emir, dua kavramý taþýyan sözcükler de
ünlem görevinde bulunabilir. Bu nedenle Türkçede ünlem olarak kullanýlan sözcükleri üç
kümede toplayabiliriz :
Doðrudan doðruya ünlem olarak kullanýlan sözcükler, Ay!, Of!, Ah!, Tüh!,
Hey!, Haydi!, Kuçukuçu!, Eyvah!, Hiþt! ..vb.
Ünlem olmuþ sözcükler, Allah!, Hoppala!, Pes!, Alçaklar!, Nefis!
Arkadaþlar!, Varol!, Dur!…vb.
Yansýma sözcükler, Pist!, Tak!, Tuk!, Çat!, Pat!, Paldýr küldür!,
Hav hav! …vb.
Ünlemler ad cinsinden sözcükler olduklarýndan tümcede iyelik, çokluk gibi ad çekim eklerini
de alýrlar, ahý, ahýný, vahlarý, oflarýnýn …gibi.
Ünlemlerin tümcede belli bir yerde bulunma koþulu yoktur, tümcenin baþýnda, sonunda ya da
tümce içinde herhangi bir yerde bulunabilirler.
Ey aziz Ýstanbul !
Býktým bu hayattan yahu !
Onu öyle ah görmez olaydým !
Ünlemler baþka sözcük yürlerinin görevlerini yüklenmezler. Ad, sýfat, belirteç ya da ilgeçlerin
yerine kullanýlmazlar.
3.10 Eylemler
Adlar, sýfatlar ve adýllar canlý ya da cansýz varlýklarý niteleyen ve belirten sözcüklerdir.
Eylemler, varlýklarýn yaptýklarý iþleri zamana biçime ve kiþiye baðlayarak anlatan sözcüklerdir.
Her eylem bulunduðu tümcenin temelidir. Her eylemde zaman, biçim ve kiþi kavramlarý
kaynaþmýþ durumdadýr. Örneðin, döndürdüm eyleminde döndür- eylem gövdesi, -dü di’li
geçmiþ zaman eki, -m de 1.tekil kiþi ekidir. Eylemler, temel olarak;
• iþ : yemek, içmek, okumak
• oluþ : doðmak, oluþmak, büyümek
• hareket : koþmak, yüzmek, gelmek
3.9 Ünlemler – 51
• durum : üzülmek, uyumak, korkmak
bildirirler.
3.10.1 Eylem Yapýsý
Bir eylem kök ve ekten oluþur. Eylemsi ya da mastar , eylem kök ya da gövdelerinin -mek eki
almýþ halidir. Gitmek, koþmak, selamlamak … gibi. Çoðu kez eylemsi eki “-” ile
gösterilir. git-, otur-, okutabil-, düþeyaz- … gibi. Bu örneklerde görülen git,
otur eylem köküdür.
Eylem köküne yapým ekleri eklenebilir. Böylece eylem gövdeleri elde edilir. Örneðin yaz-,
yazýl- (yazmak, yazýlmak) gibi.
Türkçede eylem kökleri daha küçük parçalara bölünemez. Buna karþýn, eylem gövdeleri
bölünebilir. Ayrýca eylem kökleri deðiþikliðe uðramaz.
3.10.2 Eylemlerde Kiþi
Eylem kiþi ve zaman bilgisini içerir. Eylemlerde kiþi, eylemi gerçekleþtiren varlýktýr. Kiþi
adýllarýnýn yerini tutmak için eylemlere gerekli ekler ünlü uyumuna uygun olarak ulanýr.
Türkçede üç tip kiþi eki bulunmaktadýr. Kiþi ekleri Tablo-3.1 de verilmiþtir.
Tablo-3.1: Kiþi Ekleri
Kiþi 1. Eylem türü 2. Eylem türü 3. Eylem türü 4. Eylem türü
1. tekil -m -(y)Hm -(y)Hm (yok)
2. tekil -n -sHn (yok) –
3. tekil – – – -sHn
1. çoðul – -(y)Hz -lHm (yok)
2. çoðul -nHz -sHnHz (yok) -(y)Hn / (y)HnHz
3. çoðul -IAr -lAr (yok) -sHnlAr
3.10.3 Eylem Kipleri
Kip, eylem kök ve gövdelerinin zaman ve biçimlerine göre türlü eklerle girdikleri kalýplara
denir. Geldi sözcüðünde gel- eylem kökü di’li geçmiþ zaman eki alarak zaman kalýbýna
dökülmüþtür. Türkçede bütüm eylemler iki ana kipte toplanmýþtýr.
Bildirme Kipleri, bir eylemin yapýldýðýný, yapýlmakta olduðunu, yapýlacaðýný bildiren kiplerdir.
Bildirme kipleri beþe ayrýlýr:
52 – Biçimbilim
1. -di’li geçmiþ zaman : -di eki ile gerçeklenir.
2. -miþ’li geçmiþ zaman : -miþ eki ile gerçeklenir.
3. Þimdiki zaman : -(i)yor eki ile gerçeklenir.
4. Gelecek zaman : -ecek eki ile gerçeklenir.
5. Geniþ zaman : -(i)r eki ile gerçeklenir.
Dilek Kipleri, istenilen ya da tasarlanýlan bir eylemi tanýmlayan kiplerdir. Bu kiplerde doðrudan
zaman anlamý yoktur.
Gereklilik kipi : -meli eki ile gerçeklenir.
Ýstek kipi : -e eki ile gerçeklenir.
Dilek-koþul kipi : -se, -sin ekleri ile gerçeklenir.
Emir kipi : eki yoktur yalýn haldeki eylem emir kipindedir.
3.10.4 Eylemlerin Olumluluk ve Olumsuzluk Biçimi
Ýþin yapýldýðýný anlatan eylemlere olumlu eylemler (gittim, gezdik, okuyalým …gibi),
yapýlmadýðýný anlatan eylemlere olumsuz eylemler (gitmedim, gezmedik, okumayalým
… gibi.) denir. Olumlu bir eylemi olumsuz yapmak için ünlüler uyumuna uygun olarak -me eki
ulanýr.
3.10.5 Eylemlerin Soru Biçimi
Eylemlerin yapýlýp yapýlmadýðýný soran biçimlerdir. Bir eylemin soru biçimi ünlü uyumuna
uygun olarak “mi” ilgeciyle yapýlýr. mi ilgeci eylemden ayrý yazýlýr, ancak ünlü uyumuna uyar.
Örneðin, -geldi mi?, yazacak mýsýnýz?, okuyalým mý?, görmüþler mi?
3.10.6 Ek Eylem (Ana Yardýmcý Eylem)
Yukarýda belirttiðimiz bütün kiplere bir eylem hariç tüm eylemler girer. Ek eylem ya da
yardýmcý eylem denilen bu eylem ise sadece -di’li geçmiþ zaman, -miþ’li geçmiþ zaman ve koþul
kipine girebilir. Bu eylem sözü edilen kiplerin ekleri ile birleþerek birleþik eylemlerin temelini
oluþturur, öte yandan adlarý eylemleþtirerek ad tümcelerini ortaya çýkarýr. Bu eyleme birleþik
eylem yapmaya yaradýðý için ana yardýmcý eylem adý verilir. Tek baþýna kullanýlamayan ek
eylem yapým eki almadýðý için bu eylemden baþka bir eylem türetilemez. Ancak yanýna geldiði
eylem ya da adlar sayesinde anlam kazanýr.
3.10 Eylemler – 53
Ek Eylemin Þimdiki Zamaný
Sözcüklerle ortaya çýkan bir çekim olmayýp birleþtiði adla birlikte ortaya çýkan bir
çekimdir. Bu eylemin þimdiki zamanýna geniþ zaman da denebilir.
sýnýfta-y-ým -Hm
sýnýfta-sýn -sHn
sýnýfta-dýr -dHr
sýnýfta-y-ýz -Hz
sýnýfta-sýnýz -sHnHz
sýnýfta-dýrlar -dHrlAr
Ek Eylemin Di’li Geçmiþ Zamaný
“i” eylemine -di’li geçmiþ zaman kipi eklenir.
i-di-m, i-di-n, i-di, i-dik, i-di-niz, i-dir-ler
Günümüzde ünsüz ile biten adlardan sonra bu zaman eki eklendiðinde asýl eylem
düþürülür. Ses uyumu kurallarýna uyar. beyaz i-di / beyaz-dý, güzel
i-di-n / güzel-di-n , kalýr -i-dým / kalýr-dým…gibi. Ünlü ile biten
adlardan sonra ekleþme tam olmaz, bu durumda ek eylemin yerine “y” ünsüzü gelir.
kara i-di / kara-y-dý, kötü i-di / kötü-y-dü gibi.
Ek Eylemin Koþulu
Diðer eylemlerden farklý deðildir.
yorgun i-se-m yorgun-sa-m
yorgun i-se-n yorgun-sa-n
yorgun i-se yorgun-sa
yorgun i-se-k yorgun-sa-k
yorgun i-se-niz yorgun-sa-nýz
yorgun i-se-ler yorgun-sa-lar
Ek Eylemin Miþ’li Geçmiþ Zamaný
Diðer eylemlerde olduðu gibidir.
(y)H-mHþ-HM hasta-y-mýþ-ým
(y)H-mHþ-sHn hasta-y-mýþ-sýn
54 – Biçimbilim
(y)H-mHþ hasta-y-mýþ
(y)H-mHþ-Hz hasta-y-mý-þýz
(y)H-mHþ-sHnHz hasta-y-mýþ-sý-nýz
(y)H-mHþ-lAr hasta-y-mýþ-lar
Ek Eylemin Olumsuzu
“-mA”, olumsuzluk eki ile yapýlmaz. Bunun yerine “deðil” ilgeci kullanýlýr.
Olumsuzluk taþýyan bu ilgeç ek eylemin getirileceði ismin sonuna getirilir ve ilgeçten
sonra da ek eylemin çekilmiþ þekli getirilir.
güzel deðil i-miþ güzel deðil-miþ
yorgun deðil i-se-niz yorgun deðil-se-niz
korkak deðil-im
3.10.7 Eylem Çatýsý
Eylemlerin nesne ve öznelerine göre gösterdikleri özeliklere Eylem Çatýsý denir. Bu bakýmdan
eylem çatýsýný iki kümede incelemek gerekmektedir.
1. Özneleri bakýmýndan eylemler,
2. Nesneleri bakýmýndan eylemler.
3.10.7.1 Özneleri Bakýmýndan Eylemler
Eylemler özneleri bakýmýndan dört ayrý özelik gösterirler. Bu özeliklere göre eylemleri dört
kümede toplamak olanaklýdýr.
Etken Eylemler
Bu kümeye giren eylemlerin belirli birer özneleri vardýr. Bu eylemlerin öznesi
durumunda olan nesne veya varlýk belli bir iþ yapmaktadýr.
Bahçeye çýkýnca seni gördü.
Aðaçlar bahar gelince yeþerdi.
Görme ve yeþerme iþini yapan özneler bellidir. Bu tür eylemler gerçek özne alýrlar.
3.10 Eylemler – 55
Edilgen Eylemler
Edilgen çatýlý eylemlerde eylemin gösterdiði iþi yapan deðil, ondan etkilenen bulunur,
buna da sözde özne denir. Bu gruba giren eylemler “-(H)l” edilgenlik eki ve -ve
eðer “l” ünsüzi ile bitiyorsa “-(H)n” dönüþlülük eki alarak türemiþlerdir.
Araba uzaktan seç-il-iyor.
Camlar temizle-n-di.
Dönüþlü Eylemler
Öznenin, eylemin karþýladýðý iþi kendi kendine yaptýðý veya yaptýðý iþten etkilendiði
eylemlerdir. Eylemden eylem türeten eklerden asýl ek iþlevi iþteþlik olan “-(H)þ” eki,
asýl dönüþlülük eki olan “-(H)n” eki ve edilgenlik eki olan “-(H)l” eki ile eylemlerden
türetilirler.
Elbisemi giy-in-dim.
Kadýn tiyatroya giderken süsle-n-di.
Mahmut yanýmda dik-il-di.
Dönüþlü eylemlerin öznesi bellidir. Çünkü hareket ya da eylemin etkisi doðrudan ya
da dolaylý olarak özneye yönelmektedir.
Ýþteþ Eylemler
Eylemin gösterdiði hareketin birden fazla özne tarafýndan birlikte veya karþýlýklý
yapýldýðýný gösteren eylemlerdir. Eylemden eylem yapma eki olan “-(H)þ” eki ile
türetilirler : sözl-eþ-, döv-üþ- .
Onlar kaza yerine koþ-uþ-tular.
Ýki çocuk döv-üþ-üyordu.
Burada koþuþmak ve dövüþmek hareketleri bir kiþi tarafýndan deðil daha fazla kiþi
tarafýndan ya birlikte ya da karþýlýklý yapýlmaktadýr. Bu nedenle bunlara Ýþteþ eylemler
denir.
3.10.7.2 Nesnelerine Göre Eylemler
Tümcede nesne alýp almamalarýna göre eylemler dörde ayrýlýrlar :
• Geçiþli eylemler
• Geçiþsiz eylemler
• Oldurgan eylemler
• Ettirgen eylemler
56 – Biçimbilim
Geçiþli Eylemler
Tümcede nesne alan eylemlerdir. Tümcede neyi, kimi sorularýna cevap bulabilen
eylemler geçiþlidir.
Çocuk ödevlerini yaptý. O fikirlerini açýklayamamýþ.
Nesne Nesne
Geçiþsiz Eylemler
Tümcede nesne almayan dolayýsý ile neyi, kimi sorularýna cevap alýnamayan
eylemlerdir.
Onlar bize doðru koþtular.
Sen bütün bu yaptýklarýna utanacaksýn.
Bazý eylemler hem geçiþli hem de geçiþsiz olabilmektedir. Bu nedenle eylemin geçiþli
veya geçiþsiz olduðuna tümcedeki durumuna göre bakýlarak karar verilir.
Parkta bir müddet dolaþtým. (geçiþsiz)
Sergiyi uzun süre dolaþtým. (geçiþli)
nesne
Bahçeden geçti. (geçiþsiz)
Bizi hýzla geçti. (geçiþli)
nesne
Oldurgan Eylemler
Geçiþsiz durumdaki eylemler bazý ekler yardýmý ile geçiþli duruma getirilirse bunlara
Oldurgan Eylemler adý verilir. Eylemleri oldurgan hale getiren ekler “-(H)t”,
“-(H)r”, “-dHr” ekleridir.
ak- geçiþsiz eyleminden ak-ý-t- oldurgan eylemi; piþ geçiþsiz eyleminden
piþ-i-r- oldurgan eylemi; gül- geçiþsiz eyleminden gül-dür- oldurgan eylemi
türetilebilir.
Ettirgen Eylemler
Geçiþli eylemlerin ekler yardýmý ile geçiþli duruma gelmiþ þekline Ettirgen eylem
denir. Eylemi ettirgen hale getiren ekler “-(H)t”, “-(H)r”, “-dHr(t)” ekleridir. -dir eki
ünlüler uymu ünsüzler benzeþmesine göre ulanýr.
3.10 Eylemler – 57
eþ- geçiþli eyleminden eþ-tir- ettirgen eylemi; dinle- geçiþli eyleminden
dinle-t- ettirgen eylemi; iç- geçiþli eyleminden iç-i-r- ettirgen eylemi
türetilebilir.
Ettirgenlik ekleri ardarda getirilerek ettirgenlik derecesi arttýrýlabilir. Genellikle en
çok dördüncü dereceye kadar ettirgenlik anlamlýdýr.
Tuvaletleri yýka-t-týr-dý.
Öðrenciler koþuþ-tur-t-uldu.
3.10.8 Yapýlarýna Göre Eylemler
Eylemler yapýlarýna göre üçe ayrýlýrlar.
Kök Eylemler (Basit Eylemler)
Anlamý ya da yapýsý bozulmadan parçalanamayan bir ya da birkaç heceli eylemlerdir.
yaz-, koþ-, git-, çürü-, oku-… gibi.
Türkçedeki kök eylemlerin çoðu bir hecelidir.
Türemiþ Eylemler
Ad ya da eylem kök ve gövdelerine türetme ekleri ulanarak yapýlan yeni anlamdaki
eylemlerdir. Türemiþ eylemler baþlýca iki yolla türetilir:
1) Yansýmalardan ve ad kök ya da gövdelerinden eylem yapma: yaþ-a-,
miyav-la-, haber-le-, deli-r-, önem-se-, mor-ar-…gibi. Ad kök
ya da gövdelerinden eylem yapma “türetme ekleri” baþlýðýnda incelenecektir.
2) Eylem kök ya da gövdelerinden eylem yapma. ara-þtýr-, bil-in-,
yut-ul-, anla-t-, kov-dur-, kaz-ý-, týk-a-, silk-ele-,
dürt-ükle- gibi.
Bileþik Eylemler
Ýki ya da daha çok sözcüðün birleþip kaynaþmasýndan oluþan yeni anlamdaki
eylemlerdir. Türkçede bileþik eylemler yapý, anlam ve yazým özelikleri açýsýndan dört
kümeye ayrýlýr.
Birinci Küme
a) Yeterlik eylemleri: Temel eyleme istek eki olan “-A” ekinden sonra “-bil-”
(= bir þey yapmak elinden gelmek) tasvir· eylemi getirilerek yeterlik eyleminin
olumlusu elde edilir. gül-e-bil-, koþ-a-bil-, aðlý-(y)a-bil-.
58 – Biçimbilim
Yeterlik eyleminin olumsuzu iki biçimde yapýlýr. Temel eyleme “-eme” kökleri
eklenerek elde edilir. gel-eme-, koþ-ama-…gibi. Yeterlik eyleminin asýl
olumsuz biçimi budur. Olumsuz temel eyleme “-A” ekinden sonra “-bil” tasvir
eylemi getirilerek yapýlýr. gitme-(y)ebil-, gelme-(y)ebil-…gibi.
(Temel Eylem: Bileþik eylemin baþýnda bulunan asýl eylem kök ya da
gövdesine “temel eylem” denir. Temel eyleme bir renk bir görünüþ
kazandýran eylemlere “tasvir eylemi” denir.)
b) Tezlik eylemleri: Tezlik eyleminin olumlusu temel eyleme “-(y)Hver-”
(tahrik etmek, çabuklaþtýrmak, koþturmak, acele ettirmek) tasvir eyleminden
oluþur. gel-iver-,al-ýver-,oku-(y)uver-…gibi. Temel eyleme
tezlik eyleminin olumsuz hali -iver tasvir eyleminin olumsuzu olan -iverme
ulanarak yapýlýr. gel-iverme-, yaz-ýverme-, koþ-uverme-… gibi.
Tezlik eyleminin asýl olumsuz biçimi budur. Olumsuz temel eyleme tasvir
eylemi ulanarak da olumsuz hali elde edilebilir. gelme-(y)iver-,
alma-(y)ýver-, görme-(y)iver-… gibi.
c) Sürerlik eylemleri: Sürerlik eylemleri temel eyleme “-(y)(A)dur-”,
“-(A)koy-”, “-(H)gel-”, “-git-”, “-gör-”, “-kal-” tasvir eylemleri ulanarak
yapýlýr. al-ýkoy-, çalýþ-adur-, çýk-agel-, don-akal-,
sür-egel-, çek-egit-, kopar-agör-… gibi. Sürerlik eyleminin
olumsuzu iki türlüdür. Temel eyleme “-Hp” eki ile “-dur-” yardýmcý eyleminin
olumsuzu olan “-durma-” ulanarak yapýlýr. aðla-y-ýp durma-, gül-ü-p
durma-, konuþ-u-p durma-,…gibi. Diðer yol ise temel eylemin
olumsuzuna “dur-”, “gör-” tasvir eylemleri ulanarak yapýlýr.
düþme-(y)edur-, ölme-(y)egör-, sürçme-(y)egör-,…gibi.
d) Yaklaþma eylemleri: Temel eyleme istek eki olan “-(y)A” ekinden sonra
“-yaz-” tasvir eylemi getirilerek yapýlýr. düþ-e-yaz-…gibi. Yaklaþma
eyleminin olumsuzu yoktur.
e) Beklenmezlik eylemleri: Temel eyleme “-(y)AcAðH” eki ile “tut-” tasvir
eylemi getirilerek yapýlýr. evlendir-eceði tut-, aðla-(y)acaðý
tut-… gibi. Olumsuz biçimi temel eylemin olumsuzuna -tut- tasvir eylemi
ulanarak yapýlýr. gitme-(y)eceði tut-, konuþma-(y)acaðý tut…
gibi.
f) Gerekseme eylemleri: Temel eyleme “-AcAðH” ya da “-AsH” eki ile “gel-”
tasvir eylemi getirilerek yapýlýr. gör-eceði gel-, gör-esi gel-…gibi.
Gerekseme eyleminin ve olumsuz biçimi temel eyleme gelme- tasvir eylemi
getirilerek yapýlýr. gör-eceði gel-, gör-esi gel-…gibi.
g) Yapmacýk eylemleri: Temel eyleme “-memiþ görün-”, “-memiþ dur-”,
“-memiþten gel”- , “-miþlikten gel-”, “-mezliðe vur-”, “-mezlikten gel-”,
3.10 Eylemler – 59
“-miþliðe vur-” getirilerek yapýlýr. anla-mamýþ görün-, duy-mamýþtan
gel-, iþit-memiþlikten gel-, anla-mazlýða vur-,
anla-mazlýktan gel-, gör-memiþliðe vur-… gibi. Yapmacýk
eyleminin olumlusu vardýr olumsuzu yoktur.
Ýkinci Küme
Bir ortaç ile “ol-” yardýmcý eyleminden oluþmuþ bileþik eylemlerdir.
a) Baþlama eylemleri: Geniþ zamanýn olumlu ya da olumsuz üçüncü tekil
kiþisine “ol-” yardýmcý eylemi ulanarak yapýlýr. gelir ol-, söyler
ol-…gibi. Olumsuz temel eylemin olumsuz biçimi ile saðlanýr. gelmez
ol-, söylemez ol-…gibi.
b) Bitirme eylemleri: Miþli geçmiþ zamanýn üçüncü tekil kiþisine “ol-” bazen de
“bulun-” yardýmcý eylemi ulanarak yapýlýr. bildirmemiþ ol-, yemiþ
bul-…gibi. Bitirme eylemlerinin olumsuzu üç biçimdedir. Yardýmcý eylem
olumsuzdur; görmüþ olmama-, yazmýþ olmama-… gibi. Temel eylem
olumsuzdur; görmemiþ ol-, yazmamýþ ol- …gibi. Hem temel hem
yardýmcý eylem olumsuzdur; görmemiþ olma-, yazmamýþ
olma-…gibi. Bu son biçim biçimce olumsuzdur ancak anlamca olumludur.
c) Davranma eylemleri: Gelecek zamanýn olumlu ya da olumsuz üçüncü tekil
kiþisine “ol-” yardýmcý eylemi ulanarak yapýlýr. gelecek ol-, koþacak
ol-…gibi. Davranma eylemlerinde olumsuzluk temel eylemin olumsuz
biçimi ile saðlanýr. gitmeyecek ol-, kalkmayacak ol-…gibi.
Üçüncü Küme
Ýsim kök ya da gövdesinden bir sözcük ile “et-”, “bul-”, “eyle-”, “kýl-”,
“buyur-”, “ol-” yardýmcý eylemlerinden biri ile oluþan bileþik eylemlerdir.
iyi et-, yolcu et-, addet-, kaydol-, sabrol-, arz eyle-,
emreyle-, dikkat buyur-, mecbur kýl-, son bul-, þifa
bul-…gibi.
Üçüncü grup bileþik eylemlerin yazýlýmýnda dikkat edilmesi gereken durum
þudur. “et-”, “eyle-”, “ol-”, gibi yardýmcý eylemlerin baþýna gelerek bileþik
eylem oluþturan tek heceli sözcükler sesçe bir deðiþmeye uðradýklarý zaman
birleþik uðramadýklarý durumda ayrý yazýlýrlar: ad-(d)et-, his-(s)et-,
hal-(l)et-, af-(f)eyle-, red-(d)et-, hükm-ol-, emr-et-,
kayb-ol-, sabr-ol-, haps-eyle-, aks-et-…gibi. Görüldüðü gibi
bu bileþik eylemleri kuran tek heceli sözcükler ikizlemeye ya da orta hece
düþmesine uðramýþlardýr.
60 – Biçimbilim
Dördüncü Küme
Anlamca kaynaþmýþ bileþik eylemlerdir. hasta düþ-, göz at-, kafa
tut-, aðýz ara-, boy ölçüþ-…gibi. Anlamca kaynaþmýþ bileþik
eylemler ayrý yazýlýr.
3.11 Ekler
Türkçe sondan eklemeli ve kurallý bir dildir. Kök sözcüklerin sonuna, yapým ve çekim ekleri
istenildiði kadar ulanabilir. Ekler, yapým ve çekim eki olarak iki kümeye ayrýlýr. Yapým ekleri,
köke eklendiklerinde farklý, sözcüðe yeni bir anlam kazandýrýlar. Yapým eki eklenmiþ sözcüðe
gövde denir. Çekim ekleri ise, eklendikleri sözcüðe kiþi, zaman, soru, çoðul, olumsuzluk gibi
kavramlar yükler. Türkçede ad soylu kök veya gövdenin sonuna tekillik, çoðulluk, bulunma,
yönelme gibi hal ekleri, iyelik ekleri, eþitlik ekleri eklenebilir. Eylem soylu kök ve gövdenin
sonuna zaman ekleri, kip ekleri (-ayým, -eyim, -se, -sa, -mek, -mak), þahýs ekleri,
ilgi ekleri eklenir. Çekim eki denilen bu ekler kökün ya da gövdenin anlamýný deðiþtirmez,
sadece ona iþlerlik katar.
Besim Atalay gibi pek çok dilbilimci Türkçenin bir hecelik köklerden doðduðunu
düþünmektedir [2]. Zamanla bu kök sözcüklere ekler getirilerek yeni sözcükler türetilmiþ;
bunlarýn yerleþmesi ve kökenlerinin unutulmasýyla sanki bu sözcükler kendi baþlarýna kök
sözcükmüþ gibi varsayýlmaya baþlanmýþtýr.
Türkçede sözcüðün temel anlamýný veren kýsým kök ya da gövdedir. Yapým ekleri, bu sözcüðe
yeni anlamlar kazandýrýr. Ancak temel kavram hiçbir zaman kaybolmaz. Bu nedenle, kök ya da
gövdenin anlamýný bilen bir kiþi eklemelerle oluþturulmuþ yeni sözcüðün anlamýný kolayca
bilebilir. Örneðin;
göz, gözlük, gözlükçü, gözlükçülük
bu örnekte olduðu gibi, göz kök sözcüðünün anlamýný bilen bir kiþi, lük ekiyle üretilen
gözlüðün, göz organý için geliþtirilmiþ bir araç olduðunu, lükçü eki ele oluþturulan sözcüðün,
gözlük iþiyle uðraþan bir kiþiyi ve lükçülük ekiyle oluþturulan sözlüðün, gözlük mesleði ile
ilgilenen iþ kolunu anlattýðýný kolayca söyleyebilir. Bitiþken bir dil olan Türkçeye ve akraba
dillere özgü olan bu özelliði baþka dil ailelelerinde görme olanaðý yoktur.
Çekim ekleri, sözcüðe yeni anlam kazandýrmaz, kiþi, yer, yön, soru, olumluluk, olumsuzluk
bilgileri ekler. Örneðin;
evde, evden, seviyorum, sevmiyorum, seviyor mu?
3.11 Ekler – 61
3.11.1 Çekim Ekleri
Sözcüklere durum, ilgi, nicelik, kip, zaman ve kiþi ile ilgili birer özelik katmakla görevli
dilbilgisi öðeleridir. Çekim eklerinin ad soylu ve eylem soylu sözcüklere ulanýþlarý iki ayrý
model uyarýnca gerçekleþir. Bu iki model çekim eklerinin ada mý yoksa eyleme mi ulandýðýna
baðlý olarak eklerin hangi sýrayla uygulanabileceðini belirler. Buradan da anlaþýldýðý gibi bu ek
örüntüsünün oluþturabileceði iki uç olasýlýk, sözcüðün incelenmesinde oldukça faydalý bilgiler
saðlamaktadýr.
Ad soylu ve eylem soylu sözcüklere eklenebilecek çekim eklerinin düzeni Tablo-3.2 ve
Tablo-3.3’te gösterilmiþtir.
Tablo-3.2: Ad Soylu Sözcüklere Eklenen Çekim Ekleri
Ek Açýklama Örnek
-lAr çoðul kuþlar
-(H)m 1. tekil kiþi iyelik kuþum
-(H)mHz 1. çoðul kiþi iyelik kuþumuz
-(H)n 2. tekil kiþi iyelik kuþun
-(H)nHz 2. çoðul kiþi iyelik kuþunuz
-(s)H 3. tekil kiþi iyelik kuþu
-lArH 3. çoðul kiþi iyelik kuþlarý
-(y)H -i durum kuþu
-nH -i durum (3.t.k.i ekinden sonra) kuþunu
0 yalýn durum kuþ
-(n)Hn tamlama kuþun
-(y)A -e durum kuþa
-nA -e durum (3.t.k.i ekinden sonra) kuþuna
-DA -de durum kuþta
-nDA -de durum (3.t.k.i ekinden sonra) kuþunda
-Dan -den durum kuþtan
-nDAn -den durum (3.t.k.i ekinden sonra) kuþundan
-(y)lA araç/birliktelik kuþuyla
-ki ilgi kuþtaki
62 – Biçimbilim
Tablo-3.3: Eylem Soylu Sözcüklere Eklenen Çekim Ekleri
Ek Açýklama Örnek
-(y)AmA gideme
-mA olumsuzluk gitme
-(H)r geniþ zaman gider
-(A)r geniþ zaman gider
-(H)yor þimdiki zaman gidiyor
-DH di li geçmiþ zaman gitti
-mHþ miþ li geçmiþ zaman gitmiþ
-(y)AcAk gelecek zaman gidecek
-(y)A istek gitmeyeydi
-malI koþul gitmeli
-sA gitse
-yAbil gidebil
-yAmA gideme
-yAdur gidedur
-yAkal þaþakal
-yAyaz düþeyaz
-yAgör yapagör
-yAgel duyagel
-yAkoy alýkoy
-(y)DI gitmiþti
-(y)mHþ yapmýþmýþ
-(y)sA gitmiþse
3.11.2 Yapým Ekleri
Türkçe yapým ekleri açýsýndan çok zengindir. Yapým ekleri, eklendikleri sözcüðün anlamýný ve
niteliðini deðiþtirler. Örneðin,
Ad •¬¬¬ ad + ek
ad •¬¬¬ eylem + ek
eylem •¬¬¬ eylem + ek
3.11 Ekler – 63
Tablo-3.4: Ad türü köke yapým eki eklenerek yapýlan adlar ( 1 )
Ek Kök Sözcük Ek Kök Sözcük

boya boyacý

akýl akýllý
yalan yalancý sis sisli
çýl
ev evcil
lýk
kum kumluk
ben bencil insan insanlýk
cek
ev evcek iki ikilik
büyük büyücek
msý
beyaz beyazýmsý
cýk
ev evcik bitki bitkimsi
adam adamcýk
mtrak
beyaz beyazýmtýrak
ca
adam adamca ekþi ekþimtýrak
ben bence
ncý
bir birinci
daþ
ad adaþ iki ikinci
çað çaðdaþ
r
bir birer
ki
sabah sabahki iki ikiþer
dün dünkü
su
çocuk çocuksu
leyin
sabah sabahleyin kadýn kadýnsý
akþam akþamleyin sýz akýl akýlsýz
Tablo-3.4: Ad türü köke yapým eki eklenerek yapýlan adlar ( 2 )
Ek Kök Sözcük Ek Kök Sözcük
t
öz özet
iz
iki ikiz
göl gölet üç üçüz
tay
kurul Kurultay
yargý Yargýtay
64 – Biçimbilim
Tablo-3.5: Eylem türü köke yapým eki eklenerek yapýlan adlar ( 1 )
Ek Kök Sözcük Ek Kök Sözcük
a
doðmak doða
ç
ayýrmak ayýrcak
dizmek dize çekmek çekiç
acak
içmek içecek dý uymak uydu
almak alacak
ge
bilmek bilge
alga çizmek çizelge dizmek dizge
aðan
durmak duraðan
gaç
süzmek süzgeç
olmak olaðan yüzmek yüzgeç
amak
basmak basamak
gan
almak alýngan
kaçmak kaçamak kaymak Kaygan
an
bakmak bakan

çalmak çalgý
yaratmak yaratan dolmak dolgu
anak
gelmek gelenek
gýn
bilmek bilgin
olmak olanak yanmak yangýn
cýk
öpmek öpücük gýt örmek örgüt
gülmek gülücük
ý
açmak açý
anmak aný
3.11 Ekler – 65
Tablo-3.5: Eylem türü köke yapým eki eklenerek yapýlan adlar ( 2 )
Ek Kök Sözcük Ek Kök Sözcük
ýcý
akmak akýcý
mýk
kýymak kýymýk
yakmak yakýcý kusmak kusmuk
k
kaçmak kaçak
n
akmak akýn
kanmak konak dizmek dizin
l
çatmak çatal
nc
basmak basýnç
kurmak kural gülmek gülünç
m
anlamak anlam
ntý
dökmek döküntü
toplamak toplam söylemek söylenti
ma
asmak asma
r
akmak akar
dolmak dolma dönmek döner
m aca
bilmek bilmece
sak
tutmak tutsak
çekmek çekmece savmak savsak
maç
bulamak bulamaç
þ
açmak açýþ
dönmek dönemeç satmak satýþ
mak
çakmak çakmak
t
anmak anýt
ekmek ekmek kanmak kanýt
man
danýþmak danýþman

baðlanmak baðlantý
göçmek göçmen sallanmak sallantý
mar yaðmak yaðmur
maz
çýkmak çýkmaz
bitmek bitmez
66 – Biçimbilim
3.11 Ekler – 67
Kök
Çoðul
eki
Ýyelik
eki
Durum
eki
Ýlgi
eki
Ýsim eylem
eki
Masa + lar + ýmýz + da + ki + dir
Kök
kip
eki
olumsuzluk
eki
asýl zaman
eki
soru
eki
Ikincil zaman
eki
þahýs
eki
Git + ebil + me + miþ + mi + ydi + ler
4
Sözdizimi
– 69
Biçim Bilimi
Türkçenin özelikleri
Biçim bilimsel çözümleme
Sözcük türü
Sözcük türü belirleme
Sözcük Dizimi
Sözcük dizimi belirleme
Sözcük anlamý
Sözcük anlamý belirleme
Metin belirleme
DÝL BÝLÝMÝ VE BÝLÝÞÝM (EA)
1. Doðal Dil Ýþleme (Giriþ)
2. Biçim Bilimsel Çözümleme
3. Sözcük Anlamý Belirleme (Word-Sense Disambiguation)
4. Türkçede Yapýlan Çalýþmalar
70 – Sözdizimi
5
Anlambilim
– 71
2. Kýsým
Doðal Dil Ýþleme
– 73
74 – Doðal Dil Ýþleme
6
Doðal Dil Ýþleme
Ýnsanlýk tarihine genel olarak baktýðýmýzda bazý geliþmelerin insanlýðýn
geliþiminde önemli sýçramalara neden olduðunu görürüz. Dil ve yazý bu
geliþmelerden biridir. Ýnsanlar konuþarak birbiriyle iletiþim kurabilmiþ
ve anlaþabilmiþtir. Dil sayesinde kültür, sanat ve bilimde ilerlemeler
saðlanabilmiþtir.
Dillerin geliþimi uzun bir zaman alýr ve geliþim devam eder. Zaman
içinde, toplumdaki geliþmelere baðlý olarak dile yeni sözcükler eklenir
veya bazý sözcükler unutulur. Hatta zaman içinde dilin tümce kurma
biçimi de deðiþebilir. Bu nedenlerle geçmiþ yüzyýllarda yazýlmýþ
metinler günümüzde anlaþýlmaz olabilir. Konuya Türkçe özelinde
eðildiðimizde, zaman içinde, Türkçenin söz varlýðýnda deðiþme
olduðunu görürüz. Ancak dilin kurallarýnda binlerce yýldýr bir deðiþme
olmamasý çok dikkat çekicidir.
Birleþmiþ Milletler verilerine göre günümüzde 4000’den fazla dilin
konuþulduðu anlaþýlmaktadýr. Ancak bu dillerden bazýlarý bir avuç
insan tarafýndan konuþulmaktadýr. Dillerin geliþmiþliði ile o dili
konuþan toplumlarýn kültür, sanat ve bilim alanýnda ürettikleri arasýnda
sýký bir baðlantý olduðu açýktýr. Bir baþka deyiþle dili yetersiz olan
topluluklarýn kültür, sanat ve bilim alanýnda baþarýlý olmalarý
beklenemez.
– 75
Dil ve toplum iliþkisini Konfüçyüs þöyle açýklamaktadýr:
“… Bir ülkenin yönetimini ele alsaydým, yapacaðým ilk iþ, hiç kuþkusuz dilini gözden geçirmek
olurdu. Çünkü dil kusurlu ise sözcükler düþünceyi iyi ifade edemez. Düþünce iyi ifade
edilemezse görevler ve hizmetler gereði gibi yapýlamaz. Görev ve hizmetin gerektiði þekilde
yapýlamadýðý yerlerde âdet, kural ve kültür bozulur. Âdet, kural ve kültür bozulursa adalet
yanlýþ yollara sapar. Adalet yoldan çýkarsa þaþkýnlýk içine düþen halk ne yapacaðýný, iþin nereye
varacaðýný bilemez. Ýþte bunun içindir ki hiçbir þey dil kadar önemli deðildir!..”
Türkçede sözcüklerin zaman içinde deðiþtiði bilinmektedir. Hatta Osmanlý Türkçesinde, Türkçe
sözcüklerin, toplam söz varlýðýnýn yarýsýna kadar düþtüðü söylenebilir. Bu dönemde dil bilgisi
kurallarýnda da deðiþimlerin olduðu bilinmektedir. Ancak 12 Temmuz 1932 yýlýnda Dil
Devrimi’yle baþlatýlan çalýþmalar sonunda Türkçeden yabancý sözcükler atýlmaya baþlanmýþtýr.
Atatürk’ün dil üzerine söylediklerinden bazýlarý þunlardýr:
“Türk milletinin dili Türkçedir. Türk dili dünyada en güzel, en zengin ve en kolay olabilecek bir
dildir. Onun için her Türk dilini çok sever ve onu yükseltmek için çalýþýr. Bir de Türk dili, Türk
milleti için kutsal bir hazinedir. Çünkü Türk milleti, geçirdiði bunca tehlikeli durumlarda,
ahlakýnýn, geleneklerinin, anýlarýnýn, çýkarlarýnýn, özetle, bugün kendi ulusallýðýný yapan her
þeyin dili aracýlýðýyla korunduðunu görüyor. Türk dili, Türk milletinin kalbidir, zihnidir.”
“Türk demek dil demektir. Ulusallýðýn çok belirgin özelliklerinden birisi dildir. Türk
ulusundaným diyen insanlar, her þeyden önce ve ne olursa olsun Türkçe konuþmalýdýr. Türkçe
konuþmayan bir insan, Türk ekinine, topluluðuna baðlýlýðýný öne sürerse buna inanmak doðru
olmaz.”
“Ülkesini, yüksek istiklalini korumasýný bilen Türk milleti, dilini de yabancý diller
boyunduruðundan kurtarmalýdýr.”
“Türk dilinin sadeleþtirilmesi, zenginleþtirilmesi ve kamuoyuna bunlarýn benimsetilmesi için
her yayýn vasýtasýndan faydalanmalýyýz. Her aydýn hangi konuda olursa olsun yazarken buna
dikkat edebilmeli, konuþma dilimizi ise ahenkli, güzel bir hale getirmeliyiz.”
Osmanlý döneminde, özelikle kamusal alanda Türkçe bozulmuþtur. Ancak Türkçenin saðlam
olan kurallarý bozulmadýðýndan, bugün, Selçuklu ve erken Osmanlý dönemi eserlerini
anlayabilmekteyiz. Bu durum Türkçenin kurallarýnýn, yaklaþýk bin yýldýr bozulmamýþ
olduðunun bir kanýtýdýr.
Dilin yapýsý, insanlarýn düþünme yeteneklerine de etki etmektedir. Çok basit bir anlatýmla, elma
sözcüðünü bilmeyen birinin aklýna elma yemek gelemez. Özenme sözcüðü olmayan bir dilde,
kiþi bir þeye özendiðini anlatamaz. Bir dilin sözlük varlýðý, o dilin geliþmiþliðinin bir ölçüsü
olabilir. Ancak bir dildeki sözcüklerin sayýsýna bakarak bir dilin diðer bir dile göre daha
geliþmiþ olduðu söylenemez. Dillerin yapýlarý göz önüne alýnarak geliþmiþlik derecesine karar
verilebilir. Örneðin, Ýngilizcede göz, gözlük, gözlükçü sözcükleri için birbiri ile iliþkisi olmayan
üç sözcük (eye, eyeglasses, optician) gerekirken Türkçede göz sözcüðünden türetilmiþ üç
sözcük (göz, gözlük, gözlükçü ) yetmektedir. Türkçe bitiþken bir dil olmasý nedeniyle bir kökten
76 – Doðal Dil Ýþleme
deðiþik anlamlar ifade eden sözcükler türetilebilir. Buna karþýn, Hint-Avrupa dillerinin bu
yöndeki yetenekleri çok kýsýtlýdýr. Bu nedenle her þeye yeni bir sözcük bulmak zorundadýr. Sami
dilleri de bir kök sözcükten çok sayýda sözcük türetme özelliðine sahiptir. Bu açýdan
deðerlendirildiðinde, bitiþken ve Sami dillerin yeni sözcük üretme açýsýndan diðer dillere oranla
üstün olduklarý görülmektedir. Daha önemlisi bu dillerde türetilen sözcüðün anlamý kolayca
çýkarýlabilmektedir. Örneðin, “kýrmýk” sözcüðünü ilk duyan kiþi bunun kýrmak eyleminden
türetildiðini; kýrma iþlemi sonunda elde edilen bir nesne olduðunu anlayabilir. Kýrmýðýn
Ýngilizce karþýlýðý olan “chip” sözcüðü türetilmek istendiðinde aðaçtan kýymýk çýkarma
veya patetesten parça kesme iþlemine benzetilmeye çalýþýlmýþtýr. Sözcük türetme yeteneði
kýsýtlý olan dillerde bazý sözcüklerin ilginç yöntemlerle türetildiðine tanýk olmaktayýz.
Örneðin “kuþluk vakti” için Ýngilizcede “late morning” yerine “breakfast” ve “lunch”
sözcüklerinin karýþýmý olan “brunch” sözcüðü kullanýlmaktadýr. Nylon sözcüðünün “Now
You Lousy Old Nippons” tümcesinde yer alan sözcüklerin ilk harflerinden türetildiði
söylenmektedir.
Dil bir ulusu oluþturan temel ögelerden biridir. Bunun sonucu olarak her toplum kendi dilini
sever ve üstün görür. Belki bu nedenle dil bilimciler dilleri karþýlaþtýrmaya ve derecelendirmeye
gerek görmemiþtir. Dil bilimciler dilin dil bilgisi ve zaman içindeki geliþimi üzerinde çalýþmaya
özen gösterirler.
Biliþim teknolojlerindeki geliþmeler, bilgisayarlý dil bilimi çalýþmalarýna önemli bir ivme
vermiþtir. Doðal Dil Ýþleme (DDÝ) adý verilen bu yeni bilim alaný önceleri insan bilgisayar
etkileþiminde doðal dillerin kullanýlabilmesi amacýyla baþlatýlmýþ, zamanla bilgisayarlý dil
bilimine dönüþmüþtür. Belleðinde bulunan veri ve sonuçlarý, bilgisayarýn doðal dilde konuþarak
insanlara aktarýlmasýna “konuþma”, insan tarafýndan konuþularak bilgisayara yapýlan giriþlere
“konuþmayý anlama” adý verilmiþtir. Bir bilgisayarýn, insanýn konuþmasýný anlayabilmesi ve
insanýn anlayabileceði dilde konuþarak insanlarla etkileþimde bulunabilmesi için bilgisayarýn
dilin tüm özelliklerini bilmesi gerekir. Bir baþka deyiþle dilin tüm özelliklerinin bilgisayara
öðretilmesi gerekir. Bu nedenle DDÝ alanýnda çalýþan biliþimciler dillerin özelliklerini kendi
bakýþ açýlarýndan deðerlendirmeye baþlamýþlardýr. Bu baðlamda özellikle þu konularda
çalýþmalara aðýrlýk verilmiþtir:
• Ses bilimi
• Biçim bilimi
• Söz dizimi
• Anlam bilimi
Dil bilimciler dilin yapýsýný oluþturan yukarýdaki dört ana konu üzerinde çalýþarak dilin özellik
ve kurallarýný ortaya koymaya çalýþýrlar. Bu çalýþmalara koþut olarak dilin zaman içindeki
evrimini incelerler. Doðal dil alanýnda çalýþan biliþimciler, dil bilimcilerin ortaya koymuþ
olduklarý sonuçlarý kullanarak dili bilgisayar yardýmýyla iþlemeye çalýþýrlar. Örneðin Türkçenin
ses bilimi ve biçim bilimi özelliklerini kullanarak yazýlý bir metin içindeki yazým yanlýþlarýný
– 77
bulmaya ve düzeltmeye çalýþýrlar. Dil bilimciler tarafýndan belirlenen, iki dilin dil bilgisi
kurallarýný kullanarak diller arasý çeviri araçlarý geliþtirmeye çalýþýrlar. Bir dil bilimciye göre
bitiþken dillerin ek zenginliði bu diller için olumlu bir özellik iken biliþimci için çözümü zor
ama ilginç bir konudur. Bu örneklerden de anlaþýlacaðý gibi dil bilimciler, dil veya dillerin
özellik ve yapýlarýný bilimsel olarak ortaya koymaya ve tanýmlamaya çalýþýrken doðal dil iþleme
ile ilgilenen biliþimciler bu bilgileri kullanarak insanlara bilgisayar aracýlýðý ile yardýmcý
olmaya çalýþmaktadýrlar.
Günümüzde dil bilimciler ve doðal dil iþleme alanýnda çalýþan bilþimciler ayrý ayrý çalýþtýklarý
gibi belli konularda birlikte çalýþmaktadýrlar. Birlikte çalýþmalarýnýn daha verimli sonuçlar
doðuracaðý açýktýr. Çünkü, birinin tanýmladýðý sonuçlarý diðeri kullanmaktadýr. Beraber
çalýþmayý saðlamak için dil bilimcilerin biliþim teknolojileri ve biliþimcilerin de dilbilimi
konularýna eðilmeleri gerekmektedir.
Bu yazýda DDÝ alanýndaki çalýþmalar genel hatlarý ile tanýtýlacak, bu çalýþmalar sýrasýnda dilin
hangi özelliklerinin bilinmesi gerektiði ve karþýlaþýlan zorluklar ortaya konacaktýr. Yazýnýn
sonunda DDÝ alanýnda çalýþan bir araþtýrmacýnýn gözünden dillerin deðerlendirilmesi
yapýlacaktýr.
6.1 DDÝ Ýlgi Alanlarý
DDÝ alanýnda çalýþanlarýn yukarýda sözünü ettiðimiz dil biliminin dört temel konusu ile
ilgilenmelerinin nedenini anlayabilmek için DDÝ konusunda çalýþanlarýn ilgi alanlarýný ve bu
çalýþmalar sýrasýnda karþýlaþtýklarý zorluklarý bilmemizde yarar vardýr. DDÝ çalýþmalarý
kapsamýnda aþaðýda sýralanan konularý görmekteyiz:
• Yazým yardýmcý araçlarýnýn geliþtirilmesi
• Yazým yanlýþlarýnýn düzeltilmesi
• Bul ve deðiþtir
• Metni anlama amacýyla gerçekleþtirilen çalýþmalar
• Basýlý bir metni okuma (optik olarak metin okuma) ve okuma yanlýþlarýný
düzeltme
• Bir metnin özetini çýkarma
• Metnin içerdiði bilgiyi çýkarma
• Bilgiye eriþim
• Metni anlama
• Bilgisayarla sesli etkileþim üzerine çalýþmalar
• Bilgisayarýn konuþmasý (metni seslendirme)
• Konuþmayý anlama (konuþmayý metne dönüþtürme)
• Soru yanýt dizgeleri
• Bilgisayarlý çeviri alanýndaki çalýþmalar
• Yabancý dil okuma yardýmcý araçlarý
78 – Doðal Dil Ýþleme
• Yabancý dilde yazma yardýmcý araçlarý
• Doðal diller arasý çeviri
6.1.1 Yazým Yanlýþlarýnýn Düzeltilmesi
Günümüzde, kitaplar, dergiler ve raporlar bilgisayar ortamýnda hazýrlanmaktadýr. 19. yüzyýlýn
sonunda önemli bir buluþ olarak kabul gören daktilolar artýk kullaným dýþýdýr. Yazýlan her
yazýda yazým hatasý olabileceði bir gerçektir. Ýnsanlar yazmýþ olduklarý yazýnýn yazým
kurallarýna uygun olmasýný isterler. Geçmiþ dönemlerde, yanlýþlarý bulan ve düzelten insanlarýn
olduðu ve bunlarýn basýn kuruluþlarýnda musahhih sýfatýyla çalýþtýklarý bilinmektedir. Geçmiþte
musahhihler tarafýndan yapýlan iþi bugün bilgisayarlara yaptýrmak için çalýþmalar oldukça ileri
düzeydedir.
Yazma iþleminin bilgisayar ortamýna geçmesiyle birlikte bilgisayar ortamýnda bulunan bir
metnin yazým hatalarýný bulmak ve düzeltmek biliþimciler için ilginç bir araþtýrma alaný
olmuþtur. Bir metindeki yazým hatalarýný bulmak için deðiþik yöntemler kullanýlabilir.
Yöntemlerden biri, metnin yazýldýðý dilin sözlüðünü bilgisayarda bir veri tabanýna yerleþtirmek
olarak düþünülebilir. Bitiþken olmayan diller için olanaklý görülen bu uygulama, Türkçe gibi
bitiþken diller için ilk seçenek olmamalýdýr. Ayrýca Türkçe gibi kurallý bir dilde yazýlmýþ bir
metin içindeki yazým hatalarýný bulmak için;
• Ses uyum kurallarý
• Hece yapýsý
• Eklerin uyumu
özellikleri kullanýlabilir.
Bir sözcüðü hecelere ayýrma ve satýr sonunda hece bölmesi iþlemi için Ýngilizcede sözlüðe
bakma zorunluluðu vardýr. Buna karþýn Türkçede bir sözcüðün hecelere ayrýlmasý kurallýdýr ve
sözlüðe bakýlmadan yapýlabilir.
Bu kýsa bilgilerden de anlaþýlacaðý gibi yazým yanlýþlarýný düzeltmek üzere çalýþmalarda
bulunacak birisi üzerinde çalýþacaðý dilin ses bilimi ve biçim bilimi özelliklerini bilmek
zorundadýr. Hint Avrupa dilleri üzerinde gerçekleþtirilecek çalýþmalar için dilin söz varlýðýný
veri tabanýna yerleþtirmek uygun bir yöntem olarak görülmektedir. Türkçe gibi bitiþken
diller için veri tabanýna dayalý çözümlere ek olarak kural tabanlý çözümlerin kullanýlmasý
önerilebilir.
6.1.2 Bul ve Deðiþtir
Bir metin içindeki bir sözcüðün bir baþka sözcük ile deðiþtirilmesi sýkça karþýlaþtýðýmýz bir
uygulamadýr. Örneðin, metin içinde geçen tüm “elma” sözcüklerini “erik” sözcüðü ile
deðiþtirmek istediðimizi düþünelim. Ýngilizce yazýlmýþ bir metinde elma karþýlýðý olan “apple”
6.1 DDÝ Ýlgi Alanlarý – 79
sözcüðü ya yalýn hâlde “apple” ya da çoðul hâlde “apples” bulunabilir. Dolayýsýyla metnin
içindeki tüm “apple”leri “plum” ve “apples”leri “plums” olarak deðiþtirmek yeterli olacaktýr.
Türkçe gibi bitiþken dillerde sözcüklerin alabileceði ekler çoktur. Örneðin elma ve erik
sözcükleri aþaðýda görülen ekleri alabilirler:
elma erik
elmalar erikler
elmacýk erikçik
elmacý erikçi
elmacýlýk erikçilik
elmam eriðim
elman eriðin
elmasý eriði
elmamýz eriðimiz
elmanýz eriðiniz
elmalarý erikleri
elmayý eriði
elmaya eriðe
elmada erikte
elmadan erikten
elmanýn eriðin
elmasýz eriksiz
Dolayýsýyla metnin içinde geçen tüm elma sözcüklerini erik ile yer deðiþtirmek istediðimizde
ekleri de göz önüne almamýz gerekir. Bir sözcüðün kök ve eklerini bulmak için biçim bilimi
çözümlemesinin yapýlmasý gerekmekte ayrýca ses bilimi özelliklerine göre de düzeltmelerin
yapýlmasý gerekmektedir.
6.1.3 Basýlý Bir Metni Okuma
Bilgisayar ortamýnda bulunmayan basýlý metinlerin bilgisayara aktarýlmasý iþlemine metni
okuma demekteyiz. Bu metinler eski dönemlerde basýlmýþ kitap veya belgeler olabileceði gibi
kullanýcýlarýn elleriyle veya makineyle doldurduklarý bilgi giriþ formlarý olabilir. Bu tür basýlý
metinleri optik yöntemler ile okuyup bilgisayara aktarmak en temel deðerlendirmeyle görüntü
iþleme veya karakter tanýma olarak sayýlabilir. Optik olarak yazýlý metinleri okuyan ve okuduðu
karakterleri bilgisayar karakterlerine çeviren dizgeler oldukça baþarýlý sonuçlar üretmektedir.
Ancak yanlýþsýz tanýma yaptýklarý söylenemez.
Kýsaca optik karakter okuyucu olarak adlandýrdýðýmýz bu dizgelerin okuma yanlýþlarý DDÝ
teknikleri kullanýlarak giderilmeye çalýþýlmaktadýr. Konuya açýklýk getirmek amacýyla
Þekil-1’deki örnek verilmiþtir. Bu örnek bir bankanýn müþterilerine doldurmak üzere verdiði bir
form olabilir. Bu formlar elle doldurulacaðý gibi daktilo veya bilgisayar ile doldurulabilir. Optik
80 – Doðal Dil Ýþleme
karakter okuyucunun bu formu okurken iki yanlýþ yaptýðýný varsayabiliriz. Bu yanlýþlarýn
kaynaðý formu dolduran olabileceði gibi form üzerine yapýþmýþ olan tozdan da kaynaklanabilir.
Forma dikkatli baktýðýmýzda kiþi adýndaki üçüncü ve ilçe alanýndaki birinci harfler yanlýþ
okumaya açýktýr. Kiþi adýndaki üçüncü harf “C” ve ilçenin ilk harfi “Ý ve J” olarak okunabilir.
Ancak bu yazýyý bir insan okuduðunda, kiþi adýný “Eren” ve ilçe adýný Üsküdar olarak
okuyacaktýr. Çünkü metin Türkçedir. Türkçe isimler içinde “Ercn” diye bir isim yoktur. En
yakýn isim “Eren”dir. Ýstanbul ili içinde “Ýjsküdar” adýnda bir ilçe yoktur; Üsküdar vardýr. Bu
örnekten de anlaþýlacaðý gibi metnin dili bilinir, ayrýca verilerin nitelikleri bilinirse optik
karakter okuyucusunun yanlýþ okumalarý düzeltilebilir.
6.1.4 Bir Metnin Özetini Çýkarma
Yayýn organlarýnýn geliþmesi, özellikle Ýnternet üzerindeki bilgi kaynaklarýnýn artmasý,
insanlara çok büyük olanaklar sunmaktadýr. Bilgi kaynaklarýnýn çokluðu ve bilginin geniþliði,
bir baþka sorunu beraberinde getirmektedir: Eriþilen bir kaynaðýn, gerçekten yararlanýlmak
istenilen kaynak olup olmadýðýna karar verebilmek için tüm kaynaðý okumak gerekmektedir. Bu
ise bazen zaman kaybýna neden olmaktadýr. Bu sorunu gidermek üzere ve insanlara araþtýdýklarý
bilgiye en hýzlý eriþebilmelerini saðlamak amacýyla metinlerin özetini çýkarmak üzerine
çalýþmalar yapýlmaktadýr.
Özetleme üzerinde yapýlan çalýþmalarda öncelikle yazýnýn varsa içindekiler kýsmýna yoksa
baþlýklarýna bakýlmaktadýr. Bundan sonra metin içinde sýkça geçen sözcükler taranmaktadýr. Bu
araþtýrmalarýn ardýndan özet yazýlmaya çalýþýlmaktadýr. Örneðin þu anda okumakta olduðunuz
yazý Internet üzerinde bulunsaydý ve bir özetleme aracý tarafýndan özetlenmiþ olsaydý, özeti
þöyle olabilirdi:
Doðal dil iþleme ve dilbilimi hakkýnda temel bilgiler içeren, DDÝ’nin ilgi alanlarýný tanýtan,
DDÝ’nin karþýlatýðý sorunlara yer veren ve dilleri deðerlendiren bir yazý.
Özete yayýn yeri, yazar adý ve yayýn tarihi de eklenebilir.
6.1 DDÝ Ýlgi Alanlarý – 81
Adý E R E N
Soyadý M U T L U
Mesleði M E M U R
Hesap numarasý 1 2 3 4 – 9 8 5 7 4
Adresi
Ýlçe Ü S K Ü D A R
Ýl Ý S T A N B U L
Þekil-6.1: Optik karakter okuyucuda yanlýþ okuma
Özet çýkarma konusunda yapýlan çalýþmalar, bir metnin konusunu ortaya çýkarmayý bu sonucu
düzgün tümcelerle ifade etmeyi hedeflemektedirler.
6.1.5 Metnin Ýçerdiði Bilgiyi Çýkarma
Doðal dilde yazýlmýþ metinlerin belli kurallara uygun olarak yazýldýðý bir gerçektir. Kurallar dile
iliþkin dil bilgisinden kaynaklanmaktadýr. Her dilde tümce içindeki sözcüklerin sýralanýþý belli
kurallara uyar. Bu kurallar dilden dile deðiþmektedir. Bazý dillerde sözcüklerin diziliþi katý
kurallara baðlý olmasýna karþýn bazý dillerde diziliþ çok esnektir. Bir metnin okuyucuya vermek
istediði bilgi metin içindeki bir tümce ile verilebileceði gibi metnin tümü ile de verilebilir.
Konuya açýklýk getirmek üzere aþaðýdaki metni okumamýzda yarar vardýr.
“Hava çok bulutlu ve dýþarýda saðnak hâlinde yaðmur yaðýyor. Bu zor hava koþulunda, sabah
on sularýnda Ahmet odama geldi ve Ayþe ile evleneceklerini söyledi. Düðün günü olarak 22
Kasýmý seçmiþler. Düðün Boðaziçi’nde yapýlacakmýþ. Bu mutlu haberin üzerine oturup biraz
sohbet ettik ve kahve içtik.”
Bu metin daha uzatýlabilir ancak metin incelendiðinde çýkarýlacak bilgi þöyledir:
• Taraflar : Ahmet ve Ayþe
• Eylem : Evlenme
• Zaman : 22 Kasým 2009
• Yer : Boðaziçi, Ýstanbul
Bilgi çýkarma iþlemi sadece bir tümceye bakýlarak çýkarýlamaz. Örnek metinden de görüldüðü
gibi komþu tümcelere veya tüm metne de bakmakta yarar vardýr. Bu sýrada metnin asýl konusu
dýþýnda kalan bilgiler ayýklanmalýdýr.
6.1.6 Bilgiye Eriþim
Bilgiye eriþim konusu, Ýnternet’in yaygýnlaþmasý sonunda ortaya çýkmýþ bir konudur. Ýnternet’te
bir konuda yapýlan araþtýrmalar için geliþtirilmiþtir. Günümüzde Ýnternet’te bir konu hakkýnda
araþtýrma yapmak istediðimizde anahtar sözcüðü yazarýz. Bunun üzerine yüzlerce hatta binlerce
baðlantý karþýmýza gelmektedir. Araþtýrýcý olarak bunlardan hangisinin gerçekten iþimize
yarayacak yazý olduðunu bulmak bizlere düþmektedir.
Bir yazýnýn ana konusunu saptamak için kullanýlabilecek yöntemlerden ilk akla geleni, yazý
içinde en çok kullanýlan sözcükleri bulmaktýr. Bu varsayýma göre bir yazý içinde en çok geçen
sözcük o yazýnýn ana konusu ile iliþkilidir. Örneðin bir yazý içinde en çok geçen sözcük
“Ýstanbul” ise bu yazýnýn Ýstanbul’la iliþkili olduðu varsayýlmaktadýr. Bu varsayýmýn doðru olma
olasýlýðý vardýr ancak kesin deðildir. Yazý Ýstanbul hakkýnda olmayabilir, Ýstanbul’da geçen bir
olayý anlatýyor olabilir. Her iki durumda da Ýstanbul ile iliþkili olduðu sonucuna varýlabilir.
82 – Doðal Dil Ýþleme
Bir yazý içinde sýk kullanýlan sözcükleri arama ve bunun sonucu olarak metnin içerdiði bilgiye
eriþme yöntemi bükümlü diller için uygulanabilir bir yöntemdir. Türkçe gibi bitiþken dillerde
yazýnýn konusunu belirlemek için ayný yöntemi kullanmak oldukça zordur. Örneðin “göz” ile
ilgili bir araþtýrma yaptýðýmýzda “göz, gözlük, gözlükçü, gözlükçülük” gibi konular da karþýmýza
gelebilir. Benzer bir araþtýrmayý Ýngilizce için yaptýðýmýzda “eye” yazdýðýmýzda sadece “göz” ile
ilgili yazýlar gelecektir. Çünkü “gözlük” ve “gözlükçü” sözcüklerinin Ýngilizce karþýlýklarý çok
farklý sözcüklerdir: (eye glass, optometrist)
Özellikle bitiþken dillerde yazýlmýþ metinlerde bilgiye eriþim amaçlý geliþtirilecek çalýþmalara
katýlacak olanlarýn dilin biçim bilimsel özelliklerini bilmeleri gerekir.
Ýnternet’teki arama çalýþmalarýný kolaylaþtýrmak ve daha anlamlý kýlmak üzere “anlamsal web”
adýyla yeni çalýþmalar baþlatýlmýþtýr. Anlamsal web de metinlerin ilgili olduklarý konuyu
belirten etiketlerin bulunmasý hedeflenmektedir.
Þu anda okuduðunuz yazý anlamsal web’de yer alsaydý þöyle etiketlenebilirdi:
· Konu : Doðal dil iþleme
· Alt konu : DDÝ ilgi alanlarý, DDÝ’nin karþýlaþtýðý sorunlar, Dillerin karþýlaþtýrýlmasý
Bilgiye eriþim konusunda çalýþmak isteyenler anlam bilimi dâhil dile iliþkin tüm özellikleri
bilmek durumundadýr.
6.1.7 Metni Anlama
Yazýlý metinlerin anlamýný çýkarmak ve bu anlamý eyleme dönüþtürmek, doðal dil iþleme
alanýndaki bir diðer araþtýrma konusudur. Bu çalýþmalarýn amacý kýsa metinlerin veya
tümcelerin tam ve kesin olarak anlaþýlmasýný hedeflenmektedir.
Bir tümcenin anlamýný çýkarmak, deðiþik alanlarda uygulanabilecek bir konudur. Örneðin,
bankalara gelen yazýlý yönergeler, günümüzde insanlar tarafýndan okunmakta ve istek insan
tarafýndan bilgisayara aktarýlmaktadýr. Genellikle bir tümce halinde olan yönergenin anlamýný
çýkaran ve uygulamaya geçen çözümler yakýn zamanda görülmektedir. Bankalara gönderilen
yönergelere bir örnek aþaðýda verilmiþtir:
“Bankanýzýn Merkez þubesindeki 1234-56789 numaralý hesabýmdan 1500 TL nin, bankanýzýn
Ankara þubesindeki 1255-54321 numaralý Bartu Yiðit hesabýna havale edilmesini rica ederim.”
Bu tür yönergeler, örnekte olduðu gibi, genellikle belli bir kalýba uygun olarak yazýlýr. Metnin
anlamýný çýkarýrken sýrasýyla;
• Kaynak ve hedef hesaplarýn ad ve numaralarý belirlenir
• Aktarýlacak para miktarý belirlenir
• Ýþlemin türü öðrenilir
6.1 DDÝ Ýlgi Alanlarý – 83
Bu temel bileþenlerin belirlenmesinde çok dikkatli olunmasý gerekir. Çünkü metinden
çýkarýlacak anlam daha sonra eyleme dönüþtürülecektir. Küçük bir yanlýþ anlama önemli maddi
kayýplara neden olabilir. Bu nedenle, bilgisayarýn anladýðý yönergenin bir insan tarafýndan
onanmasý uygun olabilir.
Ýnsanlarýn isteklerini yazýlý olarak anlatabilmeleri, DDÝ’nin ilk zamanlarýndan beri amaçlanan
bir konudur. Günümüzde bu yöndeki uygulamalarýn Internet üzerinden yapýlan iþlemlerde
kullanýlmasý hedeflenmektedir. Ýnsanlarýn isteklerini düz bir tümce ile belirtmeleri
beklenmektedir. Örneðin bir e-ticaret sayfasýnda,
“Bu akþam katýlacaðým toplantýda giymek üzere bir takým elbise almak istiyorum”
tümcesini yazarak, kendisine en uygun elbiseyi satýn alabilmek, yeni kuþak insanlarýnýn
beklentisidir.
Bir metni tam olarak anlamak için, sesbilim, biçimbilim, sözdizimi ve anlambilimini bilmek
gerekir.
6.1.8 Metin Seslendirme
Yazýlý bir metni seslendirme bir baþka deyiþle okuma biliþim dünyasýnýn üzerinde uzun süredir
çalýþtýðý bir konudur. Çok basit bir gösterimle bilgisayarýn bir metni sesli olarak okumasý diye
özetleyebiliriz.
Ýnsanlar konuþurken sürekli ses çýkardýklarý düþünülebilir. Ancak konuþmanýn sözcükler ve
sözcüklerin de harflerden oluþtuðu bir gerçektir. Bu açýdan deðerlendirildiðinde bir metni
seslendirmek için ses bilimini bilmek gerekir. Ses bilimi, bir dildeki sesleri inceler ve dildeki
sesleri ortaya koyar.
Türkçe, yazýldýðý gibi okunan bir dil olarak tanýmlanmasýna karþýn yabancý dillerden alýnan
sözcükler ile eski dilden kalan sözcüklerde bazý harflerin birden fazla söyleniþ biçimleri
bulunmaktadýr. Örneðin kalýn ” a ” ve ince ” a ” gibi.
Yazýlý bir metni seslendirmede ilk adým, metni sesçil abeceye dönüþtürmektir. Bunun ardýndan
sesçil abece ile yazýlmýþ olan metni dilin vurgu özelliklerine uygun olarak seslendirmektir.
Bir metni seslendirmek üzere iki temel
yöntemden biri kullanýlmaktadýr:
• Doðal sesleri ekleme yöntemi
• Yapay ses üretme yöntemi
Doðal sesleri ekleme yöntemi, insan
tarafýndan üretilmiþ ses kayýtlarýnýn
kullanýlmasý ilkesine dayanýr. Bu
yöntemde en büyük parçadan en küçük
parçaya kadar ekleme yöntemi
kullanýlmaktadýr.
84 – Doðal Dil Ýþleme
Bugün hava çok güzel
caným çalýþmak istemiyor
Yarýn çalýþýrým
Olmazsa öbür gün
Þekil-6.2: Bir metnin seslendirilmesi
Örneðin bilgisayarlý yanýtlama dizgelerinde belli sorulara karþý hazýrlanmýþ yanýt tümcenin
tamamý insan tarafýndan seslendirilebilir. Örneðin; “Kuruluþumuzu aramýþ olmanýzdan dolayý
teþekkür ederiz.”
Bazý uygulamalarda, tümcenin tamamý yerine tümce içinde yer almasý olasý sözcük kalýplarý
seslendirilerek veri tabanýnda saklanmaktadýr. Böylece veri tabanýndaki seslendirilmiþ kayýt
sayýsý azaltýlmaya çalýþýlýr. Örneðin; “Ankara’ya gidecek yolcularýn 212 numaralý bekleme
salonuna gelmeleri beklenmektedir.” tümcesinde koyu olarak görülen kent adý ve salon
numaralarý bir yerde diðer sözcükler bir baþka yerde saklanýr. Koyu yazýlý sözcükler
deðiþkendir; diðerleri sabit kabul edilebilir. Deðiþken sözcükler deðiþtirilerek ayný bilgi þöyle
de okunabilir: Konya’ya gidecek yolcularýn 344 numaralý bekleme salonuna gelmeleri
beklenmektedir.
Yazýlý metni seslendirme, sesli kitap, sesli gazete veya görme özürlüler için yararlý bir uygulama
alanýdýr.
6.1.9 Konuþmayý Yazýya Dökme
Ýnsan konuþmasýný yazýya dökme doðal dil iþleme üzerinde çalýþanlar araþtýrmacýlar için ilgi
çekici bir araþtýrma konusudur.
Ýnsan aðzýndan çýkan seslerin mikrofon ile elektriksel sinyale dönüþtürüldüðü bilinmektedir. Bu
elektriksel sinyallerin iþlenmesi ile metne dönüþtürmek araþtýrmanýn temel bileþenidir. Ancak
bu dönüþtürme sürecinde dilin özelliklerinin bilinmesi gerekir. Sesçil bir dil olan Türkçe için
konuþmayý yazýya dönüþtürme iþleminin diðer dillere oranla daha kolay olacaðý söylenebilir.
Þekil-3’te konu ana hatlarý ile gösterilmiþtir.
Konuþmayý yazýya dökme iþlemi sadece bir konuþmayý yazýya dökmek için düþünülmemekte
yazýya dönüþen metnin anlaþýlýp eyleme dönüþtürülmesi amaçlanmaktadýr. Sadece bir
konuþmayý metne dönüþtürmek,
• Konuþmacýnýn, konuþmasýný yazýya
dökmek,
• Toplantý tutanaklarýný hazýrlamak,
gibi örnek uygulamalarda yararlý katkýlar
saðlayabilir.
Konuþmayý yazýya çevirmenin basit bir
uygulamasý kýsa emirlerin anlaþýlmasýdýr.
Örneðin,
• Terliðimi getir
• Kapýyý kapat
• Sol damar týkalý
• Ýki yüz on iki, iki yüz seksen beþ, otuz
altý, seksen altý
6.1 DDÝ Ýlgi Alanlarý – 85
Bugün hava çok güzel
caným çalýþmak istemiyor
Yarýn çalýþýrým
Olmazsa öbür gün
Þekil-6.3: Konuþmayý yazýya dökme
Ýlk iki örnek bir robota emir vermek için kullanýlabilir. Üçüncü örnek bir anjiyo iþleminde
doktorun tanýsýný ifade eder. Son tümce ise bir telefonu sesli olarak aramaya yarar. Bu
örneklerde konuþmayý yazýya dönüþtürmek amaçlanmamaktadýr. Ancak konuþma söz kalýplarý
ile karþýlaþtýrýlmakta ve uyduðu kalýba göre eylem yerine getirilmektedir.
6.1.10 Soru Yanýtlama
Bankalar, gezi düzenleyicileri ve oteller müþterilerine daha iyi hizmet vermek üzere çaðrý
merkezleri kurduklarý bilinmektedir. Bu merkezlerde çalýþanlar, müþterilerin isteklerini dinler
ve onlara en uygun hizmeti vermeye çalýþýrlar.
Çaðrý merkezlerinde çalýþanlarýn yüksek maliyeti, çaðrý merkezlerinin iþlevini bilgisayar ile
çözmek üzere çalýþmalar yapýlmasýný gerekli kýlmýþtýr. Kýsaca soru yanýtlama dizgesi olarak
adlandýrabileceðimiz bu dizgede, çaðrý merkezini telefonla arayan kiþinin isteði bilgisayar
tarafýndan anlaþýlacak ve kendisine en uygun yanýt verilecektir.
Günümüzde gerçekleþtirilen uygulamalarda müþterinin konuþmasýndan sözcükler yakalanmaya
çalýþýlmakta ve yakalanan sözcüðe baðlý olarak soru sorulmaktadýr. Soru yanýtlama dizgesi
dolayýsýyla konuþmayý metne çevirme ve metni seslendirme yöntemlerini içerir.
Günümüzde kullanýlan bir baþka sesli yanýt verme dizgesi örneði bankacýlýk, telefon santrali
gibi deðiþik alanlarda kullanýlmaktadýr. Bu alanlarda kullanýlan sesli yanýt dizgeleri akýllý
dizgeler deðildir. Genellikle önceden yapýlmýþ olan ses kayýtlarýný kullanarak arayanlara
yardýmcý olmaya çalýþmaktadýr. Günümüzde aþaðýda örneðini verdiðimiz düzeyde yanýtlama
dizgeleri kullanýlmaktadýr.
Yanýtlayan : Ýyi günler size nasýl yardýmcý olabilirim?
Müþteri : Bir kiþilik oda bakýyorum
Yanýtlayan : Bir kiþilik oda mý istiyorsunuz?
Müþteri : Evet
Yanýtlayan : Hangi gün geleceksiniz?
Müþteri : 10 Ekim Pazartesi ve sonrasýndaki üç gün için
Yanýtlayan : 10 Ekimde giriþ mi yapacaksýnýz?
Müþteri : Evet, 10 Ekim öðlen giriþ yapacaðým. Söyledim ya!
Yanýtlayan : Kaç gün kalmayý planlýyorsunuz?
Müþteri : 13 Ekimde ayrýlacaðým
Yanýtlayan : Sizin için odamýz var. Göl manzaralý oda isterseniz 10 TL fazla
ödeyeceksiniz ama manzaralý. Ýster misiniz?
Müþteri : Olabilir
Yanýtlayan : Anlayamadým. Evet mi dediniz
Müþteri : Evet, olabilir dedim
Yanýtlayan : Sizin odanýzý ayýrdým. Þimdi kimlik bilgilerinizi öðrenebilir miyim?

86 – Doðal Dil Ýþleme
Bu karþýlýklý konuþmadan anlaþýlacaðý gibi bilgisayar daha önceden kaydedilmiþ sorularý
sormakta ve belli kalýp yanýtlar beklemektedir. Bu kalýplar içinde belli sözcükleri yakalamaya
çalýþmaktadýr.
Yapay us konusundaki geliþmeler, bilgisayarlarýn anlamlý tümceler kurarak insanlar ile
konuþabileceðini müjdelemektedir. Bu tür dizgeler sesli olabileceði gibi yazýlý da olabilir.
Örneðin yazýlý olan dizge kullanýlarak bir hasta tanýlama dizgesi geliþtirilebilir. Böyle bir
dizgede, bilgisayar mantýklý ve amaca uygun sorular sorar. Hastanýn vereceði yanýtlara baðlý
olarak yeni sorulacak soruyu oluþturur. Bu veya sözlü dizge hastalýða taný koyabilir.
Soru yanýtlama çalýþmalarý DDÝ’nin ilk dönemlerinin düþüdür ve günümüzde uygulanabilir
duruma gelmiþtir.
6.1.11 Çeviri
Diller arasý çeviri insanlýðýn önemli düþlerindendir. Düþlenen þey; bir kiþinin ana dilinde
konuþmasý, karþýsýndaki kiþinin bunu kendi dilinde dinlemesidir. Diller arasý çeviri konusu iki
dilin ses bilimi, biçim bilimi, söz dizimi ve anlam bilimi özelliklerini bilmeyi gerektirir.
Günümüzde bilgisayar desteðiyle yapýlan çeviriler en basit olandan en karmaþýk olana doðru
sýralanabilir: Sözcük çevirisi, tümcecik çevirisi, tümce çevirisi. Gerçekleþtirilen metinden
metne çeviri dizgelerinin bazýlarý insan gözetimi gerektirirken bazýlarý insan yardýmý olmaksýzýn
çeviri yapabilmektedir.
Bir dilden diðer bir dile çeviri yapan kiþinin iki dili iyi þekilde bilmesinin yetmeyeceði çeviri
yaptýðý metnin konusu hakkýnda da bilgi sahibi olmasý gerekir. Söz gelimi týp konusundaki bir
kitabý çevirecek kiþinin týp konusunda uzman olmasýnýn gerekeceði açýktýr. Bilgisayar
yardýmýyla yapýlan çevirilerde de benzer bir güçlüðün olacaðý kolayca söylenebilir.
Günümüzde dünyada konuþulan diller belli dil ailelerinin üyeleridir. Ayný dil ailesinin üyesi
olan iki dil arasýnda çeviri yapmak, doðal olarak farklý iki dil ailesinin üyesi olan iki dil arasýnda
çeviri yapmaya göre daha kolaydýr. Bilgisayarlý çeviri dizgeleri gerçekleþtirilirken
kullanýlabilecek yöntemler dillerin ayný dil ailesinden olup olmadýðýna göre deðiþmektedir.
Bilgisayarlý çeviri amacýyla kullanýlan yöntemler kural temelli ve istatistiksel temelli olmak
üzere genel iki kümeye ayrýlabilir. Kural temelli çeviri yöntemleri, yabancý dil eðitiminde
izlenen yöntemlere benzer. Öncelik her iki dilin dil bilgisi kurallarýný bilgisayara öðretmektir.
Buna ek olarak çeviri sözlüðü bilgisayara yüklenir. Ýstatistiksel temelli çeviri çevirmenler
tarafýndan yapýlmýþ olan çeviri metinler içinde çevirisi yapýlmak istenen tümce veya tümceciðe
en yakýn olan karþýlýðý bulmaya dayanýr.
Bilgisayar kullanarak yapýlan çevirilerin baþarýmlarýný karþýlaþtýrabilmek için çeviri
dizgesinden beklentilerin tanýmlanmýþ olmasý gerekir. Bir bilgisayarlý çeviri dizgesi aþaðýdaki
özellikleri saðlamalýdýr:
• Ýnsan desteksiz : Çeviri dizgesi insan katký ve desteði olmadan çalýþabilmelidir.
6.1 DDÝ Ýlgi Alanlarý – 87
• Kaliteli : Çeviri dizgesinin ürettiði sonuçlar aslýna uygun ve anlaþýlýr olmalýdýr.
• Konu baðýmsýz : Çeviri dizgesi her türlü konuyu içeren metinleri çevirebilmelidir.
Yeni bir dili öðrenmeye çalýþanlarýn ilk yaptýklarý sözcüklerin karþýlýðýný ezberlemektir.
Ardýndan öðrenmeye çalýþtýklarý dilde tümce kurabilmektir. Bazý dillerde sözcükler yalýn hâlde
bulunmasýna karþýn bazýlarýnda sözcükler ekler alarak anlamlarýný deðiþtirmektedir. Tümce
içinde sözcüklerin niteliklerine göre diziliþi de dilden dile benzerlik ve farklýlýk göstermektedir.
Þekil-4’te Altay dil ailesine üye dillerinin ve Þekil-5’te Hint-Avrupa dil ailesine üye dillerin söz
dizimi biçimleri gösterilmiþtir.
Bu þekillerden görüldüðü gibi akraba dillerde tümce içindeki sözcüklerin sýralanýþý benzerlik
göstermektedir.
Bitiþken dillerde sözcükler çok sayýda
ek alabilmektedir. Özellikle yapým
ekleri sözcüðün anlamýný
deðiþtirmektedir. Hint-Avrupa
dillerinde ek sayýsý bir veya ikiyi
geçmemektedir.
Türkçe ve akraba dillerde ses uyumu
vardýr. Baþka dillerde ses uyumu diye
bir kural bulunmamaktadýr.
Diller arasý çeviri yapýlacaðýnda
aþaðýda sýralanan tüm bilgilerin her iki
dil için de bilinmesi gerekmektedir:
88 – Doðal Dil Ýþleme
O kalemini tek silahý olarak görür
O olarak görür kalemini gibi kendi silah
O ugy tekinti a tollat mint sajat fegyver
Kereha pendakewo karenojuu tosite miru
O kalemini tek silahý olarak görür
O görür kalemini olarak tek silahý
Han pitaa kynaansa ainoana aseenaan
Macarca FÝnce
Japonca
Þekil-6.4: Türkçe, Japonca, Macarca ve Fince tümce yapýlarý
He regards his pen as his only arm
O görür kalemini olarak tek silahý
Il considere son crayon comme sa seul arme
He regards his pen as his only arm
O görür kalemini olarak tek silahý
Ýngilizce
Fransýzca
Þekil-6.5: Ýngilizce ve Fransýzca tümce yapýsý
• Ses bilimsel
• Biçim bilimsel
• Söz dizimsel
• Dilimleme
• Anlatým biçimi
Günümüzde diller arasý çeviri metinden metne yapýlmaya çalýþýlmaktadýr. Sesten sese çeviri
yöntemleri üzerinde de çalýþmalarýn olduðu bilinmektedir.
6.2 DDÝ Çalýþmalarýnda Karþýlaþýlan Zorluklar
Önceki bölümde DDÝ alanýnda çalýþanlarýn ilgi alanlarý kýsa açýklamalarla sunulmuþtur.
Aslýnda, sunulan her konu bir kitap olabilecek kadar geniþtir. Bu bölümde DDÝ konularý
iþlenirken karþýlaþýlan güçlükler ve bu güçlükleri aþmak için sürdürülen çabalardan özet
biçiminde söz edilecektir. Karþýlaþýlan sorunlarýn baþlýklarý aþaðýda sýralanmýþtýr:
• Kuralsýz ve anlaþýlmaz konuþmalar
• Kuralsýz ve bozuk yazýlar
• Konuþmayý dilimleme
• Metni dilimleme
• Sözcük niteliklerini belirleme
• Anlam belirsizliklerini giderme
• Söz dizimsel belirsizliklerin giderilmesi
• Konuþma planý
6.2.1 Kuralsýz ve Anlaþýlmaz Konuþmalar
Her dilin en güzel ve kurallarý çerçevesinde konuþulduðu bir yer vardýr. Bu yer o dil için ölçünlü
dil olarak kabul edilir. Konuþmayý anlama ve yazýya dökme üzerinde çalýþanlar bu çalýþmalarý
ölçünlü dil üzerinde sürdürürler. Her dil yöresel olarak farklý biçimde konuþulabilir. Ayný dili
konuþup birbirini anlamayan yöre insanlarýna da rastlanmaktadýr. Aþaðýda, konuya açýklýk
getirmek için Türkçe bazý örnek tümceler verilmiþtir.
• Abim bögün okula gelmicek
• Napýyon len?
• Gelcen mi?
Türkçenin sesçil bir dil olmasý yukarýdaki örnekleri yazýya dökme sürecinde önemli bir soruna
neden olmaz. Sözcükleri aðýzdan çýktýðý gibi yazarsak Türkçe konuþanlar bunu anlayacaklardýr.
Sesçil olmayan dillerde kural dýþý veya aksanlý söyleyiþ biçimleri için ayrý bir yazým kuralý
geliþtirmek gerekmektedir.
6.2 DDÝ Çalýþmalarýnda Karþýlaþýlan Zorluklar – 89
Yukarýda verilen örnekler yöresel aðýzlardan alýnmýþ örneklerdir. Bu tür örneklerin dýþýnda
kalan çoðunlukla gelip geçici konuþma biçimleri için çözüm bulmanýn çok gerekli olmadýðý
düþünülebilir. Çünkü konuþmayý metne çevirme konusundaki çalýþmalarýn temel hedefi;
• Konuþma tutanaklarýný oluþturmak,
• Ýnsanýn isteklerini anlayabilmek,
• Ýnsanýn söylediðinden bilgisayar için veri üretmek
• Ýnsanýn verdiði sözlü emirler ile bilgisayarlý dizgeleri yönetmek
biçiminde özetlenebilir.
Toplantý, bilimsel, ticari veya siyasi olabilir. Böyle bir toplantýda konuþulanlarýn genellikle
düzenli ve kurallý olduðu varsayýlabilir.
Özellikle bilgisayarlý yanýtlama dizgelerinde müþterinin söylediklerini anlamak önemli
olmaktadýr. Her müþterinin ölçünlü dili kullandýðý söylenemez. Bu durumda müþteriye kesin
yanýt vereceði sorular sorularak konuþmasý anlaþýlýr hâle getirilir.
Bazý konuþma tanýma dizgeleri sadece veri giriþi amaçlýdýr. Örneðin sesle telefon numarasý
çevrilmesi, hekimin hastaya koyduðu tanýyý söylemesi gibi. Bu örneklerde bilgisayarýn
beklediði sözcük veya sözcük öbeði bellidir. Bu sözcüklerin ve sözcük öbeklerinin bilgisayara
öðretilmesi ile sorunun üstesinden gelinir.
Robot gibi akýllý dizgeleri sözlü emirlerle yöneltmek istediðimizde, belli sözcükleri kullanýrýz.
Bu sözcükleri anlaþýlýr biçimde söylediðimizde robot tarafýndan anlaþýlacaktýr.
Konuþmayý anlama çalýþmalarýnda, anlamayý zorlaþtýran baþka etkenler de bulunmaktadýr.
• Gürültü sorunu
• Kiþiye baðlýlýk
• Konuya baðlýlýk
Metne çevrilecek olan tüm konuþmalarýn gürültüden arýnmýþ ortamlarda dinlenilmiþ veya
kaydedilmiþ olmasý her zaman olanaklý deðildir. Konuþmalarýn gerisinde çeþitli gürültüler
olabilir. Bu durumda konuþmayý gürültüden ayýrt etmek baþlý baþýna bir sorundur. Konuþma ile
gürültüyü ayýrt etmenin zorluk derecesini konuþmanýn genliði ile gürültünün genliði arasýndaki
oran belirler. Bir baþka deyiþle gürültünün genliði büyüdükçe ayýrt etme iþlemi zorlaþýr hatta
olanaksýz hâle gelebilir.
Bir dilde özellikle ünlülerin temel frekanslarý bellidir. Bu temel frekans insandan insana
deðiþmez. Ancak harmoniklerinin genliði insandan insana deðiþir. Bu özellik konuþan kiþinin
kimliðini anlamamýzý saðlar. Konuþmayý anlayan dizgeyi belli bir insan sesi için ayarlamak
daha kolaydýr. Ayný dizgeyi konuþmacýdan baðýmsýz hâle getirmek daha geliþmiþ bir çözüm
gerektirir.
90 – Doðal Dil Ýþleme
Konuþma metni içinde geçen sözcüklerin çokluðu anlamayý zorlaþtýrýr. Bir baþka deyiþle sözcük
daðarcýðý sýnýrlý olan bir konuþma tanýma dizgesi geliþtirmek daha kolaydýr.
6.2.2 Kuralsýz ve Bozuk Yazýlar
Günlük yaþamýmýzda karþýlaþtýðýmýz yazýlarýn tamamýnda dil bilgisi kurallarýna uygun
yazýldýklarýný ve noktalama iþaretlerinin doðru kullanýldýðýný söylemek zordur. Basýlý metinlerin
bilgisayara aktarýmý optik karakter okuyucu ile gerçekleþtiriliyor ise bazý karakterlerin yanlýþ
okunduðu da bir gerçektir. Yazýlý metinler içinde kýsaltmalar da bulunabilir. Hatta bazý sözcük
kümeleri hem açýk hem de kýsaltma biçiminde yer almýþ olabilir. Metin günlük veya yöresel
konuþmalarýn yazýlmýþ hâli de olabilir.
Böylesine sorunlu metinler üzerinde önceki bölümde anlatýlan DDÝ çalýþmalarýný
gerçekleþtirebilmek için metnin hatalarýndan arýndýrýlmasý gerekir. En sýk karþýlaþýlan hatalar
yazým hatalarýdýr. Özellikle sesçil olmayan Ýngilizce gibi dillerde yazým hatalarýnýn sayýsý
azýmsanmayacak kadar çoktur. Yazým hatalarýný gidermeye yönelik çalýþmalar öncelikle
sözcüklerin doðru yazýlmýþ olup olmadýklarýný denetler ve düzeltmeye çalýþýr. Yanlýþ yazýlmýþ
sözcükleri düzeltmede,
• Yanlýþ yazýldýðý saptanan sözcüðe en yakýn benzer sözcük bulunmaya çalýþýlýr. Bu
kapsamda harf sýralarýnda þaþýrma olup olmadýðý, eksik harf veya yanlýþ harf olup
olmadýðý araþtýrýlýr.
• Türkçe gibi kurallý dillerde sözcük kurallara göre düzeltilmeye çalýþýlýr.
Konuya açýklýk getirmek amacýyla aþaðýdaki örnekleri incelemekte yarar vardýr.
Yazýlmak istenen sözcük “kelebek” olsun. Ancak yazýlan sözcükler þunlardan biri olabilir:
Kelebeklar
Kelebkler
Keleebler
Birinci yanlýþ sözcükte “e harfi yerine “a” yazýldýðý görülmektedir. Yedi harften oluþan bu
yanlýþ sözcüðe sözlükteki en yakýn sözcük “kelebek”tir. Bu iki sözcüðün benzerlik oraný 6/7 dir.
Sözcükteki harf sayýsý fazla ise bu yöntem olumlu sonuç vermektedir. Benzerlik yöntemiyle
hata giderme her zaman olumlu sonuç vermeyebilir. Örneðin, “liman” ve “limon” sözcükleri 4/5
oranýnda benzemektedir ancak her iki sözcük de sözlükte vardýr. Dolayýsýyla her ikisi de doðru
olabilir veya biri yanlýþ yazýlmýþ olabilir.
Ýkinci örnekte bir harf eksik yazýlmýþtýr. Bu sözcüðün en yakýn karþýlýðý sözlük veri tabanýnda
araþtýrýldýðýnda “kelebek” sözcüðüne eriþilecektir. Çünkü ilk dört ve son üç harfi aynýdýr. Bu
sonuç bir harfin eksik olduðunu göstermektedir.
Daktilo ve bilgisayar ile yazý yazýlýrken sýkça yapýlan bir yanlýþ iki harfin ters sýrada
basýlmasýdýr. Üçüncü örnek bu tür yanlýþlara bir örnektir. Sýra þaþýrmasý adýný verebileceðimiz
6.2 DDÝ Çalýþmalarýnda Karþýlaþýlan Zorluklar – 91
bu yanlýþý bulabilmek için yine sözlük veri tabanýnda en yakýn benzer sözlük aranýr ve en yakýn
sözcük ile harf þaþýrmasý olup olmadýðýna bakýlýr.
Türkçe gibi kurallý diller için sözlük kullanmaya gerek duymayan yöntemler geliþtirilebilir.
Örneðin yanlýþ yazýlan ilk sözcükteki “a” harfinin yanlýþ yazýldýðý, doðrusunun “e” olmasý
gerektiði ses bilimi kurallarýndan çýkarýlabilir.
Ýkinci ve üçüncü yanlýþ sözcükler incelendiðinde Türkçenin hece kurallarýný saðlamadýklarý
görülür. Dolayýsýyla öncelikle yanlýþ yazýlmýþ olduklarýna karar verilir. Verilen karara uygun
olarak düzeltme sürecine geçilir.
6.2.3 Konuþmayý Dilimleme
Sýradan insanlarýn konuþmalarýnda sözcüklerin nerede baþlayýp nerede sonlandýðýný anlamak
kolay deðildir. Benzer þekilde tümcenin nerede baþlayýp nerede sonlandýðý da kolayca
anlaþýlamaz. Bazý konuþmacýlar bir tümceyi tamamlamadan bir baþka tümceye baþlar.
Konuþmayý metne çevirme sürecinde karþýlaþýlan bu zorluk konuþmacýnýn soluk almasý, ara
vermesi ve dil bilgisi kurallarý yardýmýyla çözümlenmeye çalýþýlmaktadýr.
6.2.4 Metin Dilimleme
Bazý dillerde yazýlmýþ metinlere baktýðýmýzda her bir sözcüðü ve tümceyi kesin biçimde ayýrt
edebiliriz. Buna karþýn bazý dillerde sözcükleri birbirinden ayýrt etmek çok zordur. Çin, Japon,
Tayland dillerinde sözcüklerin nerede baþlayýp nerede bittiðini anlamak, dolayýsýyla sözcükleri
ayýrt etmek zordur. Almancada birden fazla sözcük birleþtirilerek tek sözcük hâlinde
kullanýlmaktadýr.
Bazý dillerde, tümceler çok uzun kurulmaktadýr. Bir tümcenin beþ on satýr kapsadýðý, bir
paragraf kadar uzun olduðu görülmektedir. Arap metinleri bu özelliktedir. Benzer duruma XIX.
yüzyýl Osmanlý metinlerinde de rastlanmaktadýr. O devirde uzun tümce kurmak bir hüner olarak
görülmüþtür. Bu yazým alýþkanlýðýnýn hukuk alanýnda hâlâ sürdürüldüðü görülmektedir.
Uzun tümcelerin taþýdýðý anlamý ortaya çýkarmak için önce tümceyi dilimlemek ve her bir dilimi
ayrý anlamlandýrmak gerekir. Benzer durum sözcükler için de geçerlidir. Bitiþik sözcükleri önce
sözcük dilimlerine ayýrmak ve dilimlenmiþ sözcüklerin hedef çeviri dilindeki karþýlýklarýný
bulmak gerekir.
6.2.5 Sözcük Niteliklerindeki Belirsizlik
Doðal dil iþlemenin en temel konularýnýn baþýnda sözcüklerin dil bilgisi açýsýndan niteliklerinin
belirlenmesi ve bu nitelikler ile sözcükleri etiketlemek gelir. Bir tümce içindeki bir sözcüðün
niteliðini belirlemek dil bilgisi bilen biri için kolay olmakla beraber bu iþlemin bilgisayar
92 – Doðal Dil Ýþleme
tarafýndan yapýlmasý oldukça zordur. Zorluðun nedeni her dilde bir sözcüðün birden fazla
niteliðinin bulunmasýndan kaynaklanmaktadýr.
En temel dil bilgisi kaynaklarý sözcükleri aþaðýdaki gibi sýnýflandýrmaktadýr:
Ad soylular
• Ad
• Sýfat
• Adýl
• Belirteç
• Ýlgeç
• Baðlaç
• Ünlem
Eylem soylular
• Eylem
Bu sýnýflar ayrýca kendi içlerinde alt kümelere, alt kümeler de kendi altýnda yeni niteliklere
ayrýlamaktadýr. Örneðin sýfatlar aþaðýdaki gibi iki aþamalý kümelenmektedirler:
• Niteleme Sýfatlarý
• Karþýlaþtýrma sýfatlarý
• Pekiþtirme sýfatlarý
• Küçültme sýfatlarý
• Unvan sýfatlarý
• Belirtme Sýfatlarý
• Ýþaret sýfatlarý
• Sayý sýfatlarý
• Belgisiz sýfatlar
• Soru sýfatlarý
Bu temel özelliklerin yaný sýra ad soylu sözcüklerin çoðul olma özellikleri de vardýr. Eylem
soylu sözcükler kiþi ve zaman bilgisi içerirler.
Türkçe gibi bitiþken dillerde kök sözcüðe ulanan ekler son derece etkindir. Köke eklenen ekler,
sözcüðün anlamýný deðiþtirebildiði gibi sözcüðün niteliðini de deðiþtirir.
Göz + lük + çü + ler
Bu örnekte kök sözcük “göz” dür ve görme organýný belirtir, ad soyludur.
6.2 DDÝ Çalýþmalarýnda Karþýlaþýlan Zorluklar – 93
Kök sözcüðe eklenen “lük ” yapým eki görmeye yardýmcý olan aracýn adýdýr. ad soyludur ve
gözlük artýk bir gövdedir.
Gözlük gövde sözcüðüne eklenen “çü” yapým eki, gözlük ticareti veya da üretimi ile ilgilenen
kiþi veya kuruluþlarý belirtir; ad soyludur, gövdedir.
Gözlükçü gövdesine eklenen “ler” çekim eki, bu sözcüðü çoðul yapmaktadýr.
Göz sözcüðüne farklý ekler eklenerek sözcüðün niteliði de deðiþtirilebilir. Örneðin;
Göz+le+mek : Eylem
Göz + de : Sýfat
Yukarýda verilen örnekte “göz” sözcüðünün görme organý anlamý kullanýlmýþtýr. Aslýnda “göz”
sözcüðü farklý anlamlarda da kullanýlmaktadýr, örneðin; çekmece gözü, iðne gözü, bellek gözü,
köprü gözü, iki gözlü ev (oda anlamýnda), suyun gözü (suyun çýktýðý yer), çubuklarda filiz veren
nokta, göze gelmek vb.
Yukarýda verilen örneklerden görüldüðü gibi tek baþýna “göz” sözcüðünü dil bilgisi açýsýndan
etiketlemeye kalktýðýmýzda ortaya çok sayýda belirsiz durum çýkacaktýr. Çok kaba bir
araþtýrmayla Türkçedeki sözcüklerin yarýsýnýn en az iki anlamý bulunduðu söylenebilir. Biçim
bilimi belirsizliði diyeceðimiz bu belirsizlikleri gidermek için dillere baðlý ve dillerden
baðýmsýz yöntemler geliþtirilmiþtir.
Komþu sözcüklere (önceki ve sonraki ya da önceki iki veya daha fazla) bakarak sözcüðün
niteliðini bulmaya çalýþan yöntemler bulunmaktadýr. Bu yöntemler çoðunlukla istatistiksel
temellidir ve “n-gram” adýný alýrlar (n komþu sözcük sayýsýný belirler). Ýstatistiksel yöntemle
sözcük niteliðini belirlemek için derlemlerden yararlanýlýr.
Komþu sözcüklere bakarak kural tabanlý karar verme yöntemleri de geliþtirilmiþtir. Örneðin “ela
göz” ikilisinde, “ela” sözcüðünün niteleme sýfatý olduðu ve bir ad soyluyu niteleyeceði bilindiði
için “göz” sözcüðünün ad soylu olduðu söylenebilir.
Tek baþýna sözcüðe bakarak niteliðini ortaya koymak için bitiþken dillerde köke ulanan yapým
ve çekim eklerine bakmak da bir yöntem olarak geliþtirilmiþtir. Bu ilkeyi temel alarak Türkçe
için geliþtirilmiþ yöntemlerin nitelik belirlemede %90’dan daha iyi sonuç verdikleri
söylenmektedir.
6.2.6 Anlam Belirsizliði
Her dilde anlamlarý farklý ancak yazýlýþlarý ayný olan sözcükler bulunmaktadýr. Sesteþ denilen bu
sözcükler, bir yazýnýn anlaþýlmasýnda zaman zaman anlam belirsizliklerine neden olmaktadýr.
Sesteþ sözcükler ad soylu olabilecekleri gibi hem ad hem de eylem soylu olabilirler. Türkçede
hem ad ve hem de eylem soylu sesteþ sözcüklerin sayýsýnýn az olduðu söylenmektedir. Anlam
belirsizliði özellikle diller arasý bilgisayarlý çeviride önemli bir sorun olarak karþýmýza
çýkmaktadýr. Konuyu açmak amacýyla aþaðýdaki gazete baþlýðýný okumakta yarar vardýr.
94 – Doðal Dil Ýþleme
Köprücüler Ýstanbul’da toplanýyor
Çok satan ve saygýn bir gazetemizde çýkan bu baþlýðý ilk okuyan bir okur, köprü inþaatý ile
ilgilenen kuruluþ yetkililerinin Ýstanbul’da bir toplantýda bir araya geleceklerini düþünür. Yazýyý
okumaya baþlayýnca þaþýrýr. Çünkü toplantý sonunda birinci geleceklere ödüllerin
verileceðinden söz edilmektedir. Okuyucu biraz kafasýný yorduðunda toplantýya katýlanlarýn
köprü yapýmcýlarý olmadýðýný, briç oyuncularý olduðunu anlayacaktýr. Dýþ kaynaklý bu haberi
dilimize çeviren kiþi Ýngilizcede (bridge) sesteþ olan briç oyunu ve köprü sözcüklerini
karýþtýrmýþtýr. Aslýnda Ýngilizcede “bridge” sözcüðünün baþka anlamlarý da vardýr.
Yukarýda verdiðimiz örnekten de anlaþýlacaðý gibi anlam belirsizliði diller arasý çevirilerde
önemli bir sorun olarak karþýmýza çýkmaktadýr. Bu tür belirsizlikleri gidermek için tek bir
sözcüðe bakmak yerine kullanýldýðý tümceye hatta içinde yer aldýðý metnin tamamýna bakmak
gerekebilir.
1958 Jacques Tati yapýmý ve ülkemizde “Amcam” adýyla gösterilmiþ olan Fransýz yapýmý filmin
adýnýn (mon oncle) yanlýþ çevrildiðini dikkatli izleyiciler kolayca fark edebilmiþlerdir. Çünkü
film kadýn oyuncunun dayýsý ile olan iliþkileri üzerine kurulmuþtu. Bu örnek bir dilde akrabalýk
ile ilgili sözcüklerin zengin olmasýna karþýn diðer dilde bu alandaki fakirlik olmasýnýn neden
olduðu belirsizlik için güzel bir örnektir. Fransýzcada “oncle” sözcüðü amca ve dayý için
kullanýlmaktadýr. Bir bilgisayarýn filmi izleyip Türkçe çevirisinde “oncle” sözcüðüne karþýlýk
olarak amca mý yoksa dayý mý deme konusunda karar vermesi beklenmemelidir.
6.2.7 Söz Dizimsel Belirsizlik
DDÝ ile ilgilenen biliþimciler doðal dillerin bilgisayar programlama dilleri kadar kesin olmasýný
beklerler. Ancak doðal diller bu konuda DDÝ alanýnda çalýþanlarý hayal kýrýklýðýna uðratýrlar.
Bazý diller söz dizim kurallarý açýsýndan diðer dillere oranla daha katý özelliklere sahiptir. Bazý
diller ise son derece esnektir. Konuya açýklýk getirmek için kýsa ve basit bir tümceyi ele alalým.
Örneðin Ýngilizce de þu iki tümceyi ele alalým;
“Ali gave the bears the quins because they were hungry”
“Ali gave the bears the quins because they were sweet”
Dil bilgisi yapýsý açýsýndan deðerlendirildiðinde bu iki tümcenin ayný yapýda olduðu kolayca
söylenebilir. Ancak anlatmak istedikleri farklýdýr. Birinci tümce, ayýlar aç olduðu için Ali’nin
ayvalarý ayýlara verdiðini söylemektedir. Ýkinci tümce ise ayvalar tatlý olduðu için Ali’nin
ayvalarý ayýlara verdiði söylenmektedir. Bu örneklerden görüldüðü gibi, tümce içinde
sözcüklerin sýralanýþý ayný olsa bile tümcelerin anlatmak istediði þey farklý olabilir. Benzer söz
dizimsel belirsizlikler Türkçe tümceler için de geçerlidir:
Ali ayvalarý ayýlara aç olduklarý için verdi.
Ali ayvalarý ayýlara tatlý olduklarý için verdi.
6.2 DDÝ Çalýþmalarýnda Karþýlaþýlan Zorluklar – 95
Bu örneklerdeki belirsizlikler ancak sözcüklerin iliþkileri ile çözülebilmektedir. Sözcükler
arasýndaki iliþkiler, “sözcük aðý veya sözcük aðacý” denilen bir yapýya oturtulmaktadýr. Bu aðaç
üzerinde dilde olan her sözcük yer bulmaktadýr. Aðaç üzerindeki bir sözcüðe bakýldýðýnda üst ve
alt iliþki kümeleri görülebilmektedir.
Yukarýdaki ilk tümcede “açlýk” ile “canlý” sözcükleri iliþkilidir. Ayý bir canlý olduðuna göre
“açlýk” sözcüðü “ayý” ile iliþkilendirilmektedir. Ýkinci tümcede “tatlý” ile “ayva” sözcüðü
iliþkilendirilmektedir. Çünkü meyve gibi nesnelerin tatlýlýðýndan söz edilebilir. Ayýlarýn tatlý
olmasý söz konusu deðildir.
Söz dizimi kurallarý açýsýndan Türkçe çok esnek sayýlabilir. Aþaðýdaki örnekler Türkçenin bu
özelliði için çarpýcý örneklerdir.
Telefonla baðlan dünyaya
Baðlan telefonla dünyaya
Dünyaya telefonla baðlan
Telefon, baðlanmak ve dünya gibi üç sözcük ancak yukarýda gösterildiði gibi üç biçimde
sýralanabilir. Bu üç tümcenin anlatmak istediði þey aynýdýr. Diðer bir deyiþle anlamlarý aynýdýr.
Bu üç tümcenin ayný anlamý vermelerinin nedeni sözcüklerin aldýðý eklerdir. Benzer bir örnek
bitiþken olmayan bir dilde görülemez.
6.3 Dillerin Karþýlaþtýrýlmasý
Daha önce söylendiði gibi dünyada 4000’den fazla konuþulan dil olmasýna karþýn yaygýn olarak
kullanýlan dillerin sayýsý sýnýrlýdýr. Yaygýn kullaným sýralamasýnda Türkçe beþinci sýrada yer
almaktadýr. Dillerin bilimsel olarak karþýlaþtýrýlmasýný yapmak üzere geliþtirilmiþ ölçütlere
rastlanmamakla beraber bazý ölçütleri üretmek için aklýmýzý kullanabiliriz.
Duygu, düþünce ve eylemlerimizi anlatmaya yarayan bir araç olarak tanýmlanabilir. Bu
tanýmdan da anlaþýlacaðý gibi önemli olan çevremizdekilerle iletiþim kurabilmektir. Kolaycý bir
yaklaþýmla bir dili diðer dillere karþý güçlü gösteren özelliðin söz varlýðý olduðu söylenebilir.
Dilleri karþýlaþtýrýrken söz varlýðýnýn geniþliði bir ölçü olabilir ancak tek bu ölçü ile dilleri
karþýlaþtýrmanýn doðru olamayacaðýný söyleyebiliriz. Kanýmýzca ölçü olabilecek baþlýklar
aþaðýda sýralanmýþtýr:
• Anlaþýlýrlýk
• Söyleyiþ kolaylýðý
• Söz varlýðý
• Ýþleklik
• Belirginlik
96 – Doðal Dil Ýþleme
• Kurallý olmak
Bu kýsýmda yapacaðýmýz deðerlendirmenin dil bilimi açýsýndan deðil mühendis gözüyle
yapýldýðýný vurgulamak isterim.
6.3.1 Anlaþýlýrlýk
Telefon hatlarýnýn iletiþim kalitesini ölçmek için kullanýlan bir yöntem, bir dilin anlaþýlýrlýðýný
ölçmek için kullanýlabilir. Deneyin yapýlýþ biçimi þöyledir: Birbirini görmeyen iki kiþi telefon
aracýlýðý ile konuþmaya baþlarlar. Söz gelimi telefonun bir ucunda Eren diðer ucunda Gözde
bulunmaktadýr. Bu kiþilerin düzgün ve ölçünlü dili kullandýklarý varsayýlacaktýr. Eren kendisine
verilmiþ olan bir metni belli bir hýzla okur, diðer taraftaki Gözde duyduklarýný yazar. Erenin
okumasý bittiðinde Gözde ayný boyda ancak farklý bir metni okumaya baþlar. Bu kez Eren
duyduklarýný yazar. Deney bittiðinde iki tarafýn yazdýklarý gerçek metinler ile karþýlaþtýrýlýr.
Doðal olarak her iki dinleyicinin yanlýþ duyduklarý dolayýsýyla yanlýþ yazdýklarý sözcükler
olacaktýr. Anlaþýlýrlýk derecesi aþaðýdaki gibi yazýlabilir:
AD YS YS
M M
= –
+
+
1 1 2
1 2
Bu baðýntýda,
AD : Anlaþýlýrlýk derecesi
YS : Yanlýþ sayýsý, YS1 : birinci dinleyenin yanlýþ sayýsý
M : Okunan metindeki sözcük sayýsý, M1 : Birinci okuyucunun okuduðu metnin
sözcük sayýsý
Bu deney çok sayýda faklý iki kiþi arasýnda yapýlýr ve her deney sonunda bulunan anlaþýlýrlýk
derecelerinin ortalamasý alýnýrsa bir dile iliþkin anlaþýlýrlýk derecesi ölçülmüþ olur. Ayný deney
farklý diller için benzer þekilde gerçekleþtirildiðinde diðer diller için de anlaþýlýrlýk derecesi
hesaplanmýþ olacaktýr. Deneyin bilimsel olabilmesi için ayný telefon baðlantýsýnýn
kullanýlmasýna seçilen kiþilerin eðitim düzeylerinin ve konuþma düzgünlüklerinin yaklaþýk ayný
olmasýna dikkat edilmelidir.
Türk dilinin iletiþim ortamlarýnda anlaþýlýrlýk deneyleri yapýlmaktadýr. Bu deneyler, Türkçenin
anlaþýlýrlýðýnýn yüksek olduðunu göstermektedir.
6.3.2 Söyleyiþ Kolaylýðý
Dillerin söyleyiþ kolaylýðý ve kulaða geliþ biçimleri hakkýnda deðiþik görüþler dil bilimcileri
tarafýndan söylenmektedir. Dil bilimciler Türkçe için doðunun Ýtalyancasý nitelemesini
yaparlar. Bu deðerlendirmelerin öznel olduðu bir gerçektir. Ancak;
6.3 Dillerin Karþýlaþtýrýlmasý – 97
• Türkçenin ses uyumu kurallarýnýn,
• Sözcük ve tümce içindeki vurgularýn kurallý olmasýnýn
• Sesli harflerinin zenginliðinin
Türkçeyi kulaða hoþ gelen bir dil yaptýðý daha teknik bir deðerlendirme sayýlabilir.
Türkçe ve akraba dillerde ses uyum kurallarýnýn varlýðý bilinmektedir. Ses uyum kurallarý,
aslýnda ses organlarýmýzdan kaynaklanan bir sonuçtur. Ses uyum kurallarý hatýrlatmak açýsýndan
deðiþik bir bakýþ açýsýyla Þekil-6 ve Çizelge-1 verilmiþtir. Þekil-6 ve Çizelge-1 birlikte
incelendiðinde aþaðýdaki sonuçlar kolayca çýkarýlabilir:
• Dudaklarýmýz düz ve açýk iken aðzýmýzýn gerisinden çýkardýðýmýz ses “a” sesidir. “a”
ünlüsünün ardýndan aðýz ve dudaðýmýzýn þeklini bozmadan “a” ve çok az deðiþtirerek
“ý” ünlüsünü söyleyebiliriz.
• Dudaklarýmýz düz ve kapalý iken aðzýmýzýn ortasýndan çýkardýðýmýz ses “ý” sesidir. “ý”
ünlüsünün ardýndan aðýz ve dudaðýmýzýn þeklini bozmadan “ý” ve çok az deðiþtirerek
“a” ünlüsünü söyleyebiliriz.
• Dudaklarýmýz yuvarlak ve açýk iken aðzýmýzýn
gerisinden “o” sesini çýkarabiliriz. “o”
ünlüsünden sonra tekrar “o” sesini
çýkarabiliriz. Ancak kulaða hoþ gelmediðinden
Türkçe sözcüklerde bu duruma rastlanmaz.
Dudak yapýsýnda küçük bir deðiþiklikle “u” ve
“a” sesleri kolayca çýkarýlabilir.
• Dudaklarýmýz yuvarlak ve kapalý iken
aðzýmýzýn gerisinden “u” sesini çýkarabiliriz.
“u” ünlüsünün ardýndan yine “u” ünlüsü
gelebilir veya aðýz biçimimizi biraz
deðiþtirerek “a” sesini çýkarabiliriz.
Çizelge-1: Türkçenin Ünlü selerinin Çýkýþ Yerlerine Göre Kümeleniþi
Ön Orta Arka
Düz Yuvarlak Düz Yuvarlak Düz Yuvarlak
Kapalý i ü ý u
Açýk e ö a o
98 – Doðal Dil Ýþleme
a
e
u
ü
o
ö
ý
i
Þekil-6.6 : Sesli uyumu
• Dudaklarýmýz düz iken aðzýmýzýn ön kýsmýndan çýkardýðýmýz seslerden biri “e” diðeri
“i” sesidir. “e” ünlüsünden sonra “e” ünlüsünü çýkarmak için aðýz yapýmýzda bir
deðiþiklik yapmaya gerek yoktur. “e” ünlüsünün ardýndan aðýz ve dudaðýmýzýn
þeklinde küçük bir deðiþiklik yaparak “i”, “ö” ve “ü” seslerinden birini çýkarabiliriz. “i”
ünlüsünden sonra hiçbir deðiþiklik yapmadan “i” ve az deðiþiklikle “e” ünlüsü de kolay
çýkarýlabilir. Ancak “ö” ve “ü” ünlülerinden sonra “e” veya “i” ünlüsünü söylemek
zordur.
• Dudaklarýmýz yuvarlak ve açýk iken aðzýmýzýn ön kýsmýndan “ö” sesini çýkarabiliriz.
“ö” ünlüsünden sonra tekrar “ö” sesini çýkarabiliriz. Ancak kulaða hoþ gelmediðinden
Türkçe sözcüklerde bu duruma rastlanmaz.
• Dudaklarýmýz yuvarlak ve kapalý iken aðzýmýzýn ön kýsmýndan “ü” sesini çýkarabiliriz.
“ü” ünlüsünün ardýndan yine “ü” gelebilir.
Yukarýdaki açýklamalara bakarak aþaðýdaki genellemeleri yapabiliriz:
• Aðýz yapýmýzda hiç deðiþiklik yapmadan çýkarabileceðimiz ardýþýk ünlü, ilk ünlünün
aynýdýr.
• Ýlk ünlüyü söylerken dudaðýmýzýn durumu neyse (açýk veya kapalý) ardýþýk ünlüyü
söylerken de ayný kalmasý ardýþýk ünlüyü söylemeyi kolaylaþtýrýr.
• Ýlk ünlüyü söylerken dudaðýmýzýn durumu neyse (düz ya da yuvarlak) ardýþýl ünlüyü
söylerken de ayný kalmasý ardýþýk ünlüyü söylemeyi kolaylaþtýrýr.
• Yuvarlak ünlülerden “o” ve “u” düz ünlülere geçiþ ancak arka bölgede kalmak
koþuluyla yapýlabilir. Bu durumda geçiþ sadece “a” ünlüsüne olabilir.
• Düz “e” den sadece, ayný bölgede (ön) kalmak koþulu ile yuvarlak ünlülere (“ü” ve “ö”)
geçiþ olabilir.
Ünlüler arasý geçiþ olaylarýný ünlüler
dörtgeninde gösterdiðimizde yukarýda
yaptýðýmýz yorumlar açýk biçimde
görülmektedir, Þekil-6.7.
Þu iki yapay sözcüðü okumaya
çalýþalým.
tenteredi, tintoridö
Hangisini söylemek daha kolay?
Hangisi çenenizi daha az yoruyor? Ýlk
sözcüðü söylemek daha kolay ve
çenemizi daha az yoruyor. Bu sözcük
Türkçe bir sözcük olmasa da ünlülerin
diziliþi Türkçe ses kurallarýna uygun.
6.3 Dillerin Karþýlaþtýrýlmasý – 99
i
e
e
a
ø
?
oe
i
Y
y u
o
a
I
Ön Orta Arka
Kapalý
Yarý kapalý
Yarý açýk
Açýk
Þekil-6.7: Ünlüler arasý geçiþler
6.3.3 Söz Varlýðý
Bir dilin etkinliði söz varlýðýnýn zenginliði ile de ölçülebilir. Bir dilin söz varlýðýnýn geniþliði ile
o dili konuþan insanýn düþünme yeteneði doðru orantýlýdýr. Bir dilin söz varlýðýnýn zenginliðini
araþtýrýrken sadece sözlükteki sözcük sayýsýna bakmak doðru sonuç vermez.
Ýngilizceye veya Fransýzcaya iliþkin sözlüklere baktýðýmýzda sözcük zenginliðini görebiliyoruz.
Buna karþýn Türkçe sözlüklerdeki söz varlýðý az gibi görünüyor. Bükümlü dillerde her somut ve
soyut nesneye yeni bir ad vermek gerekmektedir. Bu özellik bu tür dillerde söz varlýðýnýn geniþ
olmasýný gerekli kýlýyor denebilir. Bitiþken ve Sami dillerinde kök sözcüðe eklenen ekler ile
yeni sözcük türetme olanaðý bulunmaktadýr. Türetilebilen sözcüklerin bazýlarý sözlüklerde yer
almasa bile anlamý o dili kullananlar tarafýndan anlaþýlmaktadýr. Durumu çok bildik örnekler ile
anlatabiliriz. Çizelge-2’de görme organý olan “göz” sözcüðünden sadece yapým ekleri eklenerek
türetilmiþ Türkçe sözcükler ve bunlara karþýlýk gelen Ýngilizce sözcükler gösterilmiþtir.
Çizelge-2: Türkçenin Sözcük Türetme Yeneði
Türkçe Ýngilizce
Göz Eye
Gözlük Eyeglasses
Gözlükçü Optician
Gözlükçülük Opticians
Gözcü Watchman
Gözcülük Optthamolgy
Gözlem Observation
Gözleme Observing
Gözlemci Observer
Gözlemcilik Observation
Gözde Favourite
Gözgü Mirror
Gözgülük Mirror stand
Gözgücü Mirror maker
Gözgücülük Mirror makers
Çizelge-2’de görülen ayna anlamýndaki “gözgü” sözcüðü eskiden kullanýlan bir sözcüktür.
Anlamýný öðrendikten sonra günümüzde kullanýlmayan bu sözcükten türetilen dört sözcüðü de
kolayca yorumlayabilmemiz Türkçenin sözcük türetme yeteneðinin bir kanýtýdýr. Tablo-2’nin
söylediði bir baþka sonuç; Türkçe sözcüklere karþýlýk Ýngilizcede bir sözcük bulunabildiðidir.
Ancak bunlarýn önemli bir kýsmý görme organý ile iliþkili deðildir. Bu durum sözcüklerin insan
tarafýndan algýlanmasý ve yorumlanmasýnda zorluða neden olabilir.
100 – Doðal Dil Ýþleme
Sami dillerinin kökten yeni sözcük türetme yetenekleri de üstündür. Örneðin “KTB” den oluþan
bir kökten, “kitap, kâtip, kâtibe, mekteb” gibi sözcükler türetilebilmektedir.
Türkçede sözcükler (pekiþtirme sýfatlarý ve yabancý sözcükler dýþýnda) sadece son ek almalarýna
karþýn Ýngilizcede ön ek de alabilmektedir. Ön ek kullanýlmamasý bir eksiklik olarak görülebilir.
Ancak bu eksiklik Çizelge-3’te gösterildiði gibi ön ekin kazandýrdýðý anlamý veren yeni
sözcüklerle veya ek sözcüklerle giderilmektedir.
Çizelge-3: Türkçede Ön Ek Kullanýlmaz
Türkçe Ýngilizce
Olanaksýz Impossible
Yeniden canlandýrmak Reactivate
Tepkin Reactive
Düzeltmek Reform
Mutsuz Unhapy
Önlem Precaution
Ön yagýlý Preconceived
Özürlü Disabled
Bir dilin söz varlýðýnýn zenginliði deðerlendirilirken sadece ad soylu sözcüklere bakmak yeterli
olamaz, eylem soylu sözcükleri de incelemek gerekir. Türkçede her eylemin etken, edilgen gibi
temel biçiminin dýþýnda dönüþlü, iþteþ ve ettirgen durumlarý diðer dillere göre önemli bir
üstünlük saðlamaktadýr. Çizelge-4’te Türkçenin eylem yapýlarý gösterilmiþtir.
Çizelge-4: Türkçenin Eylem Yapýlarý
Eylem türü Türkçe Ýngilizce
Etken Görmek To see
Edilgen Görünmek To be seem
Edilgen Görülmek To be seen
Dönüþlü Giyinmek To dress
Ýþteþ Görüþmek To see each other or to discuss
Ettirgen Görüþtürmek To bring someone to see or to dicuss each other
Ýkinci derece ettirgen Görüþtürtmek To have somebodies to see or to dicuss each other
Ettirgen edilgen Görüþtürülmek To be brought to see or to discuse somebody
Diller, o dili kullanan uluslarýn yaþam biçimi, alýþkanlýklarý ve ilgi alanlarýna göre geliþim
göstermektedir. Felsefi konulara ilgi duyan toplumlarda bu alanda sözcük sayýsý artarken aile
baðlarý kuvvetli olan toplumlarda akrabalýklarý tanýmlayan sözcüklerin sayýsý artmaktadýr. Bazý
6.3 Dillerin Karþýlaþtýrýlmasý – 101
diller olaylarý somut eylem sözcükleri ile anlatmaya çalýþýrken bazý diller deyimlerle anlatmayý
yeðlerler. Bir deyim ile anlatýlan bir eylem veya durumu, bir baþka dilde bir sayfalýk bir yazý ile
anlatmak gerekebilir.
Türkçede eksik olarak söz edilen konulardan biri sözcüklerin cinsiyete göre deðiþmemesidir.
Örneðin, melik-melike, rahip-rahibe, memur-memure gibi ayný meslek veya görevi üstlenmiþ
erkekler ve kadýnlara farklý adlarýn verilmesi özelliði Türkçede yoktur. Kiþinin cinsiyetini
belirtmek gerektiðinde sözcüðün öncesine veya arkasýna cinsiyeti belirleyen sözcük konarak bu
eksiklik giderilmektedir. Örneðin memur haným, haným memur gibi.
Ad soylu sözcüklere diþilik ve erkeklik özelliði kazandýrýlmýþ dillerde örneðin Fransýzca ve
Arapçada sözcüðün baþýnda bulunan ek, sözcüðün cinsiyetini belirtir. Fransýzcadan örnek
verirsek “la mur” (duvar), “le port” (kapý), duvar sözcüðü diþi ve kapý sözcüðü erkektir. Böyle
bir ayýrýmýn neden gerektiðini anlamak gerçekten güçtür, belki de anlamsýzdýr, denebilir.
6.3.4 Ýþleklik
Eklemeli dillerde sözcüklere yapýlan eklemeler sözcüklere yeni anlamlar kazandýrmaktadýr. Bu
özellikler dilin söz varlýðýný zenginleþtirmekle kalmayýp dile iþlerlik te kazandýrmaktadýr.
Ad soylu sözcüklere yapýlan eklemelerin kazandýrdýðý yeni sözcüklere örnekler Çizelge-3’te
verilmiþtir.
Eylem soylu sözcüklerin iþlekliði Çizelge-4’te gösterilmiþtir. Eylemlerin etken ve edilgen
hâlleri tüm dillerde görülmektedir. Ancak eylemlerin dönüþlü, iþteþ, ettirgen, ikinci derece
ettirgen, ettirgen edilgen hâllerini oluþturmak Türkçedeki kadar kolay ve düzenli deðildir. Hatta
bazý dillerde olanaklý deðildir.
Bir dilin geliþmiþliðinin bir göstergesi de sözcüklere yüklenen anlamlardýr. Örneðin “kýrmak”
eyleminin en temel kullanýmý, “sert þeyleri vurarak veya ezerek parçalamak” anlamýndadýr.
Türkçe gibi geliþmiþ dillerde kýrmak sözcüðünün çok fazla anlamýna rastlamak olasýdýr.
Örneðin;
• Soðuk hayvanlarý kýrdý (öldürmek)
• Fiyatlarý kýrmak (indirim yapmak)
• Kalbimi kýrdý (gücendirmek)
• Pulunu kýrmak (tavla oyununda)
• Buðdayý kýrdýrmak (kaba öðütmek)
• Direksiyonu kýrmak (Çevirmek, yönünü deðiþtirmek)
• Soðuðun belini kýrmak (Soðuðun etkisini ciddi olarak azaltmak)
• Senet kýrmak (senedi paraya çevirmek)
• Dersi kýrmak (dersten kaçmak)
102 – Doðal Dil Ýþleme
6.3.5 Belirginlik
Tümce içindeki sözcüklerin diziliþinde belli bir sýranýn olmasý beklenir. Her dilde, tümce
içindeki sözcüklerin sýralanýþýnda belirli kurallara uyulur. Bazý dillerde bu sýralamada deðiþiklik
yapýlýrsa, anlam bozulur ya da kaybolur. Türkçe tümcelerde de sözcükler belli bir düzende
sýralanýr. Ancak sýra deðiþtirildiðinde anlam kaybý olmaz. Ancak vurgu farký ortaya
çýkar.Örneðin þu üç cümlenin anlamý ayný, vurgu yapýlan sözcük farklýdýr.
Elini sabunla yýka (vurgu el)
Sabunla elini yýka (vurgu sabun)
Yýka elini sabunla (vurgu yýkamak)
Hint-Avrupa dillerinde tümce yapýsý katýdýr. Bu nedenle tümce içindeki sözcüklerin yerleri
deðiþtirilince tümcenin anlamý deðiþir veya bozulur. Tümce yapýsýnýn esnek olmasý, Türkçenin
anlam gücünü artýrmakta ve konuþanlara yetenek ve kolaylýk saðlamaktadýr. Bu özellik doðal
dil iþleme çalýþmalarýnda ek zorluklara neden olmaktadýr.
Kurallý olmak
Dillerin, insanlýðýn geliþimine koþut olarak geliþtikleri, bu nedenle katý kurallarýnýn olmasý
beklenmemeli, diye düþünülmektedir. Ancak bu düþünce Türkçe için geçerli deðildir. Sanki
5000 yýl önce bir dil kurultayý yapýlmýþ ve Türkçenin kurallarý belirlenmiþtir. Bu kurallar
günümüze kadar deðiþmemiþtir. Türkçenin bu özelliði, dil bilimcileri hayrete
düþürmektedir.Türkçenin deðiþmeyen kurallarý ses biliminde ve biçim biliminde hiç
bozulmamýþtýr. Biçim bilimini kurallarýnda bir kural dýþý örnek verilebilmektedir. Bilindiði gibi
ünlü ile biten bir sözcüðe iyelik ekleri ulanýrken araya “n” harfi eklenir. Bu kurala göre “sunun”
dememiz gerekirken “suyun” demekteyiz. Kural bozulmasý olarak deðerlendirebileceðimiz bu
durum aslýnda “su” sözcüðünün geçmiþ zamanda “suy” biçiminde söylenmesinden
kaynaklanmaktadýr.
Dilleri adlara eklenen durum ekleri açýsýndan da inceleyebiliriz. Türkçede ad durum eklerinin
kazandýrdýðý anlam çok kesindir. Bu kesinlik Hint-Avrupa dillerinde ayný düzeyde deðildir.
Örneðin;
Müziði dinliyorum. ( I am listining to music)
Partililere konuþuyorum.( I am speeking to members of parties)
Seni düþünüyordum. ( I think of you)
Türkçede sýk kullanýlan eylem köklerinin tek hece olduðu bir gerçektir. Ayrýca Türkçe
eylemlerin kökleri hiçbir zaman deðiþmez. Örneðin “gitmek” eylemini tüm zamanlar için
yazarsak (gittim, gitmiþim, gidiyorum, gideceðim, giderim) bu özelliði açýkça görürüz.
Hint-Avrupa dil ailesinde bulunan, Farsça, Fransýzca ve Ýngilizce dillerinde gitmek eyleminin
þimdiki zamaný ile geçmiþ zamaný arasýnda harf benzerliði bile yoktur. Örneðin, I go – I went
6.3 Dillerin Karþýlaþtýrýlmasý – 103
(Ýng), Je vais – Je suis allé (Fr). hahem reft – reftem (Farsça), (ilk örnekler geniþ zaman, ikincisi
geçmiþ zamana iliþkin örneklerdir). Türkçe eylemlerin çekiminde bu tür kuralsýzlýklara
rastlanmaz.
104 – Doðal Dil Ýþleme
7
Metin Seslendirme
Daha önce açýklandýðý gibi, bir metni seslendirebilmek için ilk
öðrenilmesi gereken sesbilimidir. 2. Bölümde, Türkçenin sesbilim
özellikleri ayrýntýlý biçimde anlatýlmýþtýr. Bu bölümde bilgisayar
yardýmýyla insan seslerinin nasýl yanlýþlanabileceði anlatýlacaktýr.
Yapay ses üretmeden önce bazý tanýmlarý hatýrlamamýz uygun olacaktýr:
Ünlü Sesler
Ciðerden gelen hava akýmýnýn, ses yolunda ve aðýzda bir engel ile
karþýlaþmadan çýkardýðý seslerdir.
Ünsüz Sesler
Ciðerden gelen hava akýmýnýn, ses telleri süzgeçinden geçerek
oluþturduðu seslerdir.
Fonem (Ses Birimi)
Dilin en küçük birimidir. Bir baþka tanýmlamayla, bir dilde anlam
ayýrma görevini yapan asýl seslere fonem (phonème) denilmektedir.
Sesçil abecedeki her simge bir foneme karþýlýk düþer. Bu açýdan
deðerlendirildiðinde Türkçe abecesindeki her harf bir fonemdir.
– 105
Türkçe abecesinin, Türkçedeki tüm seslere karþýlýk gelemediði bilinen bir gerçektir; bazý
seslerin kalýn ve ince, bazý seslerin kýsa ve uzun okunuþ biçimleri bulunmaktadýr. Bu bilgilerin
ýþýðýnda Türkçede 42 fonemin bulunduðu söylenebilir. Bu fonemlerin içinde 15 ünlü ve 27
ünsüz bulunmaktadýr
Hece
Bir solukta çýkan bir tek ya da bileþik sese hece denir.
7.1 Ýnsanda Konuþma Üretimi Sisteminin Anatomisi
Bilgisayarda insan sesi üretebilmek için, öncelikle insanda bulunan ses organýný tanýmakta yarar
vardýr. Ýnsanýn ses üretme yöntemi temel olarak þöyle açýklanabilir: Ciðerlerimiz bir körük gibi
hava üfler. Nefes borusu içinden gelen bu hava, gýrtlaktaki ses telleri, yutak, geniz ve aðýz
boþluðundan oluþan yapý içinde sese dönüþür. Ses üretiminde dil, dudak ve diþlerin etkisi de
unutulmamalýdýr. Ayrýca çene aðýz ve geniz boþluðunu deðiþtirdiði için ses üretim organý
sayýlýr.
Þekil-7.1’de insandaki ses organý gösterilmiþtir.
Seslerin üretim bölgeleri Þekil-7.1 üzerinde aþaðýda açýklandýðý gibi iþaretlenmiþtir:
1- Dudak sesleri (Bilabial): Dudaklar
arasý,
2- Dudak-diþ sesleri (Labiodental): Alt
dudak üst diþler arasý,
3- Diþ sesleri (Dental ve interdental):
Dil ucu ve diþ ucu,
4- Diþ yuvasý (Alveolar): Dil ucu ile diþ
eti arasý,
5- Art diþ yuvasý (Postalveolar): Dil
ucu ile diþ eti gerisindeki boþluk,
a- Geriye dönük (retroflex): Dil
geriye doðru bükülür ve damaða deðer.
b- Damak-boþluk (plato-alveoral):
Diþ yuvasý ile damak arasý,
6- Ön damak sesleri (Palatal) : Dil
ortasý ile sert damak arasý,
7- Damaksý sesler (Velar) : Dilin gerisi
ile damak arasý,
106 – Metin Seslendirme
Nefes
borusu
Dil
Diþ
Üst
dudak
Alt
dudak
Geniz
Aðýz boþluðu
Yumuþak
damak
Gýrtlak
3 2 1
4
5
7 6
8
9
Sert
damak
Ses
telleri
Yutak
Þekil-7.1: Ýnsanýn ses üretme organý
8- Küçük dil sesleri (Uvular): Dilin gerisi ile küçük dil
arasý
9- Östeki sesleri (Pharyngeal) : Dilin kökü ile soluk
borusu arasý.
Gýrtlak içinde bulunan ses telleri, tel biçiminde
olmayýp belirli miktar açýlýp kapanabilen
kapakcýklardýr. Þekil-7.2’de ses telleri gösterilmiþtir.
Ýnsandaki ses üretme organýnýn fiziksel modellenmesi,
yapay ses üretimi için baþlangýç noktasý oluþturur. Bu
modellemede gýrtlak ve akciðer süzgecin giriþini, ses
telleri ses süzgecini ve dudaklar yükü temsil ederler.
Ses yolu denilen kýsým, yetiþkin erkeklerde yaklaþýk
17 cm, yetiþkin kadýnlarda yaklaþýk 14 cm kadardýr.
Geniz sesin oluþmasýnda ikinci yolu oluþturur ve bu yolun duyulan sese katkýsý, damaðýn
açýklýðý ile orantýlýdýr. Geniz sesleri olarak anýlan seslerde damak alçalarak genizin ses
üretimine katýlmasýna neden olur. Damaðýn kapalý olduðu durumda, geniz sesleri üretilmez.
Ýnsan ses üretme organýnýn modeli Þekil-7.3’te verilmiþtir.
7.1 Ýnsanda Konuþma Üretimi Sisteminin Anatomisi – 107
Þekil-7.2: Ses teli
Akciðer
Ses
telleri Soluk
borusu
Damak
boþluðu
Geniz
boþluðu
Aðýz
boþluðu
Geniz
sesleri
Aðýz
sesleri
Dil
Damak
Þekil-7.3: Ýnsan ses üretme organýnýn modeli
Ýnsan ses üretme organýnýn Þekil-7.3’te verilen modelinde görüldüðü gibi, ciðerden gelen hava
önce ses tellerinin arasýndan geçmektedir. Ses tellerinin titremesi ile oluþan ses içinde, insan
tarafýndan çýkarýlabilen en kalýn seslerden en tiz seslere kadar tüm sesler bulunmaktadýr. Her
frekansta ses bileþeni içeren bu ses aslýnda bir hýrýltýya ya da diðer bir deyiþle gürültüye benzer.
Ses tellerinde üretilen hýrýltý biçimindeki sesin genliði kalýn seslerde yüksek, tiz seslerde
düþüktür. Aðýz ve geniz boþluðunun aldýðý biçim, hýrýltý biçiminde gelen sesi þekillendirerek
insan sesini oluþturmaktadýr. Þekil-7.4’te insanýn ses üretme yöntemi gösterilmiþtir. Bu þekilde
görüldüðü gibi, hýrýltý biçiminde üretilen sesin en düþük frekansý 200 Hz ve en yüksek frekansý
3000 Hz dolayýndadýr. Bu sýnýrlar bazý insanlarda daha geniþ olabilmektedir. Aðýz ve geniz
boþluklarýnýn aldýðý þekil, bir süzgeç olarak çalýþmaktadýr. Bu süzgeç bazý frekans bileþenlerini
geçirirken bazýlarýný engellemektedir. Bu iþlemlerin sonunda, duyduðumuz ses üretilmektedir.
108 – Metin Seslendirme
Þekil-7.4: Ýnsanda sesin oluþumu
Ýnsan tarafýndan üretilen seslerde, aðýz yapýsýndaki deðiþimin sonucu, ses üretim organýnýn
modelinde de deðiþiklik olmakta, bunun sonucu olarak da üretilen ses deðiþmektedir.
Þekil-7.5’de “A” sesini üretirken, insan aðýz yapýsýnýn aldýðý biçim; buna baðlý olarak, ses üretim
organýnýn modeli ve sonuçta üretilen sesin frekansa göre dðiþimi gösterilmiþtir. Þekil-7.6 ve
Þekil-7.7 de “Ý” ve “U” sesleri için aðýz yapýsý, ses üretim organýnýn modeli ve üretilen sesin
frekansa göre deðiþimi gösterilmiþtir.
7.1 Ýnsanda Konuþma Üretimi Sisteminin Anatomisi – 109
Þekil-7.5: “A” sesi
Þekil-7.6: “Ý” sesi
7.2 Konuþma Sinyalleri
Bir metni seslendirmek üzere gerçekleþtirilecek olan dizge temel olarak bilgisayara baðlý bir
elektronik devre olacaðýna göre, insan sesinin elektriksel karþýlýðýnýn incelenmesi gerekir. Bir
insan konuþmasý peþpeþe gelen sözcüklerden, bir baþka deyiþle sürekli çýkan seslerden oluþur.
Sözcüklerin hecelerden ve hecelerin de harflerden oluþtuðu düþünülürse, insan konuþmasýna
karþýlýk düþen elektriksel iþaretler içinde sözcüklerin, hecelerin ve harflerin nasýl göründüðünü
incelememiz gerekir. Þekil-7.8’de “Ne mutlu Türküm diyene” tümcesine karþýlýk düþen
elektriksel iþareti görmekteyiz.
Þekil-7.8’e baktýðýmýzda, üç sözcükten oluþan tümcenin her bir sözcüðünün birer öbek
oluþturduðunu görebilmekteyiz. Ancak harflari bu kadar kolay seçememekteyiz. Bunun nedeni,
hece içindeki harflerin birlikte biçimlenmeleri gösterilebilir. Basit bir anlatýmla, “B”
ünsüzünden sonra gelen ünlü sese (a, e, ý, i, o, ö, u, ü) baðlý olarak bu hecenin þekillenmesidir.
110 – Metin Seslendirme
Þekil-7.7: “U” sesi
Þekil-7.8: “Ne mutlu Türküm diyene” tümcesinin elektriksel sinyale dönüþmüþ hali
Bir hecenin þekillenmesinde, vurgunun da önamli bir etkinliði bulunmaktadýr. Türkçede bir
sözcük içindeki vurgunun nasýl olacaðý Bölüm-2.5.1’de anlatýlmýþtý. Konuþmayý belirleyen
özelliklerden biri de bazý seslerin uzatýlmasýdýr.
Önceki kýsýmlarda, insan tarafýndan çýkarýlan sesleri incelemiþ ve onlarý ünü ve ünsüz kümesine
ayýrmýþtýk. Ayrýca bu sesleri, üretim yerlerine göre sýnýflandýrmýþtýk. Konuþulan dillerde, bazý
sesler birbirine çok benzemesine karþýn, bazý dillerde özel sesler bulunabilir. Örneðin ünlüler
açýsýndan zengin olan Türkçede bulunan “ý” sesinin Ýngilizcede karþýlýðý yoktur. Gýrtlak sesleri
Arapçada çok olmasýna karþýn ölçünlü Türkçede yok denecek kadar azdýr.
Tüm dillerde bulunan sesleri tanýmlayabilmek üzere, uluslararasý bir abecenin (IPA)
geliþtirildiði bilinmektedir. IPA ve SAMPA’da Türkçe harlerin karþýlýklarý Tablo-2.8 ve
Tablo-2.9’da gösterilmiþti. Þekil-7.9’da bu abece, yayýncýsýnýn verdiði þekilde gösterilmiþtir.
7.3 Ses Üretme Yöntemleri
Önceki kýsýmlarda, insanýn konuþurken çýkardýðý seslere iliþkin teknik bilgiler sunulmuþtur. Bu
bilgilerin ýþýðýnda gerçekleþtirilen araþtýrma çalýþmalarýnýn sonunda, bir metni seslendirmek
üzere iki temel yöntem geliþtirimiþtir:
• Doðal sesleri ekleme yöntemi
• Yapay ses üretme yöntemi
7.3.1 Sesleri Ekleme Yöntemi
Sesleri ekleme yöntemi, insan tarafýndan üretilmiþ ses kayýtlarýnýn kullanýlmasý ilkesine
dayanýr. Bu yönteme uygun olarak gerçekleþtirilmiþ çalýþmalarda, en büyük parçadan en küçük
parçaya kadar ekleme yöntemi denenmektedir: Doðal insan sesi kullanýlan, sesleri ekleme
yöntemine dayalý seslendirme dizgeleri ses açýsýndan kaliteli sayýlýrlar.
Tümce, Tümcecik ve Sözcük Temelli Seslendirme
Tümce, tümcecik ve sözcük seslendirme yöntemi, özellikle bilgisayarlý yanýtlama
dizgelerinde kullanýlmaktadýr. Bu tür dizgelerde, seslendirilecek metinler belli
olduðundan, veri tabanýnda bulunan yanýt tümcesinin seslendirilmiþ biçimi
kullanýlmaktadýr. Örneðin; “Kuruluþumuzu aramýþ olmanýzdan dolayý teþekkür
ederiz”
Bazý uygulamalarda, tümcenin tamamý yerine tümce içinde yer almasý olasý sözcük
kalýplarý seslendirilerek veri tabanýnda saklanmaktadýr. Böylece veri tabanýndaki
seslendirilmiþ kayýt sayýsý azaltýlmaya çalýþýlýr. Örneðin; “Ankara’ya gidecek
yolcularýn 212 numaralý bekleme salonuna gelmeleri beklenmektedir.” tümcesinde
koyu olarak görülen kent adý ve salon numaralarý bir yerde diðer sözcükler bir baþka
yerde saklanýr. Koyu yazýlý sözcükler deðiþkendir; diðerleri sabit kabul edilebilir.
7.3 Ses Üretme Yöntemleri – 111
112 – Metin Seslendirme
Þekil-7.9: IPA Uluslararasý Sesçil Abece
Deðiþken sözcükler deðiþtirilerek ayný bilgi þöyle de okunabilir: Konya’ya gidecek
yolcularýn 344 numaralý bekleme salonuna gelmeleri beklenmektedir.
Sedece sözcüklerin seslendirilmiþ hallerinin veri tabanýnda tutulduðu, seslendirme
yöntemleri de bulunmaktadýr. Örneðin “Ankara”, “gitmek”, “yolcu”, “212”, ” numara”,
“bekleme”, “salonu”, “gelmek”, “beklenmek” sözcüklerinin seslendirilmiþ yalýn halleri
ve dilin biçimbilimsel özelliklerine baðlý olarak alabileceði ekler ile seslendirilmiþ
halleri de veri tabanýnda tutulur. Ek açýsýndan kýsýtlý olan Hint Avrupa dilleri için
uygulanabilir bir çözüm olarak görülen bu yöntem, Tükçe gibi ekler açýsýndan zengin
olan Türkçe için pek uygun sayýlmaz.
Tümce seslendirme yönteminde, sadece bir veya birkaç sözcüðün deðiþtirilerek
kullanýldýðý örnekler de bulunmaktadýr. Örneðin; “xxxxxx’ya gidecek yolcularýn
“yyyyy” numaralý bekleme salonuna gelmeleri beklenmektedir. Bu tümcede uçaðýn
gideceði kent adý ve kapý numarasý dýþýndaki kalýp tümce bir kayýt, kent adý ve kapý
numarasý ayrý iki kayýt halinda saklanýr. Tümce seslendirilirken, gerekli noktalarda
kent adý ve kapý numarasý eklenir. Bu uygulamada da Türkçe gibi eklmeli diller için
ayarlamalar yapýlmasý gerekir.
Biçim birimi, Hece, Ses çifti ve Ses Temelli Seslendirme
Genel anlamda bir metni seslendirme iþlemini, insan tarafýndan seslendirilmiþ tümce,
tümcecik veya sözcükleri peþpeþe ekleyerek seslendirmek, çok geniþ bir veri tabaný
gerektireceðinden, uygulanabilir deðildir. Bu nedenle, farklý yöntemler denenmiþtir.
Bu yöntemlerden ilkinde, sözcük biçimbilim parçalara ayrýlmaktadýr: Örneðin,
gözlükcü sözcüðü göz + lük + cü biçiminde, kök ve eklerine ayrýlmaktadýr. Veri
tabanýnda seslendirilmiþ kök sözcükler ve ekler bulunmaktadýr. Gözlükçü sözcüðü
selendirileceði zaman, kök sözcük, ekler ile birlikte seslendirilmektedir.
Ýngilizce gibi ek açýsýndan sýnýrlý olan dillerde, biçim birimleri ekleyerek seslendirme
iþlemi, Türkçe gibi eklemeli dillere oranla daha kolaydýr. Bu arada, Türkçedeki ses
uyum kurallarýna göre eklerin deðiþeceði gerçeði de unutulmamalýdýr.
Dildeki olasý hecelerin seslendirilmesi ve bir sözcük seslendirilirken bunlardan
yararlanýlmasý, metin seslendirme sürecinde kullanýlabilen bir baþka yöntemdir.
Bölüm-2.5.1’de anlatýldýðý gibi Türkçe hece yapýsý bakýmýndan kurallý bir dildir. Bir
sözcük, kural tabanlý olarak hecelerine kolayca ayrýlabilir. Tablo-7.2’de Türkçe hece
biçimleri ve olasý sayýlarý verilmiþtir:
Tablo-7.1: Türkçedeki hece kalýplarý ve olasý sayýlarý
Hece yapýsý S SZ SZZ ZS ZSZ ZSZZ
Olasý sayýsý 8 128 112 152 2312 2128
7.3 Ses Üretme Yöntemleri – 113
Tablo-7.1’de hece kalýplarýnýn olasý sayýlarý verilmiþtir. Bu sayýlara bakýldýðýnda Türçede 4840
tane hece yapýsý olduðu söylenebilir. Buna göre 4840 hece seslendirildiðinde, Türkçe metin
seslendirme dizgesinin gerçeklenebileceði söylebilir. Türkçede sözcük içinde bulunan
hecelerde vurgulamanýn nasýl yapýldýðý Þekil-2.4’te gösterilmiþtir.
Bir Türkçe sözcüðü hecelerine ayýrmak için kullanýlabilecek algoritmanýn ana hatlarý þöyledir:
• Sözcük sonundan baþlayýp baþýna doðru taranýr.
• Ýlk ünlü harfe rastlandýðýnda, bir adým daha sola gidilerek ünsüz harfin solunda kesilir.
Ana hatlarý ile tanýtýlan bu algoritma üzerinde, yabancý dillerden dilimize geçmiþ sözcükler için
düzenleme yapýldýðýnda hatasýz çalýþan bir algoritma olabilir.
Hece yapýsýndan bir alt düzeye indiðimizde, tek tek veya ikili harflerin eklelendiði örnekler
görülmektedir. Bu örneklerde, ilk aþama insanlar tarafýndan seslendirilmiþ sözcükleri, ses
çiftlerine ve seslere ayýrmaktýr. Yoðun bir emek gerektiren bu çalýþma sonunda metinlerin
seslendirilebildiði görülmektedir.
Ýnsan tarafýndan seslendirilmiþ hece ve ikili harflere iliþkin sinyalleri birleþtirirken, dildeki ses
özelliklerini kullanmak gerekmektedir. Dilin ses özellikleri, seslendirme sürecinde iþin içine
katýlmadýðý durumlarda, üretilen seste patlamalar duyulmaktadýr.
7.3.2 Yapay Ses Üretme Yöntemi
Bir metni seslendirmek için izlenen bir baþka yöntem, yapay ses üretme yöntemidir. Yapay ses
üretme yönteminin temeli insan ses üretme organanýn modellenmesine dayanmaktadýr. Bu
yöntemde, önce üzerinde çalýþýlan dilin ünlü ve ünsüz seslerinin frekans özellikleri
çýkarýlmakta; ardýndan üretilen bu sesler kullanýlarak hece ve sözcükler seslendirilmeye
çalýþýlmaktadýr.
Yapay ses üretme süreci aþaðýdaki adýmlardan oluþur:
• Ýlk aþamada metin sesçil bir abece ile yazýlmýþ hale dönüþtürülür. Türkçe sesçil bir dil
olarak kabul edilmesine karþýn, “a, e” gibi ünlülerimizin ince, kalýn ve uzun hallerinin
olmasý Türkçe bir metnin bile sesçil abeceye dönüþtürülmesini gerekli kýlmaktadýr.
Yazma kuralý düzensiz olan Ýngilizce gibi dillerde, metnin sesçil abece ile yazýlmýþ
hale dönüþtürmek oldukça zor bir iþlemdir.
• Ýkinci aþamada, sesçil abece ile yazýlmýþ bir sözcük içindeki harflerin birlikte
seslendirilmesine çalýþýlýr. Bu aþamada, harf çiftleri seslendirilebileceði gibi, hece
seslendirmesine de gidilebilir.
• Bir sözcüðün seslendirilmesi sýrasýnda, üzerinde durulmasý gereken önemli iki nokta,
vurgu ve uzatmalardýr. Türkçe sözcüklerde, genellikle harflerin okunuþ süreleri eþittir.
Ancak yabancý dillerden alýnan sözcükler bu kuralý bozmaktadýr. Türkçe sözcüklerde
sözcük içinde ve tümce içinde vurgunun nerede yapýlacaðý yaklaþýk olarak bellidir;
ancak konuþma dilinde vurgunun yeri deðiþebilmektedir.
114 – Metin Seslendirme
Bölüm-7.1’de verilen açýklamalar tekrar incelendiðinde, ünlü seslerin tek bir ses frekansý
olmadýklarý; birleþik ses sinyallerinden oluþtuðu görülür. Bir baþka deyiþle, bir ünlü ses bir
temel frekans bileþeni ve buna ek olarak daha düþük genlikli frekans bileþenlerinden
oluþmaktadýr. Bir sesi oluþturan bu frekans bileþenlerin “formant” adý verilmektedir. Her dil için
ses formantlarýnýn deðerleri deðiþmekle beraber IPA tarafýndan verilen ünlü formant deðerleri
Þekil-7.10’da verilmiþtir.
Ünlü Seslerin Formant Frekanslarý
IPA Latin F1 F2 F3
i IY 270 2290 3010
ý IH 390 1990 2550
e EH 530 1840 2480
ae AE 660 1720 2410
A AH 520 1190 2390
a AA 730 1090 2440
] AO 570 840 2410
U UH 440 1020 2240
u UW 300 870 2240
g ER 490 1350 1690
Örnek olarak “i” sesinin frekans
bileþenleri Þekil-7.11’de ve “s” sesinki
Þekil-7.12’de gösterilmiþtir.
Þekil-7.12’ye dikkat edilirse, ünlü
seslerden farklý olarak, ünsüzlerde tek bir frekansta genlik büyümesi görülmektedir.
7.3.3 Türkçenin Ünlü ve Ünsüz Sesleri
Ünlüler, ses yolunda hiçbir engele uðramadan ses organlarýnýn ortaklaþa iþlemesiyle oluþurlar.
Türkçede ünlüler dilin, alt çenenin ve dudaklarýn aldýklarý durumlara göre üçe ayrýlýrlar.
• Dilin aldýðý duruma göre ya kalýn ya da ince
• Alt çenenin aldýðý duruma göre ya dar ya da geniþ
• Dudaklarýn aldýðý duruma göre ya yuvarlak ya da düz
Dilimizdeki sekiz ünlünün dördü kalýn, dördü ince ünlü olarak kümelenir. Kalýn ünlüler a, ý, o, u
ve ince ünlüler e, i, ö, ü sesleridir. Kalýn ünlüler, aðýzýn geri kýsmýnda üretilirler. Ýnce ünlüler
aðýzýn ön kýsmýnda üretilir.
7.3 Ses Üretme Yöntemleri – 115
200 300 400 500 600 700 800
800
1000
1200
1400
1600
1800
2000
2200
2400 IY
IH
EH
AE
ER
AH
UH
AA
UW AO F1 (Hz)
F2(Hz)
Þekil-7.10: Ünlülerin Formant frekanslarý
Ünlülerin ikinci kümeleniþi, bu sesleri çýkarýrken dudaklarýn aldýðý biçime göre yapýlýr. Bu
kümeleme biçiminde a, e, ý, i ünlüleri düz ve o, ö, u, u ünlüleri yuvarlak ünlü olarak
adlandýrýlýr.
Üçüncü küme, çenenin açýklýðýna göre yapýlýr: Geniþ ve dar ünlüler. Çenemizin açýlmasý,
dolayýsýyla aðýz boþluðunun geniþlemesi ile üretilen ünlüler, a, e, o, ö geniþ ünlüler olarak
adlandýrýlýr. ý, i, u, ü ünlülerinin çýkýþý sýrasýnda çene biraz kapalý, dolayýsýyla aðýz boþluðu
dardýr. Bu nedenle bu seslere dar ünlüler denir.
Türkçedeki ünlülerin durumu Tablo-7.2’de topluca gösterilmiþtir.
Tablo-7.2:Türkçede Ünlülerin Kümelenmesi
Düz Yuvarlak
Geniþ Dar Geniþ Dar
Kalýn a ý o u
Ýnce e i ö ü
116 – Metin Seslendirme
Þekil-7.12: ” s ” sesinin frekansa göre deðiþimi
Þekil-7.11: ” i ” sesinin formant frekanslarý
Oluþumlarý sýrasýnda ses yolunda belirli bir temas, bir engel, bir takýntý ile oluþan seslere
ünsüzler denir. Ünlü seslerde olduðu gibi ünsüzler de aþaðýda gösterildiði gibi bazý kümelere
ayrýlýrlar.
• Ses kiriþlerinin titreþmesine göre sert ve yumuþak ünsüzler
• Ses kiriþlerinden sonra ses yolunun týkalý ya da açýk oluþuna göre sürekli ve süreksiz
ünsüzler
• Sesin çýktýðý yere göre dudak, damak, diþ ve gýrtlak ünsüzleri.
Ünsüzlerin genel durumu Tablo-7.3’te gösterilmiþtir.
Tablo-7.3 Türkçenin Ünsüzlerinin Kümelenmesi
Sert Yumuþak
Sürekli Süreksiz Sürekli Süreksiz
Dudak f p m, v b
Diþ s, þ ç, t j, l, n, r, z c, d
Damak k ð, y g
Gýrlak h
7.3 Ses Üretme Yöntemleri – 117
8
Konuþmayý Yazýya
Dökme
El yazýnýn yerini alacak bir aygýt düþü XIX. yüzyýlý boyunca çok kiþiyi
meþgul etmiþtir. Deðiþik tasarým örnekleri görülmekle beraber, daktilo
dediðimiz aygýtýn satýlabilir biçimi 1870’lerde gerçekleþtirilebilmiþtir.
Daktilo yaklaþýk bir yüzyýl boyunca, bireysel bilgisayarlarýn
yaygýnlaþmaýna deðin, önemli katkýlarda bulunmuþtur. Birevsel
bilgisayarlarýn 1985 yýlýndan sonraki hýzlý geliþimi, özellikle dizüstü
bilgisayarlarýn yaygýnlaþmasý ve buna koþut olarak yazýcý
tekniklerindeki geliþmeler, daktilonun saltanatýna son vermiþtir.
Günümüzde, yazarlar, haberciler, bilim adamlarý yazýlarýný artýk
bilgisayarda yazmaktadýr.
– 119
Bilgisayarýn tuþ takýmý, doðal olarak daktilodan esinlenmiþtir. Tuþ takýmýndaki harflerin diziliþi
de daktilonun ilk gerçekleþtirildiði dönemlerden kalmadýr. Ticari olarak üretilen ilk dönem
daktilolarda, parmak vuruþu ile hareket eden ve ucunda harf kabartmasý olan kollar yazý kaðýdý
önündeki karbon þerit üzerinden kaðýda vurmakta; böylece kaðýt üzerinde görünen harfi
oluþturmaktaydý. Hýzlý yazmaya kalkýþýldýðýnda, bir öceki kol geri gelemeden, bir sonraki kol
hareket etmekte, dolayýsýyla önceki kola arkadan vurmaktaydý. Bu teknik sorunu çözebilmek
için, daktilo üreticilerinin bulduðu çözüm, insanlarý yavaþ yazmaya zorlayacak bir tuþ takýmý
tasarýmý yapmaktýr. Bugün kullanýlan “QWERTY” düzenindeki tuþ takýmýndaki harflerin
diziliþi, insanlarý yavaþ yazmaya zorlayan bir diziliþtir.
Günümüde, yazý yazmayý yavaþlatmaya gerek olmamasýna karþýn eski alýþkanlýklar
deðiþtirilemediðinden bazý ülkelerde hâlâ ayný tuþ takýmý diziliþi kullanýlmaktadýr.
Ýnsanlarýn yazýlarýný hýzlý biçimde yazabilmeleri için bir çalýþma baþlatýldýðýnda, öncelikle dilin
özelliðinin ortaya konmasý gerekir. Böyle bir araþtýrma Türkçe için yapýldýðýnda ortaya çýkan
sonuçlar þöyledir: Türkçe metinlerde sýk kullanýlan harfler a, e, k, i, m, l, t ve r dir. Bu harflerin
kullaným sýklýðý yaklaþýk deðer olarak Tablo-8.1’de verilmiþtir. Diðer harflerin kullaným sýklýðý
birbirine yakýn olarak ölçülmüþtür.
Tablo-8.1: Tükçede sýk kullanýlan harfler
Harf Kullaným
sýklýðý (%)
a 17
e 10
k 9
i 9
m 7,3
l 6,6
t 6
r 6
Türkçede hece yapýlarý da belli olduðu düþünülürse, ünlü ve ünsüzlerin sýralanýþlarýnýn da
kurallý olduðu söylenebilir. Bu deðerlendirmelerin sonucu olarak insan parmaklarýnýn kuvvetli
olanlarýný, sýk kullanýlan harfler için ayýrmak ve bu harfleri tuþ takýmýnýn orta bölgesinde
toplamak doðru bir yaklaþýmdýr. Ýþte bu bu bilimsel düþüncelerle 1943 yýlýnda baþlatýlan Türkçe
F tuþ takýmý çalýmalarý 20 Ekim 1955 yýlýnda sonuçlanmýþtýr. Türkçe F tuþ takýmýnda, ünlüler
solda ünsüzler sað tarafta kümelenmiþtir. Türkçe F tuþ takýmýnýn hýzlý yazmayý saðladýðý,
daktilo hýz yarýþmalarýnda alýnan birinciliklerle kanýtlanmýþtýr.
120 – Konuþmayý Yazýya Dökme
Ýnsanlarýn, günümüzdeki düþü, konuþtuðunu yazan aygýtý yapmaktýr. Bu düþü gerçekleme
konusunda önemli çalýþmalarýn yapýldýðýna tanýk olunmaktadýr.
Konuþmayý daðýda dökecek aygýt yazýcý olmakla beraber, metne dönüþtürücek aygýtýn
bilgisayar olacaðý açýktýr. Þekil-8.1’den görüldüðü gibi, insan konuþmasý, mikrofon tarafýndan
elektrik sinyallerine dönüþtürülmekte; ardýndan bu sinyaller bilgisayar tarafýndan yazýya
dökülmektedir. Yazýyý kaðýt üzerinde görmek istediðimizde yazýcý kullanmaktayýz.
8.1 Konuþmayý Anlama
Ýnsan konuþmasýný anlamak üzere gerçekleþtirilen dizgeye, “Konuþma Tanýma Dizgesi (KTD)
adýný vermekteyiz. Bu dizge, bilgisayar dýþýnda bir donanýmla gerçekleþtirilebileceði gibi,
bilgisayarýn içinde de gerçekleþtirilebilir. Þekil-8.2’de KTD’si ana hatlarý ile gösterilmþtir.
gösterilmiþtir.
Mikrofon aracýlýðý ile elektrik sinyaline dönüþtürülmiþ olan insan sesindeki bir sözcüðü, ilk
olarak Konuþma Tanýma Dizgesine tanýtýlmalýdýr.
Tanýtým aþamasýnda, mikrofondan gelen elektrik sinyali gürültüden ayýklanýr, genlik ayarlamasý
yapýlýr ve sözcüklere ayrýlýr. Sözcüklere ayýrma iþleminde, veri tabanýnda bulunan eðitim
verilerinden yararlanýlýr. Bu aþamada, ses sinyaline özgü temel bileþenler, örneðin sinyalin
örüntüsü, enerjisi gibi özellikleri tanýnmaya çalýþýlýr.
Tanýnma aþamasýný geçen ses sinyali, ardýndan modellenir ve sýnýflandýrýlýr. Sýnýflandýrmanýn
ardýndan, ses sinyaline karþý düþen sözcüðün taranmasýna geçilir. Tarama aþamasýnda, dilin
aküstik, sözcük ve dil modelleri göz önünde bulundurulur. Bu çalýþmalarýn sonuda, sözcüðün
tam karþýlýðý bulunmaya çalýþýlýr. Konuþma tanýma dizgesinin iç yapýsý Þekil-8.1’de verilmiþtir.
Konuþmayý tanýyýp yazýya aktaran dizgenin, hiç yanlýþsýz çalýþacaðý söylenemez. Bu tür
dizgeler, bazý sözcükleri yanlýþ tanýmakta, dolayýsýyla yanlýþ karþýlýk sözcük üretmektedir. Bazý
8.1 Konuþmayý Anlama – 121
Þekil-8.1: Konuþma Tanýma Dizgesinin (KTD) ana yapýsý
durumlarda, duyduklarý sözcükle hiç ilgisi olmayan sözcük türetmektedir. Ayný dizgeler
çözümleyemedikleri sözcüklere karþýlýk bulmadan bu sözcüðü silmektedirler. (8-1)
baðýntýsýnda bir konuþmayý tanýma dizgesinin baþarýmýnýn nasýl hesaplanacaðý gösterilmiþtir.
H Y E S
N
= + + (8-1)
Bu baðýntýda H, dizgenin hata oranýný, Y, yanlýþ karþýlýk, E, yanlýþ ekleme, S, silinen ve N
toplam sözcük sayýsýný göstermektedir. (8-1) baðýntýsý, aslýnda, dizgenin baþarýzýlýk deðerini
vermektedir. Baþarýyý B ile gösterirsek;
B= 1- H (8-2)
olacaðý açýktýr.
Konuþmayý yazýya dönüþtüren bir dizgenin baþarýmýndan söz edildiðinde, dizgenin
yeteneklerini de tanýmlamak gerekir. Bazý KTD’ler belli konulardaki konuþmalar için
tasarlanmýþ iken bazýlarý genel amaçlýdýrlar. Tablo-8.2’de bu tür dizgelerin özellikleri
sýnýflandýrýlmýþ biçimde gösterilmiþtir.
122 – Konuþmayý Yazýya Dökme
Þekil-8.2: Konuþma Tanýma Dizgesinin iç yapýsý
Tablo-8.2:Konuþmayý Tanýma Dizgelerinin Sýnýflandýrýlmasý
Yetenek Çalýþma koþullarý
Konuþma biçimi Tek tek sözcük söyleme
Konuþma türü Sürekli konuþma
Katýlým Konuþana baðýmlý ya da baðýmsýz
Sözlük 20 Sözcükten az ya da 50.000 sözcükten fazla
Dil modeli Sonlu durum yaklaþýmý ya da içeriðe duyar yaklaþým
Þaþýrtma 10 dan az ya da 200 den çok
Sinyal/gürültü oraný 10 dB den küçük ya da 30 dB den büyük
Dönüþtürücü Gürültüden arýndýrýlmýþ mikrofon ya da cep telefonu
8.1 Konuþmayý Anlama – 123
Þekil-8.3:
9
Yazým Hatalarýný
Düzeltme
Günümüzde, kitaplar, dergiler ve raporlar bilgisayar ortamýnda
hazýrlanmaktadýr. 19. yüzyýlýn sonunda önemli bir buluþ olarak kabul
gören daktilolar artýk kullaným dýþýdýr. Yazýlan her yazýda yazým hatasý
olabileceði bir gerçektir. Ýnsanlar yazmýþ olduklarý yazýnýn yazým
kurallarýna uygun olmasýný isterler. Geçmiþ dönemlerde yanlýþlarý bulan
ve düzelten insanlarýn olduðu ve bunlarýn basýn kuruluþlarýnda
musahhih unvanýyla çalýþtýklarý bilinmektedir. Geçmiþte musahhihler
tarafýndan yapýlan iþi bugün bilgisayarlara yaptýrmak için çalýþmalar
oldukça ileri düzeydedir.
Yazma iþleminin bilgisayar ortamýna geçmesiyle birlikte bilgisayar
ortamýnda bulunan bir metnin yazým hatalarýný bulmak ve düzeltmek
biliþimciler için ilginç bir araþtýrma alaný olmuþtur. Bir metindeki yazým
hatalarýný bulmak için deðiþik yöntemler kullanýlabilir. Yöntemlerden
biri, metnin yazýldýðý dilin sözlüðünü bilgisayarda bir veri tabanýna
yerleþtirmek olabilir. Bu yöntem bitiþken olmayan diller için
uygulanabilir bir yöntemdir. Türkçe gibi bitiþken diller için bu yöntem
ilk seçenek olmamalýdýr. Türkçe gibi kurallý bir dilde yazýlmýþ bir metin
içindeki yazým hatalarýný bulmak ve düzeltmek için;
– 125
• Ses uyum kurallarý
• Hece yapýsý
• Eklerin uyumu
özellikleri kullanýlabilir.
• Bir sözcüðü hecelere ayýrma ve satýr sonunda hece bölmesi iþlemi için Ýngilizcede
sözlüðe bakma zorunluluðu vardýr. Buna karþýn Türkçede bir sözcüðün hecelere
ayrýlmasý kurallýdýr ve sözlüðe bakýlmadan yapýlabilir.
9.1 Yazým Hatalarýný Giderme Üzerine Çalýþmalar
Türkçe metinlerde yazým hatalarýný bulmak için deðiþik yöntemler kullanýlabilir. Bu yöntemler
sözcük temelli olabileceði gibi kural tabanlý da olabilir. Türkçe metinlerde yazým hatalarýný
bulmak için gerçekleþtirilmiþ çalýþmalardan bazýlarý bu kýsýmda tanýtýlmýþtýr.
A. Solak ve K. Oflazer tarafýndan hazýrlanmýþ olan [7,9] çalýþma sözcük temelli bir çalýþmadýr
ve 23.000 sözcüðü olan bir sözlüðe sahiptir. Sözlükteki her bir kök sözcük sözcüðü tanýmlayan
bayraklarla iþaretlenmiþtir. Sözlükteki herhangi bir sözcük 64 farklý bayrak ile
iþaretlenebilmesine karþýn geliþtirilen yazýlýmda bu bayraklarýn 41 tanesi kullanýlmýþtýr. Kök
sözcük bulma algoritmasýnýn temeli sözlükte arama yapma iþlemine dayanmaktadýr. Bu
algoritmaya göre sözcük sözlükte aranýr ve bulunursa hiç ek almamýþ demektir. Dolayýsýyla
çözümlemeye gerek yoktur. Sözcüðün sözlükte bulunamamasý durumunda sözcüðün saðýndan
bir harf çýkarýlýr ve sözcüðün kalan kýsmý sözlükte aranýr. Bu iþlem sözcük sözlükte bulunana
kadar devam eder. Eðer sözcüðün ilk harfine gelinmiþ ancak kök sözlükte bulunamamýþsa
sözcük yanlýþ yazýlmýþ demektir.
Harf çýkarýlarak sözlükte bulunan en uzun sözcük her zaman aranan kök olmayabilir. Bu
durumda en son sözlükte bulunan kök üzerinden devam edilerek yeni kök sözlükte aranýr.
Örneðin, “yapýldýn” sözcüðü için ilk olarak “yapý” ad soylu kökü bulunur. Ancak sözcüðün
kalanýna bakýldýðýnda eklerin ad soylu sözcüklere eklenebilecek ekler olmadýðý görülür ve
dolayýsýyla “yapý” sözcüðünden bir harf daha çýkarýlarak sözlükte arama yapýlýr ve “yap” eylem
soylu kökü bulunur.
Kök bulma iþlemi kök sözcük deðiþime uðradýðý durumlarda sorunlara yol açmaktadýr. Örneðin
“oðlumuz” sözcüðü için kök “oðul” dur ve köke birinci çoðul þahýs eki ulandýðýnda kök
sözcük deðiþime uðrayarak “oðl” hâline dönüþmektedir. Ancak “oðl” sözlükte
bulunamayacaðý için bir denetleme iþlemi gerekir. Son iki harf ünsüz ve ilk harf ünlü olduðu için
kök sözcüðün deðiþime uðramýþ olma olasýlýðý yüksektir. “ð” ile “l” harfleri arasýna ünlü
uyumuna uyacak þekilde “ý” ve “u” harfleri getirilerek yeni aday kökler oluþturulur ve sözlükte
aranýr. “oðul” kökü sözlükte bulunur ve bu kökün ünlü düþmesi bayraðýna sahip olup
olmadýðýna bakýlýr. Kök ünlü düþmesi bayraðýna sahip olduðu için aranan kök bulunmuþ
demektir.
126 – Yazým Hatalarýný Düzeltme
Kök sözcüðün deðiþmesi durumu için bir baþka örnek ise ünsüz yumuþamasý durumudur.
Örneðin; “tabaðým” sözcüðü için sözlükte aranan kök “tabað” olacaktýr. Ancak bu sözcük
sözlükte bulunmadýðý için bir deðerlendirme gerekir. Ek, ünlü harf ile baþladýðý için ve son harf
(ð) b, c, d, g, ð harflerinden biri olduðu için ünsüz yumuþamasý durumu olasýdýr. Sözcük “-loð”
eki ile bitmediði için son harften bir önceki harf “n” harfi olmadýðý için “ð” harfinin yerine “k”
harfi konur ve “tabak” sözcüðü sözlükte bulunur. Sözcük ünsüz yumuþamasý bayraðýna sahip
olduðundan dolayý aranan kök bulunmuþ demektir.
Oflazer ve Solak’ýn bu çalýþmalarýnda ünlü uyumu ile ilgili denetimler de yer almaktadýr. Ayrýca
ekler sýnýflandýrýlmýþ ve bu sayede çözümlemenin daha kolay hâle gelmesi saðlanmýþtýr. Diðer
yazým denetimi araçlarýnda olduðu gibi, geliþtirilen bu yazýlýmda da sözcük bazýnda denetleme
yapýlmýþ; cümle bazýnda denetleme yapýlmamýþtýr. Ayrýca yanlýþ yazýlmýþ olan sözcükler için
öneri yapma sistemi mevcut deðildir [7,9].
Türkçede yazým hatalarýnýn düzeltilmesi ile ilgili diðer bir çalýþma K. Oflazer ve C. Güzey
tarafýndan yapýlmýþtýr. Bu çalýþma iki seviyeli bir biçim bilimsel çözümleyici ve dinamik
programlama tabanlý bir arama algoritmasýna dayanmaktadýr. Yazým hatalarýnýn düzeltilmesi ile
ilgili olarak yapýlan bu çalýþmada, sorun iki ayrý ana baþlýk altýnda deðerlendirilmiþtir. Ýlk olarak
yapýlan iþlem, yanlýþ yazýlmýþ sözcük için sözlükten tüm aday köklerin bulunmasýdýr. Burada
zor olan nokta, köklerin yanlýþ yazýlma sonucunda mý yoksa ses deðiþimlerine uðrayarak mý
deðiþmiþ olduðuna karar vermektir. Ýkinci adým ise sorunun esas kýsmýný oluþturmaktadýr; bu da
bulunan tüm aday köklerden olasý tüm sözcüklerin türetilmesidir. Bunu gerçekleþtirmek için de
“edit distance metric” olarak bilinen iki sözcük arasýndaki uzaklýðý bulma yollarýndan
yararlanýlmýþtýr. Bu çalýþmada iki sözcüðün birbirine ne kadar benzer olduðunu bulmak için “q
gram” yöntemi kullanýlmýþtýr. Yapýlan sýnama sonuçlarýna göre yanlýþ yazýlmýþ olan bir
sözcüðün düzeltilmesi %95 baþarýyla gerçekleþtirilmektedir [6,8].
Türkçede yanlýþ yazýlmýþ sözcüklerin bulunmasý ile ilgili bir baþka çalýþma R. Aþliyan, K. Günel
ve T. Yakhno tarafýndan gerçekleþtirilmiþtir. Bu çalýþmanýn amacý bir Türkçe metindeki
sözcüklerin doðru yazýlýp yazýlmadýðýna karar vermektir. Sistem Türkçe metindeki sözcükleri
giriþ olarak almakta ve “n-gram frequency” yöntemini kullanarak olasýlýk daðýlýmý hesabý
yapmaktadýr. Eðer bir sözcüðün olasýlýk daðýlýmý sýfýr ise o sözcüðün yanlýþ yazýlmýþ olduðuna
karar verilmektedir. Sistemi sýnamak için ayný sözcükleri içeren metinlerden oluþan iki farklý
veri tabaný hazýrlanmýþtýr. Bunlardan birincisi 685 tane yanlýþ yazýlmýþ; diðeri ise 685 tane
doðru yazýlmýþ sözcük içermektedir. Sistemin yanlýþ yazýlmýþ olan sözcükleri bulma baþarýmý
%97 olarak verilmiþtir.
Türkçe metinlerdeki yazým hatalarýný bulma konusunda yapýlmýþ bir diðer çalýþma A. Delibaþ ve
E. Adalý tarafýndan gerçekleþtirilmiþtir. Bu çalýþmanýn hedefi;
• Türkçe metinlerdeki yazým hatalarýnýn denetlenmesi,
• Türkçe metinlerdeki yabancý sözcüklerin bulunmasý,
• Bulunan yabancý sözcükler için Türkçe karþýlýklarýnýn önerilmesi,
• Yanlýþ yazýlmýþ sözcükler için sözcük önerilmesi,
9.1 Yazým Hatalarýný Giderme Üzerine Çalýþmalar – 127
• Bulunan yazým hatalarýnýn düzeltilmesi
olarak belirlenmiþtir.
Türkçe metinlerdeki yazým hatalarýnýn denetlenmesi ve yabancý sözcüklerin bulunmasý için
yapýlan çalýþmalarda sözcüklerin Türkçe ses bilimi ve biçim bilimi kurallarýna uygun olup
olmadýðýnýn sýnamasý yapýlmýþtýr. Bu sýnamanýn yapýlabilmesi için ilk olarak heceleme
algoritmasý yardýmýyla sözcüklerin hecelenebilir olup olmadýðý denetlenmiþtir. Bu denetimi
geçemeyen sözcükler Türkçe hece yapýsýna uygun olmadýklarý için doðrudan elenmektedir.
Türkçe metinlerdeki yabancý sözcüklerin ortaya çýkarýlabilmesi için sözcüklerin Türkçe ses
bilgisi ve hece yapýsý kurallarýna uygunluklarýnýn denetlenmesi yeterlidir. Ancak yazým
yanlýþlarýnýn bulunabilmesi için biçim bilimsel çözümleme gereklidir. Bu çalýþma kapsamýnda
gerçekleþtirilen biçim bilimsel çözümleyici kullanýlarak sözcükler kök ve eklerine ayrýldýktan
sonra hatanýn kökte mi yoksa eklerde mi olduðu araþtýrýlmýþ, ardýndan hatalý kýsým
düzeltilmiþtir. Bu çalýþmayla ilgili ayrýntýlý bilgiler Bölüm-9.2’de bulunmaktadýr.
Türkçe metinlerdeki yazým hatalarýnýn giderilmesi için sesbilim ve biçim bilim kurallarý
kullanýlarak gerçekleþtirilen yöntemlerin yeterli olmasý beklenemez. Metinlerin anlamsal
açýdan da denetlenmesi gerekir. Örneðin; “Ali dün okuldan gelecek” tümcesi sesbilim
ve biçim bilimsel kurallar açýsýndan denetlendiðinde hatasýzdýr. Ancak, anlam bilimi açýsýndan
denetlendiðinde yanlýþtýr.
9.2 Yetkin Hata Bulma ve Düzeltme
Türkçe metinlerde yazým hatalarýnýn bulunmasý ve düzeltilmesi konusunda yapýlmýþ olan
çalýþmalar özet biçiminde bir önceki kýsýmda tanýtýlmýþtýr. Bu kýsýmda, A. Delibaþ ve E. Adalý
tarafýndan gerçekleþtirilmiþ olan çalýþma ayrýntýlý biçimde tanýtýlacaktýr. Bu çalýþma
kapsamýnda gerçekleþtirilmiþ olan çalýþmalar sýrasýyla þöyledir:
• Sözcük daðarcýðý oluþturma
• Heceleyici
• Kök bulucu
• Biçim bilimsel çözümleyici
• Türkçe metin denetleyici
• Ses bilimi açýsýndan sözcük denetimi
• Sözcük önerme
128 – Yazým Hatalarýný Düzeltme
9.2.1 Sözcük Daðarcýðý Oluþturma
Oluþturulan sözcük daðarcýðý güncel TDK sözlüðünde yer alan sözcüklerin yaný sýra özel
isimleri de içeren bir metin dosyasýdýr. Bu dosyada sözcükler kök hâlinde bulunmaktadýr.
Türkçe kurallý bir dil olmasýna karþýn kural dýþý durumlarý da olan bir dildir. Ancak bu kural dýþý
durumlarýn da uymak zorunda olduðu kurallar bulunmaktadýr. Bu nedenle oluþturulan sözlük
daðarcýðýnda kural dýþý durumlarýn oluþturacaðý hatalarý ortadan kaldýrmak için sözcüklerin
etiketlenmesi yoluna gidilmiþtir. Aþaðýdaki sözcük kümeleri etiketlenmiþtir:
• Özel isimler
• Yumuþama kuralýna göre deðiþime uðrayan sözcükler
• Ses düþmesinin söz konusu olduðu sözcükler
Sözlük daðarcýðýnda bulunan kök sözcük yukarýda belirtilen özel durumlardan hangisine
uyuyorsa kök sözcüðün yanýna bu özel durum yazýlmýþ; böylece sözcük etiketlenmiþtir.
Sözcük daðarcýðý oluþturulurken yumuþama ve ses düþmesi kurallarýný göz önüne alarak
sözcükleri kümeleyebilecek bir algoritmanýn tasarlanýp tasarlanamayacaðý araþtýrýlmýþtýr. Bu
araþtýrmanýn sonunda aþaðýdaki sonuçlara varýlmýþtýr:
Ünsüz yumuþamasý kuralý göz önüne alýndýðýnda, “k” harfi ile biten sözcüklere ünlü ile
baþlayan bir ek getirildiðinde “k” harfinin yerine “g”, “ð” veya “kk” harfleri gelmektedir.
Örneðin ismin “-i” durum eki “aþk” sözcüðüne ulanýnca “aþký”, “sokak” sözcüðüne ulanýnca
“sokaðý”, ahenk sözcüðüne ulanýnca “ahengi”, “hak” sözcüðüne ulanýnca “hakký” sözcükleri
oluþmaktadýr. Bu örneklerden görüldüðü gibi “k” harfi için üç farklý durum söz konusudur.
Benzer durum “t” harfi için de geçerlidir. Bu aykýrý durumlarýn kaynaðý araþtýrýldýðýnda þu
sonuca varýlmaktadýr:
· Kökeni Doðu dillerine dayanan sözcüklerde genellikle yumuþama olurken Batý
dillerinden Türkçeye girmiþ olan sözcüklerde yumuþamaya daha az rastlanmaktadýr.
Örneðin, “kitap” sözcüðünün kökeni Arapçadýr ve özgün hâli “kitab” þeklindedir. Bu
sözcüðe ünlü ile baþlayan ek ulandýðýnda sözcük özgün hâline geri dönmekte ve ek
özgün hâline ulanmaktadýr. Benzer þekilde Arapça kökenli olan “hak” ve “cet”
sözcükleri de ünlü ile baþlayan ek aldýðýnda özgün hâlleri olan “hakk” ve “cedd”
hâllerine geri dönmektedirler. Bunun yaný sýra “ýslahat”, “sefahat”, “tatbikat” gibi
Arapça kökenli sözcüklerin özgün hâlleri de þu an kullanýlan hâlleriyle ayný olduðu için
bu sözcükler herhangi bir deðiþime uðramamaktadýrlar. Dolayýsýyla buradan da
görüleceði gibi doðu kökenli dillerden Türkçeye geçmiþ olan sözcüklerin pek çoðunda
sözcük, ünsüz yumuþamasý kuralýna uymak için özgün hâline geri dönmektedir.
· Batý kaynaklý dillerden Türkçeye girmiþ olan sözcükler üzerinde de benzer çalýþma
yapýlmýþtýr. Örneðin Fransýzcadan dilimize girmiþ olan “akrobat”, “bürokrat”,
“demokrat” sözcükleri ünlü ile baþlayan bir ek aldýðýnda deðiþime uðramazken yine
9.2 Yetkin Hata Bulma ve Düzeltme – 129
Fransýzcadan dilimize girmiþ olan “piramit” sözcüðü ünlü ile baþlayan bir ek aldýðýnda
deðiþime uðramakta ve sözcük sonundaki “t” harfinin yerini “d” harfi almaktadýr.
Benzer þekilde Fransýzca kökenli olan “bank” sözcüðünde yumuþama söz konusu
deðilken “müzik” sözcüðünde yumuþama olmaktadýr. Batý dillerinden Türkçeye girmiþ
olan sözcüklerin bir kýsmýnda yumuþama gerçekleþmekte bir kýsmýnda
gerçekleþmemektedir.
Bu deðerlendirmelerin sonunda Doðu kökenli sözcükler için bir kural oluþturulabilir gibi
görünse de Batý kökenli sözcükler için yumuþama kuralý oluþturulamamaktadýr. Dolayýsýyla
yazým yanlýþlarýný bulma ve düzeltmedeki hata oranýný en aza indirgemek açýsýndan sözcük
daðarcýðýndaki sözcükler yumuþama kuralý açýsýndan etiketlenmeleri gerekmiþtir.
Ses düþmeleri açýsýndan TDK sözlüðündeki sözcükler incelendiðinde ses düþmesi kuralýnýn
ünsüz yumuþamasý kuralýna göre daha kurallý bir yapýya sahip olduðu söylenebilir. Ancak ses
düþmesinde de kural dýþý durumlar söz konusudur. Örneðin, “beniz” sözcüðü ünlü ile baþlayan
bir ek aldýðýnda ikinci hecedeki “i” ünlüsü düþmekte ve “benzi” hâline dönüþmektedir. Ancak
“deniz” sözcüðüne bakýlacak olursa iki sözcük arasýndaki farkýn sözcük baþýndaki harf olmasýna
karþýn bu sözcükte ses düþmesi söz konusu deðildir. Dolayýsýyla sözlük daðarcýðýndaki
sözlüklerin ses düþmesi açýsýndan etiketlenmesi gerektiði sonucuna varýlmýþtýr.
Sözlük daðarcýðýna yeni sözcükler eklenebilmektedir. Eklenecek sözcük yabancý bir sözcük ise
bu sözcüðe karþýlýk düþen bir Türkçe sözcük önerilmektedir. Örneðin “arkeoloji” sözcüðü
yerine “kazý bilimi” veya “agresif” sözcüðü yerine “saldýrgan” sözcüðü önerilebilir. Sözcük
daðarcýðýna eklenmek istenen sözcük yabancý sözcük olmasýna karþýn eklenmek isteniyorsa
eklenebilir.
9.2.2 Heceleyici
Biçim bilimsel çözümleyiciyi gerçekleþtirebilmek bir heceleyici gerekli olmuþtur. Türkçede
ekler ve kökler arasýndaki ses olaylarý hece boyutunda gerçekleþtiði için hecelemenin önemi
oldukça büyüktür. Türkçede altý temel hece yapýsý bulunmaktadýr. Ses kurallarý sadece bu hece
yapýlarýna izin vermektedir. Bu kurallara göre Türkçe bir hecenin içinde en az bir, en fazla dört
ses bulunabilir. Türkçedeki bu hece kalýplarý sayesinde hecelemenin yapýsal olarak
modellenmesi ve yazýlým ile gerçekleþtirilmesi olanaklýdýr. Bazý yabancý sözcüklerde heceleme
kuralý dýþýna çýkýldýðý görülmektedir. Gerçekleþtirilen heceleme algoritmasýnýn temeli Türkçe
hece modelleri temeline dayanmaktadýr. Algoritmada sözcük sondan baþa doðru incelenmekte
ve hecelenmektedir. Heceleme algoritmasýnýn adýmlarý aþaðýda verilmiþtir:
1. Aþama
Sözcüðün sonundaki harf okunur ve bu harfin ünlü mü yoksa ünsüz mü olduðu
belirlenir. Eðer son harf ünsüz ise sözcük uzunluðu denetlenir. Sözcük uzunluðu bir
harf ise bu hata durumudur; çünkü Türkçede heceler sadece bir ünsüz harften
oluþamazlar.
130 – Yazým Hatalarýný Düzeltme
9.2 Yetkin Hata Bulma ve Düzeltme – 131
Sözcüðün son
harfini oku
Bulunan heceyi
sözcükten çýkar
Sözcük
uzunluðunu
hesapla
Sözcük
uzunluðunu
hesapla
Hece bulundu
Uzunluðu = 4
Hece bulundu
Uzunluðu = 3
Hece bulundu
Uzunluðu = 1
Hece bulundu
Uzunluðu = 2 Hata
Baþla
SON
Ünlü harf mi?
Sözcük
uzunluðu=0 mý?
Sözcük
uzunluðu =1 mi?
Sözcük
uzunluðu =1 mi?
Sözcük
uzunluðu =2 mi?
Sözcük
uzunluðu =3 mü?
Sözcük
uzunluðu =4 mü?
Sözcük
uzunluðu =2 mi?
Sözcük
uzunluðu =3 mü?
Harf
l,r,p,y,n,s den
biri mi?
Sözcük
uzunluðu =2 mi?
Sözcük
uzunluðu >3 mü?
Sondan
bir önceki harf
ünlü mü?
Sondan
bir önceki harf
ünlü mü?
Sondan
iki önceki harf
ünlü mü?
Sondan
üç önceki harf
ünlü mü?
Sondan
iki önceki harf
ünsüz mü?
Sondan
iki önceki harf
ünsüz mü?
Sondan
üç önceki harf
ünsüz mü?
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H H
H
H
E
E
E E E
E
E
E
E
E
E
E
E
E
E
E
E
E
E
E
Þekil-9.1: Türkçe sözcükleri heceleme algoritmasý
2. Aþama
Sözcük ilk aþamadan geçerse sondan bir önceki harf ele alýnýr. Eðer sondan bir önceki
harf ünlü ise bu durumda sözcük denetlenir. Eðer sözcük uzunluðu iki ise (örneðin: al)
veya sondan iki önceki harf ünlü ise (örneðin; saat, zaaf) hece bulunmuþ demektir.
Eðer sözcük uzunluðu üç (örneðin; yat, kat) ise veya sondan üç önceki harf ünlü ise
(örneðin; kitap, kalem) hece bulunmuþ demektir. Bu koþullar saðlanmýyorsa sondan
dört önceki harfe bakýlýr ve bu harf ünlü ise (örneðin, kezzap) hece bulunmuþ
demektir. Bu koþullarýn dýþýndaki durumlarda hata oluþturulur.
3. Aþama
Ýlk iki aþama sondan bir önceki harfin ünlü olmasý durumunda izlenecek yolu
göstermektedir. Sondan bir önceki harf de son harf gibi ünsüz ise ve bu harf “l, r, y, p,
n, s” harflerinden biriyse bu durumda hece Türkçe hece modellerinden SZZ veya
ZSZZ kalýplarýndan birine uymaktadýr. Sözcük uzunluðu iki ise veya sondan iki
önceki harf de ünsüz ise hata oluþturulur. Çünkü Türkçe hece kalýplarýna göre bir hece
iki ünsüz (ZZ) veya üç ünsüzden (ZZZ) oluþamaz. Bu denetim sayesinde yabancý
dillerden dilimize girmiþ olan ve sözcük baþýnda veya ortasýnda birden fazla ünsüz
harfi yan yana bulunduran sözcüklerin hecelenmesine izin verilmez. Sözcük uzunluðu
üçten büyük ve sondan üç önceki harf ünsüz ise (örneðin; kalp, Türk, ebeveyn) hece
bulunmuþ demektir.
4. Aþama
Son harfin ünlü olmasý durumunda ise uygulanan yöntem þu þekildedir: Sözcük
uzunluðu bir ise (örneðin; o) hece bulunmuþ demektir. Sondan bir önceki harf ünsüz
ise ve sözcük uzunluðu iki ise (örneðin; ye, ya) hece bulunmuþ demektir. Sondan iki
önceki harf ünsüz ve sözcük uzunluðu üç ise hece bulunmuþ demektir. Tüm bu
denetimlerin dýþýnda kalan durumlar için hata üretilir ve heceleme yapýlamaz.
Yukarýda da belirtildiði gibi heceleme sözcük sonundan baþýna doðru yapýlmaktadýr.
Dolayýsýyla ilk hece bulunduktan sonra bulunan hece sözcükten çýkarýlmakta ve anlatýlan
denetimlerin hepsi sözcükte kalan diðer heceler için de aynen gerçekleþtirilmektedir. Her hece
bulunduðunda bulunan hece dýþýnda sözcükte kalan diðer heceler için ayný iþlemler
tekrarlanmaktadýr ve bu iþlem sözcük uzunluðu sýfýrlanana kadar devam etmektedir. Böylece
sözcükteki tüm heceler bulunabilmektedir. Þekil-9.1 heceleme algoritmasýna iliþkin akýþ
diyagramýný göstermektedir.
9.2.3 Kök Bulucu
Kullanýlan kök bulma algoritmasý aðaç veri yapýsý ile oluþturulmuþtur. Sözlükten okunan tüm
kökler bu aðaca yerleþtirilir. Kök aðacý Yönlü Döngüsüz Sözcük Çizgesi (YDSÇ) DAWG)
yapýsýndadýr. Aþaðýda Kök Aðacý Yönlü Döngüsüz Sözcük Çizgesi hakkýnda bilgi verilmiþtir.
132 – Yazým Hatalarýný Düzeltme
9.2.3.1 Yönlü Döngüsüz Sözcük Çizgesi Yapýsý
YDSÇ hýzlý sözcük aramalarýna olanak tanýyan bir veri yapýsýdýr. Çizgeye giriþ noktasý aranan
sözcüðün baþlangýç harfidir. Her düðüm bir harfi temsil eder. Çizgede ilerlerken karþýlaþýlan
harf ile aranan harfin ayný olmamasý durumunda bir düðümden diðer düðümlere geçiþ
yapýlabilir.
Çizgenin yönlü bir çizge olmasýnýn nedeni herhangi iki düðüm arasýnda sadece özel ve belirli bir
yolda ilerlenilebilmesidir. Diðer bir deyiþle, A düðümünden B düðümüne gidilebilir; ancak B
düðümünden A düðümüne gidilemez. Döngüsüz olmasýnýn nedeni ise çizge üzerinde herhangi
bir yolun baþlangýç ve bitiþ düðümünün ayný olmamasýndan kaynaklanmaktadýr. Bir baþka
deyiþle çizge üzerinde A ® B ® C ® A þeklinde bir yol bulunmasý söz konusu deðildir.
Þekil-9.2’de “BAL”, “BAS” sözcüklerinin YDSÇ içindeki yerleþimi gösterilmiþtir.
Þekil-9.2’deki ÇD : Çocuk Düðüm, SD : Sonraki Düðüm ve SS : Sözcük Sonu anlamýna
gelmektedir. Þekil-9.2’deki YDSÇ’de “BAS” sözcüðünün aranmasý durumunda giriþ
noktasýndan (B harfi) arama baþlayacaktýr. “B” harfi aradýðýmýz sözcüðün ilk harfi olduðundan
dolayý bundan sonra yapýlacak iþlem “B” harfinin çocuk düðümüne gitmektir.” BAS” sözcüðü
için aradýðýmýz ikinci harf “A” harfidir ve bu harf çizge üzerinde “B” harfinin çocuk düðümü
olan “A” harfi ile ayný olduðundan bu kez de “A” harfinin çocuk düðümüne bakýlacaktýr. “BAS”
Þekil-9.2’deki ÇD : Çocuk Düðüm, SD : Sonraki Düðüm ve SS : Sözcük Sonu anlamýna
gelmektedir. Þekil-9.2’deki YDSÇ’de “BAS” sözcüðünün aranmasý durumunda giriþ
noktasýndan (B harfi) arama baþlayacaktýr. “B” harfi aradýðýmýz sözcüðün ilk harfi olduðundan
dolayý bundan sonra yapýlacak iþlem “B” harfinin çocuk düðümüne gitmektir.” BAS” sözcüðü
için aradýðýmýz ikinci harf “A” harfidir ve bu harf çizge üzerinde “B” harfinin çocuk düðümü
olan “A” harfi ile ayný olduðundan bu kez de “A” harfinin çocuk düðümüne bakýlacaktýr. “BAS”
sözcüðü için aranýlmasý gereken sýradaki harf “S” harfidir. Ancak bu harf, çizge üzerinde “A”
harfinin çocuk düðümü olan “L” harfinden farklý olduðu için ” L” harfinin çocuk düðümüne
bakýlmayacak ve bir sonraki düðüme (S) geçilecektir. Bu düðüm aranýlan harf olan S harfini
göstermektedir. Aranýlan sözcük içindeki tüm harfler bulunduðuna göre bundan sonra
yapýlmasý gereken sözcük sonuna gelinip gelinmediðinin denetlenmesidir.
9.2 Yetkin Hata Bulma ve Düzeltme – 133
B ÇD A ÇD L(SS)
SD
S(SS)
Þekil-9.2: “BAL” ve “BAS”sözcükleri için YDSÇ
YDSÇ’de ayný harfle biten sözcüklerin ayný düðümde sonlanmasý iþlemi gerçekleþtirilebilir.
Þekil-9.3’deki “BOL” ve “KOL” sözcüklerinin YDSÇ’deki yerleþimi bu duruma örnek olarak
gösterilebilir.
9.2.3.2 Yönlü Döngüsüz Sözcük Çizgesi Oluþturma
YDSÇ oluþturmak için ilk olarak aðaç oluþturulur. Aðaçtaki yapraklardan biri sözcük sonunu
temsil eder. Aðaçta birbirinin ayný olan çok sayýda yaprak bulunabilir. Þekil-9.4’te “BAL” ve
“SAL” sözcüklerinin aðaçtaki diziliþi görülmektedir.
Þekil-9.4’te görülen aðaca balta sözcüðü eklenmek istendiðinde, L harfine gelene kadar aðaç
üzerinde arama yapýlýr. L harfine gelindiðinde bu düðümün çocuðu olmadýðý görülür ve T
düðümü son düðüm olan L düðümüne, A düðümü de son eklenen T düðümüne eklenir. Sonuçta
oluþan durum Þeki-9.5’teki gibidir.
134 – Yazým Hatalarýný Düzeltme
B ÇD O ÇD L(SS)
SD ÇD
K
Þekil-9.3: “BOL” ve “KOL”sözcükleri için YDSÇ
B
S
ÇD
ÇD
ÇD
ÇD
A
A
L(SS)
SD
L(SS)
Þekil-9.4: “BAL” ve “SAL”sözcükleri için aðaç oluþumu
B
S
ÇD
ÇD
ÇD ÇD
ÇD
A ÇD
A
L(SS) T
L(SS)
A(SS)
SD
Þekil-9.5: “BALTA” sözcüðünün aðaca yerleþtirilmesi
Þekil-9.5’ten de görüleceði gibi aðaca bu þekilde sözcük eklemek sözcüklerin baþlangýçlarý için
ortak düðümler olmasýný saðlarken sözcük sonlarý her sözcük için farklý olmaktadýr. Çizgenin
boyutunu daha sý”nýrlý hâle getirmek için sözcük sonlarýnýn ortak olan kýsýmlarý bulunmalý ve
birleþtirilmelidir. Bunu gerçekleþtirmek için yaprak düðümden yola çýkýlýr. Ýki yaprak düðüm
ayný ise bunlar birleþtirilebilir. Ýki yaprak düðümün ayný olmasý için bu düðümlerin ayný harfi
taþýmalarý tek baþýna yeterli deðildir; bir sonraki düðümleri veya çocuk düðümleri varsa
bunlarýn da ayný olmasý gereklidir. Þekil-9.6’da görülen çizge bu duruma örnek olarak
verilebilir.
9.2.3.3 Aðaç Üzerinde Kök Bulma
Aðaç üzerinde bir kökü bulmak için aðacýn baþýndan itibaren kökü oluþturan harfleri temsil eden
düðümleri izlemek gerekir. Þekil-9.7’de görülen aðaç üzerinde örneðin “balo” kökü bulunmak
istendiðinde ilk olarak “B” baþlangýç düðümünden “A” düðümüne, “A” düðümünden “L”
düðümüne ve oradan da “O” düðümüne geçmek gerekir.
9.2 Yetkin Hata Bulma ve Düzeltme – 135
B
D
ÇD
ÇD ÇD
E ÇD N ÇD Ý ÇD Z(SS)
SD
G
Þekil-9.6: Sözcük sonlarýnýn ortak düðümlere baðlanmasý
B
A
L
E
T
O A
N
C
A I
K
Þekil-9.7 Aðaç üzerinde kök bulma
9.2.3.4 Aðaç Üzerinde Kök Bulma
Aðaç üzerinde kök bulma iþlemi bir veri yapýsý olan aðacýn düðümlerinin üzerinde gezilmesi ve
aranan düðümle üzerinde bulunulan düðümün karþýlaþtýrýlmasý þeklinde gerçekleþtirilmektedir.
Dolayýsýyla kök bulma algoritmasýnýn özü aðaca yerleþtirilmiþ olan kökler üzerinde yapýlan
aðaç iþlemleridir. Girilen sözcüðün ilk harfinden baþlanarak aðaç üzerinde ilerlenilir.
Ýlerlenecek yer kalmayana veya sözcük bitene kadar aðaç üzerinde ilerlemeye devam edilir.
Aðaç üzerinde ilerlerken karþýlaþýlan tüm kökler aday olarak toplanýr. Örneðin; “BALON”
sözcüðü için aðaç üzerinde yürürken karþýlaþýlan “BAL”, “BALE” ve “BALON” köklerinin üçü
de aday kökler olarak bulunur.
Ses deðiþimleri (ünsüz yumuþamasý, ses düþmesi vb.) nedeniyle deðiþime uðrayan sözcüklerin
aðaca eklenmesi sýrasýnda hem sözcüðün özgün hâli hem de deðiþime uðrayan hâli aðaca
eklendiði için kök bulma iþlemi sýrasýnda herhangi bir sorunla karþýlaþýlmaz. Örneðin, “þarap”
sözcüðü hem “þarap” hem de “þarab” olarak aðaca eklenmektedir; ancak bu iki düðümün de
iþaret ettiði kök aynýdýr ve bu kök “þarap” köküdür. Böylece ünsüz yumuþamasýna uðramýþ
olarak aranan sözcüðün kökünün de aðaçta bulunmasý saðlanmýþ olur.
9.2.4 Sözcüðün Biçimbilimsel Çözümlenmesi
Türkçenin ek zengini olduðu bir gerçektir. Bu nedenle sözcüklerin biçim bilimsel
çözümlenmesi önemli bir çalýþma olarak deðerlendirilir.
9.2.4.1 Ekler
Ekler ve eklerin sözcük kök veya gövdelerine ulanýþlarýnda oluþturduklarý desenlerin
incelenmesi biçim bilimsel çözümleme açýsýndan oldukça önemlidir. Eklerin
sýnýflandýrýlmasýnda en önemli aþama yapým ve çekim eklerinin hangi sýralarla birbirlerini
izlediklerini belirleyebilmektir. Türkçe dil bilgisi kurallarýna göre çekim ekleri yapým
eklerinden sonra gelir. Dolayýsýyla bir kez çekim eki alan sözcük, daha sonra sadece çekim eki
alabilir. Çekim eklerinin birbirlerini hangi sýrayla takip edecekleri de kurallara baðlýdýr. Yapým
ekleri için bu þekilde oluþturulmuþ kesin kurallarýn varlýðýndan bahsetmek olanaklý deðildir.
Tüm Türk dillerinde ekler dilin en önemli bileþenini oluþtururlar ve bu nedenle eklerin yapýsýnýn
anlaþýlmasý biçim bilimsel inceleme açýsýndan oldukça önemlidir. Türkçede eklerin
isimlendirilmesinde ve gösterilmesinde kullanýlan benimsenmiþ bir yöntem mevcut olmamakla
beraber bu bölümde verilecek olan örnekler sýkça kullanýlan yöntemler temel alýnarak
verilmiþtir. Örneðin çoðul eki olan “-lar” ekinin gösterilimi “-lAr” þeklindedir. Bu gösterimde
küçük harfle yazýlmýþ olan “l” ve “r” harfleri eke doðrudan eklenileceðini gösterirken, büyük
harfle yazýlmýþ olan “A” harfi ekleneceði sözcüðün son ünlüsüne göre deðiþebileceðini ifade
etmektedir. Ekin ulanacaðý sözcüðün son ünlüsü kalýn ünlü ise bu harf “a”, ince ünlü ise “e”
hâlini alacaktýr.
136 – Yazým Hatalarýný Düzeltme
Türkçede ekler için özel bazý durumlar söz konusudur. Örneðin Türkçede þimdiki zaman eki
olan “-(I)yor” eki ulandýðý eylemin son harfi ünlü harf ise bu harfin düþmesine neden olur.
Örneðin; “ara-“ eylem köküne þimdiki zaman eki ulandýðýnda oluþan eylem “ara-yor” þeklinde
deðil, “ar-ýyor” þeklindedir. Benzer þekilde eylemleri edilgen yapan ekler de ulanacaklarý
eylemlerin son ünsüzlerine baðlý olarak deðiþebilmektedirler. Örneðin; “gel-“ eylemine
edilgenlik eki ulandýðýnda eylem “gel-in-mek” hâlini alýrken “kes-“ eylemi “kes-il-mek” hâline
dönüþmektedir.
Kullanýlan ek dosyasý içinde ekler kümelere ayrýlarak sýnýflandýrýlmýþtýr. Örneðin, ismin hâl
ekleri için bir küme oluþturulmuþ ve bu kümeye dâhil olan tüm ekler (-i, -e, -de, -den) bu
kümenin içine konulmuþtur. Ayrýca çekim eklerinin birbirlerini hangi sýrayla izleyebilecekleri
ile ilgili kurallar göz önüne alýnarak ekler arasýnda iliþkilendirme yapýlmýþtýr. Bir ekten sonra
gelebilecek tüm olasý ekler, ilgili ekle iliþkilendirilmiþ ve bu sayede eklerin ayrýþtýrýlmasý daha
kolay çözümlenebilir hâle getirilmiþtir. Bunun yaný sýra yukarýda da belirtildiði gibi bazý eklerin
özel durumlara sahip olmasý nedeniyle bu eklerle ilgili özel durumlarý belirten etiketler
verilmiþtir.
9.2.4.2 Ayrýþtýrma Algoritmasý
Biçim bilimsel çözümlemede kullanýlan ayrýþtýrma algoritmasý girilen bir sözcüðe ait olasý tüm
kök ve ek çözümlerini bulmak için kullanýlýr. Girilen bir sözcüðün biçim bilimsel
çözümlemesinin yapýlmasýnda ilk adým, girilen sözcüðü noktalama iþaretleri, kýsa çizgi iþareti
gibi harf dýþýndaki elemanlardan ayrýþtýrmaktýr. Bu sayede geriye sadece kök ve ekler kalýr. Harf
dýþýndaki elemanlarýn ayýklanmasýndan sonra yapýlan iþlem, olasý tüm köklerin kök aðacý
üzerinde gezilerek bulunmasýdýr. Kök bulma algoritmasý Bölüm-9.2.3’te anlatýlmýþtýr.
Olasý tüm kökler bulunduktan sonra eklerin bulunmasý iþlemi baþlar. Bunun için kök sözcüðün
almýþ olduðu ilk eke bakýlýr. Bölüm-9.2.4.1’de belirtildiði gibi ilk ek kendinden sonra
gelebilecek eklerle ilgili bilgi verdiði için sýrayla bu ekler ele alýnýr ve ekin kök sözcük üzerinde
özel bir durum oluþturup oluþturmadýðýna bakýlýr. Örneðin ek ünlü ile baþlýyorsa ve kök sözcük
ünlü düþmesi özel durumuna sahipse bu durumda ek, kök sözcük üzerinde özel bir durum
oluþturur. Eklerin kök sözcük üzerinde özel durumlarýn oluþmasýna neden olmasý durumda, kök
sözcük özel duruma uygun þekle dönüþtürülür. Kök sözcük uygun þekle dönüþtürüldükten sonra
sýra ekin köke ulanmasýna gelir. Burada ekin özelliðine göre köke ulama iþlemi gerçekleþtirilir.
Örneðin; kök sözcük “elma” ise ve ulanacak ek “-lAr” eki ise ilk olarak sözcüðe “l” harfi
eklenir. Daha sonra sözcüðün son ünlüsünün kalýn mý ince mi olduðuna bakýlýr. “Elma” kök
sözcüðü için son ünlü kalýn olduðundan ulanacak ek kalýn olacak þekilde biçimlendirilir. Bu
durumda kök sözcük “elmala” hâlini alýr. Son olarak da “r” harfi sözcüðe ulanýr ve böylece
“-lAr” ekinin sözcüðe ulanmasý iþlemi bitmiþ olur. Ýlk ek sözcüðe ulandýktan sonra girilen
sözcük ile oluþturulan sözcüðün ayný olup olmadýðý denetlenir. Sözcükler ayný ise ulanacak ek
kalmamýþ demektir. Ayný deðilse girilen sözcük daha fazla sayýda ek içeriyor demektir; bu
durumda oluþturulan sözcük bir yýðýnda saklanýr ve ek ulama iþlemine devam edilir. Bir sonraki
eki bulmak için önceki ekle iliþkilendirilmiþ olan eklere bakýlýr. Bu noktada çekim eklerinin
9.2 Yetkin Hata Bulma ve Düzeltme – 137
hangi sýrayla birbirlerini takip edebileceði kurallarýnýn var olmasý oldukça iþe yaramaktadýr. Bir
önceki örnekten devam edilecek olursa girilen sözcük “elmalarým” sözcüðü olmak üzere ilk ek
“-lAr” eki sözcüðe eklendikten sonra geride kalan “-ým” eki için “-lAr” ekinden sonra
gelebilecek ekler arasýnda arama yapýlýr ve bu ekin birinci tekil þahýs iyelik eki olduðu arama
sonucunda ortaya çýkar. Bu ek de sözcüðe ulandýktan sonra giriþ sözcüðü ile oluþturulan
sözcüðün ayný olup olmadýðýna bakýlýr ve sözcükler ayný olacaðý için çözümleme iþlemi
gerçekleþtirilmiþ olur. Þekil-9.8 ayrýþtýrma algoritmasýna iliþkin akýþ diyagramýný
göstermektedir.
9.2.5 Türkçe Metin Denetleyici
Sözcük için Türkçe denetimi yapýlmasýnda amaç, girilen sözcüðün Türkçe bir sözcük olup
olmadýðýný denetlemektir. Bunu gerçekleþtirebilmek için öncelikle sözcüðün hecelenebilir olup
olmadýðýnýn denetlenmesi gerekir. Eðer girilen sözcük hecelenemiyorsa Türkçe olmadýðý
kararýna varýlýr.
Hecelenebilen sözcüklerin, Türkçe sözcüklerin saðlamasý gereken ve aþaðýda sýralanan kurallarý
saðlayýp saðlamadýðýna bakýlýr.
• Sözcük baþý ünsüz denetimi
• Sözcük sonu ünsüz denetimi
• Sözcük içi ünsüz denetimi
• Ünlü uyumlarý
• Ünsüz uyumu
• Ses bilimi açýsýndan sözcük denetimi
• Ünsüz yumuþamasý denetimi
• Ünlü düþmesi denetimi
Bu kurallardan en az bir tanesini saðlamayan sözcük Türkçe bir sözcük deðildir veya dilimize
yabancý dillerden girmiþ bir sözcüktür. Þekil-9.9 Türkçe sözcük denetimine iliþkin genel akýþ
diyagramýný göstermektedir.
9.2.5.1 Sözcük Baþý Ünsüz Denetimi
Türkçe bir sözcüðün baþýnda birden fazla ünsüz harf bulunamaz. Dolayýsýyla ilk olarak yapýlan
denetim sözcük baþýndaki ünsüz harf sayýsýný bulma amacýna yöneliktir. Bu aþamada yapýlan iþ
sözcük baþýndaki ünsüz sayýsýnýn birden fazla olup olmadýðýnýn bulunmasýdýr. Eðer bu sayý
birden fazla ise sözcüðün Türkçe olmadýðýna karar verilir. Örneðin “strateji”, “tren” gibi
sözcükler dilimize yabancý dillerden girmiþ olan sözcüklerdir ve yapýlan bu denetim ile bu
sözcüklerin Türkçe olmadýðý kolay bir þekilde ortaya çýkarýlýr. Aslýnda bu yabancý sözcükleri
138 – Yazým Hatalarýný Düzeltme
9.2 Yetkin Hata Bulma ve Düzeltme – 139
Sözcüðü harf dýþýndaki
elemanlardan arýndýr
Ýlk aday kökü al
Olasý tüm
kökleri bul
Sýradaki kök
adayýný al
Ýlk eki bul
Sýradaki eki bul
Kökü özel durumuna
göre biçimlendir
Sözcük çözümleme
için ilk aday oluþturuldu
Sözcüðün oluþturulan
halini sakla
Eki kuralýna göre
sözcüðe ekle
Baþla
Ek kök
üzerinde özel
durum oluþturur
mu ?
Girilen
sözcükteki ek
ulanan ekle ayný
mý ?
Girilen
sözcük ilk
oluþturulan ile ayný
mý ?
H
H
H
E
E
E
Þekil-9.8: Ayrýþtýrma algoritmasýnýn akýþ diyagramý
140 – Yazým Hatalarýný Düzeltme
Sözcükteki hece
sayýsýný bul
Sözcük kökünü bul
Sözcük Türkçe deðilidir
ya da yanlýþ yazýlmýþtýr
Sözcük içi ünsüz harf
denetimini uygula
Sözcük yabancý ise
Türkçe karþýlýk sözcük öner
Sözcük Türkçedir
Sözcük baþý ünsüz harf
denetimini uygula
Sözcük sonu ünsüz harf
denetimini uygula
Baþla
Hece
sayýsý sýfýr mý?
Sözcük
ünlü uyumuna uygun mu?
Sözcük
ünsüz uyumuna uygun mu?
Sözcük
denetimi baþarýlý mý ?
Sözcük
denetimi baþarýlý mý ?
Sözcük
denetimi baþarýlý mý ?
H
H
H
H
H
H
E
E
E
E
E
E
SON
Þekil 9.9 Türkçe denetimi akýþ diyagramý
seslendirirken iki ünsüz arasýna bir ünlü koyduðumuz da bir gerçektir. Örneðin “tren”
sözcüðünü “tiren” biçiminde seslendiririz. Ancak her nedense yabancý dildeki biçiminde
yazmaya devam ederiz.
Þekil-9.10 sözcük baþýndaki ünsüz harf sayýsýnýn denetimine iliþkin akýþ diyagramýný
göstermektedir.
9.2.5.2 Sözcük Sonu Ünsüz Denetimi
Sözcük sonundaki ünsüz harflerle ilgili Türkçede bulunan kurallar þu þekilde özetlenebilir:
• Türkçe sözcüklerin sonunda b, c, d, g harfleri bulunamaz.
• Türkçe bir sözcüðün sonunda ikiden fazla sayýda ünsüz harf bulunamaz.
• Türkçe bir sözcük sonunda çift ünsüz bulunabilir. Bu durum için kurallar þu þekildedir:
9.2 Yetkin Hata Bulma ve Düzeltme – 141
Ýlk harfi oku
Ýkinci harfi oku
Sözcük Türkçe
Deðilidir
Baþla
Ünlü harf mi ?
Ünlü harf mi?
H
H
E
E
SON
Þekil-9.10: Sözcük baþý ünsüz harf sayýsý denetimi için akýþ diyagramý
• Son harfi “ç, k, p, t” olan sözcüklerde bir önceki harf ünsüz harf ise bu harf
“l” harfi olabilir. Örneðin, ölç, “cýlk” gibi.
• Son harfi “ç, k, t” olan sözcüklerde bir önceki harf ünsüz harf ise bu harf “n”
harfi olabilir. Örneðin; “kýskanç”, “iðrenç” gibi.
• Son harfi “ç, k, p, s, t” olan sözcüklerde bir önceki harf ünsüz harf ise bu harf “r”
olabilir. Örneðin; “bark”, “Türk” gibi.
• Son harfi “t” olan sözcüklerde bir önceki harf ünsüz harf ise bu harf “s”
olabilir. Örneðin; “üst” gibi.
142 – Yazým Hatalarýný Düzeltme
Son harfi oku
Önceki harfi oku
Türkçe sözcüklerin
sonunda b, c, d, g
harfleri bulunamaz
Sözcük sonundaki
çift ünsüz kuralýna
uygun deðil
Baþla
Ünlü harf mi ?
Ünlü harf mi ?
Önceki harf “l” mi?
Önceki harf
“ç, k, t ”
den biri mi?
Son harf
“ ç, k, p, s, t “
den biri mi?
Son harf
“ t “ mi?
Önceki harf “ n ” mi?
Önceki harf “ r ” mi?
Önceki harf
“s ya da þ” mi?
Son harf
“ç, k, p, t”
den biri mi ?
Ünlü harf mi?
H
H
H
H
H
H
H
H
H
H
H
E
E
E
E
E
E
E
E
E
E
E
SON
SON
Þekil-9.11: Sözcük sonu ünsüz harf sayýsý denetimi için akýþ diyagramý
• Son harfi “t” olan sözcüklerde bir önceki harf ünsüz harf ise bu harf “þ” olabilir.
Örneðin; “hiþt” gibi.
Yukarýda sýralanan kurallardan yola çýkýlarak sözcük sonundaki ünsüz harf denetlenir. Eðer bu
harf b, c, d, g harflerinden biri ise sözcüðün Türkçe olmadýðýna karar verilir. Eðer sözcük bu
kuralý saðlýyorsa bu durumda sözcük sonundaki ünsüz harf sayýsýna bakýlýr. Sözcük sonundaki
ünsüz harf sayýsý ikiden büyük ise sözcüðün Türkçe olmadýðýna karar verilir. Sözcük sonundaki
ünsüz harf sayýsý iki ise sondan bir önceki harfe bakýlýr. Bu harf “l” ise ve son harf “ç, k, p, t”
harflerinden biri deðilse sözcük Türkçe deðildir. Benzer þekilde sondan bir önceki harf “n” ise
ve son harf “ç, k, t” harflerinden biri deðilse sözcük Türkçe deðildir. Sondan bir önceki harf “r”
ise ve son harf “ç, k, p, t, s” harflerinden biri deðilse sözcük Türkçe deðildir. Sondan bir önceki
harf “s” veya “þ” ise ve son harf “t” deðilse sözcük Türkçe deðildir. Þekil-9.11 sözcük
sonundaki ünsüz harf sayýsýnýn denetimine iliþkin akýþ diyagramýný göstermektedir.
9.2.5.3 Sözcük Ýçi Ünsüz Denetimi
Türkçe bir sözcüðün içinde üç veya daha fazla sayýda ünsüz harf yan yana bulunamaz. Bu
kuraldan yola çýkýlarak sözcük içinde yan yana bulunan ünsüz harf sayýsýnýn denetimi yapýlýr.
Bunun için girilen sözcük ilk harfinden son harfine kadar taranýr ve sözcük içindeki yan yana
bulunan ünsüz harf sayýsý hesaplanýr. Eðer bu sayý üçe eþit veya üçten büyük ise sözcük Türkçe
deðildir. Þekil-9.12 sözcük içinde yan yana gelebilecek ünsüz sayýsýnýn denetimine iliþkin akýþ
diyagramýný göstermektedir.
9.2.5.4 Ünlü Uyumlarý
Türkçe kelimelerde uyulmasý gereken en önemli özelliklerden biri de ünlü uyumu kuralýdýr.
Öncelikle sözcük heceleme algoritmasý ile hecelerine ayrýlýr. Bundan amaç sözcük içindeki ünlü
harf sayýsýný bulmaktýr. Türkçenin hece kalýplarýna göre Türkçe bir hecede mutlaka bir ünlü harf
bulunmak zorundadýr. Dolayýsýyla Türkçe bir sözcükteki hece sayýsý ayný zamanda sözcük
içindeki ünlü harf sayýsýný da verir.
Ünlü uyumu algoritmasýnda izlenen yol þu þekildedir: Hece dizinlerinden yararlanýlarak sözcük
içindeki ünlü harflerin dizinlerine eriþilir ve ilk ünlü harf okunur. Ýlk harf kalýn ünlü ise sonraki
hecelerdeki tüm ünlü harflerin de kalýn ünlü olup olmadýðý denetlenir. Benzer þekilde ilk harf
ince ünlü ise sonraki hecelerdeki tüm ünlü harflerin ince ünlü olup olmadýðý denetlenir. Eðer
sözcük bu kurala uymuyorsa Türkçe deðildir veya dilimize yabancý dillerden girmiþtir. Sözcük
bu kurallara uygunsa sözcüðün küçük ünlü uyumuna uyup uymadýðý denetlenir. Sözcüðün ilk
ünlü harfi düz ünlülerden biri ise sonraki hecelerdeki ünlü harfler de düz ünlü olmalýdýr.
Sözcüðün ilk ünlü harfi yuvarlak ünlülerden biri ise sonraki hecelerdeki ünlü harfler ya dar
yuvarlak ya da düz geniþ olmalýdýr. Bu kurala uymayan sözcükler Türkçe deðildir veya dilimize
yabancý dillerden girmiþlerdir.
9.2 Yetkin Hata Bulma ve Düzeltme – 143
Þekil-9.13 büyük ünlü uyumu için, Þekil-9.14 ise küçük ünlü uyumu için akýþ diyagramýný
göstermektedir.
144 – Yazým Hatalarýný Düzeltme
Sözcükteki ünsüz
harf sayýsýný bul
Sözcükteki ünsüz harflerin
sýra numarasýný dizide tut
L= dizi sonu
Sözcük içindeki ünsüz
sayýsý ve ünsüzlerin
diziliþi uygun deðildir
Sözcük içindeki ünsüz
sayýsý ve ünsüzlerin
diziliþi uygundur
Baþla
Ünsüz harf
sayýsý >2 mi ?
L = 0 mý ?
L yi bir azalt
Dizi(i)=Dizi(i-1)+1 mi ?
Dizi(i-1)=Dizi(i-2)+1 mi ?
H
H
H
H
E
E
E
E
SON
Þekil-9.12: Sözcük içindeki ünsüz harf sayýsý denetimi için akýþ diyagramý
9.2.5.5 Ünsüz Uyumu
Türkçe sözcüklerde ünsüzler açýsýndan da bir uyum söz konusudur. Bu kurala uygun olarak
geliþtirilen algoritma sözcük içindeki ünsüz harfler sýrasýyla taranmakta ve ele alýnan ünsüz
harfin bir sonraki ünsüz harf ile uyumlu olup olmadýðýnýn denetimi yapýlmaktadýr. Buna göre ele
alýnan ünsüz harf sert ünsüzlerden biriyse ve bir sonraki ünsüz harf de sert ünsüz harflerden veya
sert karþýlýðý bulunmayan yumuþak ünsüz harflerden biri deðilse sözcük Türkçe deðildir veya
yabancý kökenli bir sözcüktür. Ele alýnan ünsüz harf sert karþýlýðý bulunan yumuþak ünsüzlerden
biri ise ve bir sonraki ünsüz harf sert ünsüz ise sözcük Türkçe deðildir veya yabancý dillerden
dilimize girmiþ bir sözcüktür. Þekil-9.15 ünsüz uyumu için akýþ diyagramýný göstermektedir.
9.2.5.6 Sesbilim Açýsýndan Sözcük Denetimi
Ses bililimi açýsýndan Türkçe metin denetimi için yapýlmasý gereken denetimlerin dýþýnda kalan
denetimler sözcük denetleme bölümünde ele alýnmaktadýr. Bunlar ünsüz yumuþamasý ve ünlü
düþmesi durumlarý için yapýlan denetimlerden oluþur.
9.2 Yetkin Hata Bulma ve Düzeltme – 145
Sözcükteki hece
sayýsýný bul
Hata
Sözcük büyük ünlü
uyumuna uygun deðildir
Sözcük büyük ünlü
uyumuna uygundur
Sayaçlarý sýfýrla
Sözcükteki ilk harfi oku
Baþla
Hece
sayýsý =1 mi ?
Sözcük sonuna
gelindi mi ?
Ýnce ünlü
sayacý = 0 mý?
Sayaç deðeri
hece sayýsýndan farklý mý?
Kalýn ünlü
sayacý = 0 mý?
Okunan harf
ünlü harf mi ?
Ýnce ünlü mü ?
Ýnce ünlü sayacýný
bir artýr
Kalýn ünlü sayacýný
bir artýr
Sýradaki harfi oku
H
H
H
H
H
H
H
E
E
E
E E
E
E
SON
SON
Þekil-9.13 Büyük ünlü uyumu akýþ diyagramý
9.2.5.6.1 Ünsüz Yumuþamasý Denetimi
Bu bölümde yapýlan denetim ünlü ile baþlayan bir ek aldýðýnda ünsüz yumuþamasýna uðramasý
gereken bir sözcüðün bu deðiþime uðrayýp uðramadýðýnýn denetlenmesi þeklindedir. Daha önce
belirtildiði gibi sözlük içerisinde sözcükler etiketlendiði için bu denetimin yapýlmasýnda
sözlükte bulunan etiketlerden yararlanýlmaktadýr.
146 – Yazým Hatalarýný Düzeltme
Sözcüðü hecelere
ayýr
Sözcük küçük ünlü
uyumuna uymaktadýr
Sözcük küçük ünlü
uyumuna uymuyor
Ýlk hecedeki ünlü
harfi oku
Ýlk hecedeki ünlü
harfi oku
Sonraki hecedeki
ünlü harfi oku
Baþla
Hece
sayýsý =1 mi ?
Düz ünlü mü ?
Düz ünlü mü ?
Dar ünlü mü ?
Tüm heceler
okundu mu?
Geniþ ünlü mü ?
Düz ünlü mü?
Tüm heceler
okundu mu?
H
H
H
H
E
E
H
H
H
E
E
E
H
E
E
E
SON
SON
Þekil-9.14: Küçük ünlü uyumu akýþ diyagramý
• Ünsüz yumuþamasý denetimi için geliþtirilen algoritma þu þekilde çalýþmaktadýr:
• Girilen sözcüðün ilk olarak kökü bulunur ve bulunan kök sözlükte aranýr.
• Sözlükte bu kök sözcüðe ait etiketlenmiþ özel bir durum olup olmadýðýnýn denetimi
yapýlýr.
• Eðer sözcük için özel durum olarak yumuþama etiketi bulunmuyorsa bu sözcük için
ünsüz yumuþamasý durumu söz konusu deðildir. Aksi durumda ise sözcük ünsüz
yumuþamasýna uðrayan özelliðe sahip olduðundan dolayý sözcüðün almýþ olduðu eke
bakýlýr.
• Sözcük birden fazla ek almýþ olabilir ancak ünsüz yumuþamasý için bakýlmasý gereken
ek sözcüðün almýþ olduðu ilk ektir. Ýlk ek ünlü harf ile baþlayan bir ek deðilse
9.2 Yetkin Hata Bulma ve Düzeltme – 147
Sözcükteki ilk
ünsüz harfi oku
Sözcük ünsüz
uyumuna uymaktadýr
Sözcük ünsüz
uyumuna uymuyor
Sýradaki ünsüz
harfi oku
Sonraki ünsüz
harfi oku
Baþla
Sert ünsüz mü ?
Sert ünsüz mü ?
Sert karþýlýðý
bulunan yumuþak
ünsüz mü?
Sert karþýlýðý
bulunan yumuþak
ünsüz mü?
Sert karþýlýðý
bulnmayan yumuþak
ünsüz mü?
Sert karþýlýðý
bulnmayan yumuþak
ünsüz mü?
Tüm ünsüz harfler
okundu mu ?
Tüm ünsüz harfler
okundu mu ?
H
H
H
H
E
E
H
H
E
E
E
E
E
H
H
E
SON
Þekil-9.15: Ünsüz uyumu akýþ diyagramý
denetlenmesi gereken durum oluþmamýþ demektir. Ancak ilk ek ünlü harf ile baþlayan
bir ek ise bu durumda sözcüðün ünsüz yumuþamasý kurallarýna uygun bir þekilde
yumuþamaya uðrayýp uðramadýðýnýn denetimi yapýlýr.
• Bu denetim sonucuna göre eðer yumuþama Türkçe ses bilgisi kurallarýna uygun olarak
gerçekleþtirilmiþse hata durumu oluþmamýþtýr.
• Hata durumunun oluþtuðu durumda ise Türkçe ses bilgisi kurallarýna uygun olarak
ünsüz yumuþamasý iþlemi gerçekleþtirilir ve böylece yanlýþ yazýlmýþ olan sözcük
düzeltilmiþ olur.
Ünsüz yumuþamasý algoritmasýnýn iþleyiþi þu örnekle daha iyi açýklanabilir:
• Girilen sözcük “kitapýmdakiler” sözcüðü olmak üzere yukarýda anlatýlmýþ olan
iþlemler adým adým yürütülür. Öncelikle sözcüðün kökü olan “kitap” sözcüðü bulunur.
Bu kök sözlükte aranýr ve yumuþama etiketine sahip olduðu bulunur.
• Yumuþama özel durumuna sahip olduðundan dolayý sözcüðe eklenen ilk ekin ünlü
harf ile baþlayýp baþlamadýðý denetlenir. Bu ek (-ým) ünlü harf ile baþladýðýndan dolayý
sözcük sonundaki “p” harfinin Türkçe ses bilgisi kurallarý gereðince ünsüz
yumuþamasýna uðramasý gerekmektedir. Ancak girilen sözcüðün bu kurala uymadýðý
için sözcüðün yanlýþ yazýlmýþ olduðuna karar verilir ve sözcük sonundaki “p” harfinin
yerine “b” harfi getirilerek sözcüðün ünsüz yumuþamasý kuralýna uygun olarak doðru
yazýlmasý saðlanýr.
Þekil-9.16 ünsüz yumuþamasý denetimi için akýþ diyagramýný göstermektedir.
9.2.5.6.2 Ünlü Düþmesi Denetimi
Bu bölümde yapýlan denetim ünlü ile baþlayan bir ek aldýðýnda ünlü düþmesine uðramasý
gereken bir sözcüðün bu deðiþime uðrayýp uðramadýðýnýn denetlenmesi þeklindedir.
Türkçede ünlü düþmesi iki heceli sözcüklerde görülen bir ses deðiþimi olduðu için bu denetim
için gerçeklenen algoritmada ilk olarak sözcük içindeki hece sayýsý bulunur. Hece sayýsý iki ise
ilk ve ikinci hecelerin açýk veya kapalý hece olup olmadýðýnýn denetimi yapýlýr. Eðer ilk hece
açýk, ikince hece kapalý hece ise sözcükte ses düþmesi durumu olabilir. Türkçede ünlü düþmesi
ikinci hecesinde dar ünlü bulunan sözcüklerde olduðu için bundan sonraki aþamada ikinci
hecedeki ünlü harfin dar ünlü olup olmadýðýnýn denetimi yapýlýr. Eðer ikinci hecedeki ünlü harf
dar ünlü ise sözcük kökü alýnýr ve sözlükte ünlü düþmesi etiketine sahip olup olmadýðýnýn
denetimi yapýlýr. Bu denetimin yapýlmasýndaki amaç sözcüðün ünlü düþmesine kesin olarak
uðrayýp uðramayacaðýný belirleyebilmektir.
Bundan önceki adýmlarda yapýlan denetimler sözcüðün çok büyük bir oranla ünlü düþmesine
uðrayabileceðini gösterir ancak aykýrý durumlar söz konusu olduðundan dolayý kesin olarak
söyleyemez. Örneðin, “beniz” sözcüðü iki heceli ve ikinci hecesinde dar ünlü bulunduran bir
sözcüktür ve ünlü ile baþlayan bir ek aldýðýnda ikinci hecedeki ünlü harf düþer. Oysaki “deniz”
148 – Yazým Hatalarýný Düzeltme
sözcüðünde durum farklýdýr. Bu sözcük de iki heceli olmasýna ve ikinci hecesinde dar ünlü
barýndýrmasýna raðmen ünlü düþmesi kuralýndan etkilenmez. Dolayýsýyla bunun gibi aykýrý
durumlarda oluþabilecek sorunlarý ortadan kaldýrmak için sözcük kökünün sözlükteki etiketine
bakýlmasý yoluna baþvurulur. Sözlükte aranan kök sözcüðe ait ünlü düþmesi etiketi varsa
sözcüðün bu kurala uygun olarak yazýlýp yazýlmadýðý denetlenir. Kurala uygun olarak
yazýlmayan sözcüklerin ikinci hecesindeki ünlü harf silinir ve böylece yanlýþ yazýlmýþ olan
9.2 Yetkin Hata Bulma ve Düzeltme – 149
Sözcük kökünü bul
Kökü sözlükte ara
Sözcüðün aldýðý
ilk eki bul
Yumuþama kuralýna
göre sözcüðün yazýmýný
düzelt
Sözcük öner
Baþla
Kök sözlükte
var mý ?
Sözlüðün özel
durumu var mý?
Özel durum
yumuþama mý?
Ek ünlü harf
ile mi baþlýyor ?
Sözcük yumuþamaya
uðramýþ mý?
H
H
E
E
E
E
E
H
H
H
SON
Þekil-9.16: ünsüz yumuþamasý algoritmasý akýþ diyagramý
sözcük Türkçe ünlü düþmesi kuralýna uygun olarak düzeltilmiþ olur. Þekil-9.17 ünlü düþmesi
denetimine iliþkin akýþ diyagramýný göstermektedir.
9.2.6 Sözcük Önerme
Bu çalýþmada sözcük önerme iþlemi iki farklý durum için yapýlmaktadýr:
• Sözlükte bulunan sözcükler için önerme
• Sözlükte bulunamayan sözcükler için önerme
Þekil-9.18 sözcük önerme durumuna iliþkin genel akýþ diyagramýný göstermektedir.
150 – Yazým Hatalarýný Düzeltme
Sözcük kökünü bul
Kök sözcükteki hece
sayýsýný bul
Sözcüðün aldýðý
ilk eki bul
Sözcüðü ünlü
düþmesi kuralýna
göre düzenle
Baþla
Hece sayýsý = 2 mi?
Ýlk hece
açýk hece mi?
Ýkinci hece
kapalý hece mi ?
Ýkinci hecedeki
ünlü harf dar ünlü mü?
Kök sözcükte
özel durum var mý?
Özel durum
ses düþmesi mi?
Ek ünli harf ile
mi baþlýyor ?
Sözcükte ünlü
düþmesi olmuþ mu?
H E
E
E
E
E
E
E
E
H
H
H
H
H
H
H
SON
Þekil-9.17: Ünlü düþmesi algoritmasý akýþ diyagramý
9.2.6.1 Sözlükte Bulunan Sözcükler Ýçin Önerme
Sözlükte bulunan sözcükler için önerme iþlemi, Türkçeye yabancý dillerden girmiþ sözcükler
için gerçekleþtirilen bir iþlevdir. Bu sözcükler TDK güncel sözlüðü temel alýnarak oluþturulan
ve bu çalýþma kapsamýnda kullanýlan sözlük içerisinde bulunmaktadýr. Bu sözcüklerin Türkçede
karþýlýklarý bulunduðundan dolayý sözcük önerme iþlevi çalýþmaya katýlmýþtýr. Amaç dilimize
özellikle Batý dillerinden girmiþ olan sözcüklerin yerine var olan Türkçe karþýlýklarýnýn
kullanýlmasýný teþvik etmek ve bu sayede Türkçe karþýlýklarý bulunan yabancý sözcüklerin
özellikle gündelik hayatta kullanýmýnýn azaltýlarak dilimize yerleþmesinin önlenmesine
9.2 Yetkin Hata Bulma ve Düzeltme – 151
Sözcüðe Türkçe
denetimi uygula
Sözcük için öneri
yap
Sözcük yanlýþ yazýlmýþ
ya da yabancý sözcük
Türkçe karþýlýk
dosyasýnda sözcüðü ara
Türkçe karþýlýðýný
öner
Öneri yok Sözcüðü ünlü
düþmesi kuralýna
göre düzenle
Baþla
Sözcük denetimden
geçti mi?
Sözcük bulundu mu?
Sözcüðün Türkçe
karþýlýðý var mý?
H E
E
E H
H
SON
Þekil-9.18: Sözcük önerme algoritmasý akýþ diyagramý
yardýmcý olmaktýr. Bu amaçla oluþturulan “Türkçe Karþýlýk” sözlüðünde Türkçe karþýlýðý
bulunan sözcüklerin yanýna “-” iþareti konulduktan sonra var olan Türkçe karþýlýklarý
yazýlmýþtýr. Örneðin “agresif” sözcüðünün sözlükteki görünümü “agresif – saldýrgan”
þeklindedir.
Önerme iþleminin yapýlabilmesi için öncelikle girilen sözcüðün Türkçe olmadýðýnýn veya
Türkçeye yabancý dillerden girmiþ bir sözcük olduðunun saptanmasý gerekir. Bunun için de
Bölüm-9.2.5’te anlatýlan Türkçe denetimi yapýlýr. Sözcük bu kapsamdaki denetimlerden en az
birine uymuyorsa sözcük kökü Türkçe Karþýlýk sözlüðünde aranýr ve bulunduðunda “-”
iþaretinin yanýnda yazan sözcük okunur ve kullanýcýya öneri olarak sunulur. Aranan sözcük
bulunamazsa öneri yapýlmaz.
Önerme iþleminde amaç, ilk paragrafta da belirtildiði gibi Türkçeye baþka dillerden girmiþ olup
Türkçe karþýlýðý bulunan sözcükler için öneri yapmaktýr. Örneðin; “analiz” sözcüðü dilimize
Fransýzcadan girmiþ bir sözcüktür ve bu sözcüðün yerine “çözümleme” sözcüðü önerilebilir.
Ancak “kitap” sözcüðü için durum farklýdýr. Dilimize Arapçadan girmiþ olan bu sözcük Türkçe
denetimi esnasýnda ünlü uyumuna uygun olmadýðýndan dolayý Türkçe Karþýlýk sözlüðünde
aranýr; fakat bu sözcük dilimize yerleþmiþ bir sözcük olduðundan ve bu sözcüðün yerini tutan
baþka bir sözcük dilimizde bulunmadýðýndan dolayý “kitap” sözcüðü için öneri yapýlmaz.
Dolayýsýyla bu örneklerden de anlaþýlacaðý üzere Türkçe denetimini geçemeyen her sözcük için
öneri yapýlmasý söz konusu deðildir; sadece Türkçe karþýlýðý bulunanlar için öneri yapýlýr.
9.2.6.2 Sözlükte Bulunmayan Sözcükler Ýçin Önerme
Sözlükte bulunmayan sözcükler için önerme iþlemi kullanýcýnýn sözcüðü yanlýþ yazmýþ olma
olasýlýðý göz önüne alýnarak gerçekleþtirilmiþtir. Ancak sözcük doðru yazýlmýþ ise ve sözlükte
yer almýyor ise bu sözcüðün Türkçe bir sözcük olmadýðý anlamýna gelir. Bunun için ilk olarak
girilen sözcüðün Türkçe harfler dýþýnda bir harf içerip içermediði denetlenir. Örneðin “x ve w”
karakterlerini içeren sözcükler Türkçe olamayacaðý için bu sözcükler için öneri yapýlmaz ve
uyarý verilir. Bu karakterleri içermeyen ve sözlükte bulunmayan sözcükler için öneri yapýlýr.
Sözcük önermede kullanýlan kök bulma algoritmasý Bölüm-2.3’te anlatýlan kök bulma
algoritmasýna oldukça benzerdir. Bu kök bulma algoritmasýnda aðaç üzerinde ilerlerken
karþýlaþýlan tüm aday kökler toplanýr. Giriþ sözcüðü ile aðaç üzerinde ilerlerken oluþturulan kök
sözcükler arasýnda harf uyuþmamasý durumu yoktur. Ancak sözcük önerme amacýyla kullanýlan
kök bulma algoritmasýnýn temeli, girilen sözcük ile aðaç üzerinde ilerlerken oluþturulan sözcük
arasýndaki farklý harf sayýsýnýn en az olmasýna dayanýr. Dolayýsýyla burada hata mesafesinin
(farklý harf sayýsýnýn) tanýmlanan deðerden az olmasý durumunu saðlayan tüm aday kökler aðaç
üzerinde ilerlerken toplanýr. Örneðin hata mesafesi bir olacak þekilde tanýmlanmýþ ise girilen
sözcük ile aðaç üzerinde ilerlerken oluþturulan sözcük arasýndaki farklý harf sayýsý bir olan tüm
sözcükler aday olarak alýnýr ve kullanýcýya önerilir. Bunu gerçeklemek amacýyla kullanýlan
algoritma “Damerau-Levenshtein Edit Distance” algoritmasýdýr.
152 – Yazým Hatalarýný Düzeltme
Damerau-Levenshtein Edit Distance algoritmasý Damerau ve Levenshtein’in yazým hatalarý
üzerinde çalýþýrken oluþturduklarý bir algoritmadýr. Bu algoritmanýn yaygýn olarak kullanýldýðý
alanlar, yazým hatalarýnýn denetimi, konuþma tanýma ve DNA çözümlemesi alanlarýdýr.
Damerau-Levenshtein uzaklýðý algoritmasý bir katarý diðer bir katara çevirebilmek için gerekli
olan iþlem sayýsýný hesaplayan bir yöntemdir. Burada iþlemden kastedilen bir harf ekleme, bir
harf çýkarma, bir harfin yerine baþka bir harf koyma veya yan yana olan iki harfin sýrasýný
deðiþtirmektir. Bir katarý diðerine çevirebilmek için bu dört iþlem arasýnda çeþitli sayýda
çözümlemeler olabilir. En az sayýda iþlem yaparak oluþturulan çözüm iki sözcük arasýndaki
uzaklýðý verir [5]. Buradan hareketle x ve y karþýlaþtýrýlacak iki katar olmak üzere,
Damerau-Levenshtein uzaklýðý þu þekilde formülleþtirilebilir:
DLD(x,y) = min(i) (#E(i) + #Ç(i) + #S(i) + #T(i) )
Bu formülde #E(i) harf ekleme sayýsýný, #Ç(i) harf çýkarma sayýsýný, #S(i) bir harfin yerine
baþka bir harf koyma sayýsýný ve #T(i) yan yana olan iki harfin sýrasýný deðiþtirme sayýsýný
göstermektedir. Þekil-9.19’da Damerau-Levenshtein Edit Distance algoritmasýnýn sözde kod ile
gösterilimi görülmektedir. Burada “str1” ve “str2” aralarýndaki DLD uzaklýðý bulunacak
katarlarý ve “lenStr1” ve “lenStr2” bu katarlarýn uzunluklarýný göstermektedir.
DLD algoritmasýnýn kullanýmýný bir örnekle açýklamak yararlý olacaktýr.
str1 = “OT” ve str2 = “OST” olmak üzere bu iki katar arasýndaki DLD uzaklýðý;
9.2 Yetkin Hata Bulma ve Düzeltme – 153
Þekil-9.19: DLD algoritmasýnýn sözde kod ile gösterilimi
DLD (str1, str2) = 1’dir. Çünkü str1 katarýnýn str2 katarýna dönüþmesi için gereken iþlem bir
karakter çýkarma iþlemidir.
str1 = “OST” ve str2 = “TO” olmak üzere bu iki katar arasýndaki DLD uzaklýðý;
DLD (str1 , str2) = 3’tür. Çünkü str1 katarýndan str2 katarýný elde etmek için bir çýkarma iþlemi
yapýlmalýdýr ve buna ek olarak yan yana olan iki harfin sýrasý deðiþtirilmelidir. Örneklerden de
görüldüðü gibi katarlar arasýndaki farklýlýklar çoðaldýkça DLD uzaklýðý artar.
9.2.7 Baþarým
Bu çalýþmanýn baþarýmýný ölçmek amacýyla yapýlan sýnama iþleminde kaynak olarak E.
Adalý’nýn “Mikroiþlemciler Mikrobilgisayarlar” kitabý kullanýlmýþtýr. Sýnama verisi olarak bu
kaynaðýn kullanýlmasýnýn nedeni kaynaðýn Türkçe açýsýndan doðruluðuna güvenilebilir bir
kaynak olmasýdýr. Ayrýca kaynak Ýngilizce terimler de içermektedir ve bu da sýnama verisi
olarak yeðlenmesinin bir baþka nedenidir.
9.2.7.1 Sýnama Verisinin Hazýrlanmasý
Sistem, sýnama verisi olarak metin hâlindeki dosyalarý giriþ olarak kabul etmektedir. Bu nedenle
ilk olarak sýnama verisi olan kaynak “txt” uzantýlý dosya þekline dönüþtürülmüþtür. Bundan
sonraki aþama ise sýnama verisi üzerinde hatalar oluþturmaktýr. Oluþturulan hatalar;
• Kök sözcüðün yanlýþ yazýlmasý
• Eklerin kök sözcüðe yanlýþ ulanmasý
• Sözcüklerdeki Türkçe ses kurallarýna uygunluðun bozulmasý
þeklinde oluþturulmuþtur. Oluþturulan hatalara örnek olarak, “buyrukun”,
“gerekmektirmaktaydý”, “uclarýna”, “bilgsayarlarda” sözcükleri verilebilir.
Bu þekilde oluþturulan hatalarý içeren sýnama verisi sisteme girdi olarak verilmiþ ve sistemin
baþarýmý ölçülmüþtür.
9.2.7.2 Sýnama Sonuçlarý ve Sistemin Baþarýmý
Sýnama verisi üzerinde toplam 304 tane sözcükte hata oluþturulmuþtur. Oluþturulan hatalara
iliþkin sayýsal veriler Çizelge-9.1’de verilmiþtir. Tablodan da görüleceði gibi 304 sözcük
üzerinde oluþturulan hatalarýn 281 tanesi sistem tarafýndan algýlanmýþtýr. Sistem hatalý olduðunu
algýladýðý 281 sözcüðün 268 tanesi için öneri üretebilmiþtir. Sistemin üretmiþ olduðu 268
önerinin 253 tanesi gerçekte yazýlmak istenen sözcüðü de içermektedir.
154 – Yazým Hatalarýný Düzeltme
Çizelge-9.1 Yazýlým Sýnama Sonuçlarý
Oluþturulan
hata sayýsý
algýlanabilen
hata sayýsý
Öneri üretilen hatalý
sözcük sayýsý
Üretilen önerilerin
gerçek sözcüðü içeren
miktarý
Sözcük
sayýsý 304 281 268 253
Çizelgeden elde edilen verilerle sistemin hatalý sözcükleri bulmada %92, hatalý sözcükler için
öneri yapmada %95, yapýlan önerilerin gerçek sözcüðü içermesinde %94 baþarýma sahip olduðu
söylenebilir.
Sistem bilerek oluþturulan 304 hatanýn dýþýnda 309 sözcüðü daha hatalý olarak yorumlamýþtýr.
Bu 309 sözcükten 166’sý gerçekten yanlýþ yazýlmýþ sözcüklerdir. 107 tanesi Ýngilizce sözcüktür.
Kalan 36 sözcüðün 20 tanesi TDK sözlüðünde yer almamaktadýr (bipolar, osilatör, diyot vb). 16
sözcük ise sistemin biçim bilimsel çözümleme hatalarýndan kaynaklanarak bulmuþ olduðu
hatalý sözcükleri kapsamaktadýr.
KAYNAKLAR
[1] Adalý, E ve Büyükkuþçu, Ý., 2006. Heceleme Yöntemiyle Kök Sözcük Üretme,
Türkiye Biliþim Vakfý Bilgisayar Bilimleri ve Mühendisliði Dergisi, 02, 25-29.
[2] Dembitz, S., Knezevich, P. and Sokele, M., 2004. Developing A Spell Checker As
An Expert System, Journal Of Computing And Information Technology, 04, 285-291.
[3] Dembitz, S., Knezevich, P. and Sokele, M., 1998. Hascheck – the Croatian Academic
Spelling Checker, In Proceedings of 18th Annual International Conference of The British
Computer Society Specialist Group on Expert System, Cambridge, UK, December 1998, p.
184-198.
[4] Dhanabalan, T., Parthasarathi, R and Geetha, T. V., 2003. Tamil Spell Checker,
Tamil Internet 2003, Chennai, Tamilnadu, India.
[5] Gregory, V. B., 2007. Spelling-Error Tolerant, Order-Independent Pass-Phrases via
The Damerau-Levenshtein String-Edit Distance, 2007 Australasian Information Security
Workshop Privacy Enhancing Technologies, Ballarat, Australia.
[6] Güzey, C. ve Oflazer, K., 1994. Spelling Correction in Agglutinative Languages,
Bilkent University Department Of Computer Engineering and Information Systems Technical
Report, BU-CEIS-94-01, Ankara, Turkey.
[7] Oflazer, K. ve Solak, A., 1992. Parsing Agglutinative Word Structures And Its
Application to Spelling Checking for Turkish, In Proceedings of the 15thInternational
Conference On Computational Linguistics, Nantes, France, August 23-28, p. 39-45.
9.2 Yetkin Hata Bulma ve Düzeltme – 155
[8] Oflazer, K., 1993. Two-level Description Of Turkish Morphology, In Proceedings of
the Sixth Conference Of The Europen Chapter Of The Assotiation For Computational
Linguistics, Utrecht, Netherlands, April 1993.
[9] Solak, A., 1991. Design And Implementation of A Spelling Checker For Turkish, M.S.
Thesis, Bilkent University, Ankara.
156 – Yazým Hatalarýný Düzeltme
10
Bul ve Deðiþtir
Bul ve deðiþtir iþlevleri çoðunlukla birlikte kullanýlan iþlevlerdir. Bul
iþlevi sadece aranan metin içindeki bir sözcük veya harf dizisini bulma
amaçlý tek baþýna kullanýlabilirken deðiþtir iþlevi bulunan sözcüðün
yerine baþka sözcüðü yerleþtirir.
Günümüzde yaygýn olarak kullanýlan yazým programlarý içinde bulunan
“Bul ve Deðiþtir” iþlevleri genellikle bükümlü diller için geliþtirilmiþ
olduðundan Türkçe gibi bitiþken diller için yeterli deðildir. Ek zengini
olan Türkçede bul ve deðiþtir dediðimiz, aslýnda sözcüðün kökü ve
ekleridir. Ekler, Türkçenin dil bilgisi kurallarýna göre þekillendiðinden
deðiþtirme iþlemi yaparken eklerin yeni köke uygun olarak
biçimlenmesi gerekir. Bu kurallarýn en önde gelenleri büyük ve küçük
ünlü uyumlarýdýr.
Bul ve deðiþtir iþlevi sýrasýnda karþýlaþýlan bir baþka sorun sözcük
sonundaki ünsüzlerin deðiþmesidir. Özellikle Arapçadan dilimize
girmiþ olan sözcüklerde bu sorunla karþýlaþýlýr. Örneðin; ilkel bul ve
deðiþtir programlarý kullanýldýðýnda, metin içerisinde “kitap” sözcüðü
aranýp yerine “defter” sözcüðü konulmak istendiðinde, metindeki
“kitaplarýmýzdan” sözcüðü “defterlarýmýzdan” hâlini
alacaktýr. Oysaki defter sözcüðü kurallý bir sözcükken
“defterlarýmýzdan” sözcüðü ne anlamca ne yapýca doðru bir
sözcük deðildir. Bu ve bunun gibi dilin kurallarýna aykýrý sorunlarý
çözebilmek için Türkçe için özel bir bul ve deðiþtir iþlevine gereksinim
duyulmaktadýr. Kurallara göre “kitap”- “defter” deðiþikliði
“kitaplarýmýzdan” yerine “defterlerimizden” seklinde
olmalýdýr. Türkçe bul ve deðiþtir iþlevi için karþýlaþýlan sorunlar aþaðýda
açýklanmýþtýr.
– 157
10.1 Türkçe için Bul Ýþlevinde Karþýlaþýlan Sorunlar
Türkçenin ses özellikleri nedeniyle bazý sözcükler aldýklarý eklere göre deðiþikliðe uðrar:
• Sonu “p, ç, t, k” sert süreksiz ünsüzleri ile biten sözcükler ünlü bir harf ile baþlayan ek
aldýklarýnda “b, c, d, g” ve “ð” harflerine dönüþürler. “kitap” sözcüðü “-ým” 1. kiþi
iyelik eki aldýðýnda “kitabým” hâlini alýr. Bul ve deðiþtir iþlevi bul aþamasýnda
“kitap” sözcüðünü aradýðýndan “kitabým” sözcüðünün içindeki ayný anlama sahip
kýsmý bulamamaktadýr. Bu gibi durumlardan kurtulabilmek için “kitap” sözcüðü
aranýrken “kitab”, “aðaç” sözcüðü aranýrken “aðac”, “kepenk” sözcüðü
aranýrken “kepeng” sözcüðünün de aranmasý saðlanmalýdýr.
• Bazý Türkçe sözcükler ek aldýklarýnda ünlü düþmesine uðrarlar. Bu tür sözcükler için
“oðul”, “gönül”, “burun”, “asýr” sözcükleri örnek verilebilir. Bu sözcükler ünlü
ile baþlayan ekler aldýklarýnda “oðul”+”um”à “oðluma”, “gönül”+”ümden”à
“gönlümden”, “burun”+”um”à“burnum”, “asýr”+”a”à“asra” hallerini
almaktadýr. Dolayýsýyla bu sözcüklerin ek almadan önceki hâlleri arandýðýnda
deðiþikliðe uðramýþ hâlleri bulunamaz. Deðiþmiþ hâlleri de arama aþamasýnda göz
önüne alýnmalýdýr. Yani “oðul” ve “oðl”, “gönül” ve “gönl”, “burun” ve
“burn”, “asýr” ve “asr” ikilileri aramaya dâhil edilmelidir.
Bazý eylem köklü sözcüklere “yor” eki eklendiðinde eylem soylu sözcükte deðiþimler olur.
“anla” eylem soylu sözcüðüne “yor” eki eklendiðinde “anla+yor” yerine “anlýyor”
hâline dönüþ olur. Bir sözcükte düz – geniþ ünlülerden (a, e) sonra “yor” eki gelirse, bu ünlüler
darlaþarak (ý, i, u, ü) ünlülerine dönüþür. Bu olaya ünlü daralmasý denir. Bulunmak istenen
sözcüðün “anla” olmasý durumunda “anlýyor” sözcüðü yakalanamayýp yanlýþ sonuca neden
olunur. Aramaya bu durum eklenmelidir.
10.2 Türkçe için Deðiþtir Ýþlevinde Karþýlaþýlan Sorunlar
Deðiþtir iþlevinde Türkçenin sondan eklemeli bir dil olmasýndan kaynaklanan bazý bazý
sorunlarla karþýlaþýlmaktadýr.
• Sözcük köklerinin aldýðý ekler kökün sahip olduðu bazý ses özelliklerine göre
deðiþiklik göstermektedir.
Örneðin :
“kedi” sözcüðüne çoðul anlam katmak için “-ler” eki kullanýlýrken ; “tavþan”
sözcüðüne “-lar” eki kullanýlýr.
“kedi” sözcüðüne 1. tekil iyelik anlamý katmak için “-m” eki kullanýlýrken ;
“tavþan” sözcüðüne “-ým” eki kullanýlýr.
Bu eklerin deðiþimi eklendikleri sözcüðün son harfinin ünlü – ünsüz oluþuna,
sözcüðün son ünlü harfinin kalýn – ince oluþuna göre düzenlenir. “kedi” sözcüðü son
158 – Bul ve Deðiþtir
harfinin ünlü olmasý ve son ünlüsünün ince olmasý nedeniyle 1. tekil iyelik ekini “m”
olarak , “tavþan” sözcüðü son harfinin ünsüz olmasý ve son ünlüsünün kalýn olmasý
nedeniyle 1. tekil iyelik ekini “ým” olarak alýr.
Bu deðiþiklikler göz ardý edildiðinde ilkel Bul ve Deðiþtir iþlevi aþaðýdaki gibi yanlýþ
sonuçlar vermektedir.
“Ahmet bugün yeni kedisini parkta kedilerle oynamaya götürdü.”
“Ahmet bugün yeni tavþansini parkta tavþanlerle oynamaya götürdü.”
Bu deðiþiklikler göz önüne alýnýp bir çözümleme yapýldýðýnda Bul ve Deðiþtir iþlevi
aþaðýdaki gibi doðru sonuçlanmaktadýr.
“Ahmet bugün yeni tavþanýný parkta tavþanlarla oynamaya götürdü.”
• Bul iþlevinde de deðindiðimiz p,ç,t,k sert süreksiz ünsüzler ile biten sözcükler Deðiþtir
iþlevinde de sorunlara neden olmaktadýr. Özellikle sözcük ünlü ile baþlayan bir ek de
almýþ ise sorunla karþýlaþýlmaktadýr. Örneðin; “defterimden” sözcüðünde
“defter” sözcüðü yerine “kitap” konulmasý gerektiðinde “kitap-imden”
çözümlemesi yanlýþtýr. Ünlü harflerin kalýn olmasý göz önüne alýndýðýnda
“kitap-ýmdan” çözümlemesi yapýlmaktadýr, fakat “kitap” sözcüðünün son harfinin
“p,ç,t,k” sert süreksiz ünsüzlerinden biri olmasý sebebiyle sadece ince – kalýn ünlü
kontrolü yeterli olamamaktadýr. Ünlü ile baþlayan ek almasý göz önüne alýnarak
“kitap-ýmdan” yerine “kitab-ýmdan” çözümlemesi yapýldýðýnda doðru sonuç
alýnabilmektedir.
• Bul iþlevinde üzerinde durmuþ olduðumuz ünlü daralmasý konusu ayný zamanda
Deðiþtir iþlevinde de sorunlara sebep olmaktadýr. “geliyoruz” sözcüðünde “gel”
sözcüðünün yerine “anla” sözcüðü konulmak istendiðinde “anla+yoruz” yerine
“anlý+yoruz” çözümlemesi doðru sonucu vermektedir. Ünlü daralmasý yaþayacak
sözcükler için özel bir çözüm yapýlandýrýlmasý doðru olacaktýr.
• p, ç, t, k, f, h, s, þ” sert ünsüzlerinden sonra “c, d, g” ünsüzleri ile baþlayan ek
geldiðinde, eklerin ilk harflerinde “càç”, “dàt”, “gàk” deðiþiklikleri olur. Deðiþtir
iþlevi “dönerci” sözcüðünde “döner” sözcüðünü bulup yerine “kebap” konulmasý
iþlemini yapmaya kalktýðýnda “kebap+ci” çözümlemesi yanlýþ olacaktýr. “kebap”
sözcüðünün son harfi “p, ç, t, k, f, h, s, þ” sert ünsüzlerinden biri olmasý sebebiyle “c”
ile baþlayan ekin ilk harfi “ç” olacaktýr. Bu durumda “kebapçý” doðru çözümlemesi
yapýlabilmiþ olacaktýr.
10.2 Türkçe için Deðiþtir Ýþlevinde Karþýlaþýlan Sorunlar – 159
10.3 Yakýn Çalýþmalar
Türkçe dýþýndaki bazý dillerde Bul ve Deðiþtir iþlevi doðru sonuç verebilmektedir. Örneðin;
Ýngilizce için sayýsý beþi aþmayan bazý özel durumlar dýþýnda Bul ve Deðiþtir iþlevi doðru olarak
yapýlabilmektedir.
Orhan Bilgin, Özlem Çetinoðlu ve Kemal Oflazer tarafýndan Türkçe için hazýrlanmýþ ancak
yayýmlanmamýþ olan “Efficient Find and Replace in Agglutinative Languages: The Case of
Turkish” çalýþmasý yakýn bir çalýþma olarak bilinmektedir. Bu çalýþma bulunacak olan sözcüðü
biçim bilimsel çözümleyicide iþleyerek, elde edilecek sonucu kullanarak yerine konulacak
sözcüðü yapýlandýrmayý hedeflemektedir. Bu çalýþmada “dolabýný” sözcüðündeki “dolap”
yerine “masa” sözcüðü konulmak istendiðinde ilk olarak “dolabýný” sözcüðü biçim bilimsel
çözümleyicide çözümlenmektedir. biçim bilimsel çözümleyici þöyle iki sonuç üretmektedir:
“dolap+Noun+A3sg+P2sg+Acc” ve “dolap+Noun+A3sg+P3sg+Acc” . Her iki
çözümden elde edilen ekler “masa” sözcüðüne eklenerek “masa+Noun+A3sg+P2sg+Acc”
à “masaný” ve “masa+Noun+A3sg+P3sg+Acc” à”masasýný” gibi iki ayrý sonuç
bulunur. Böylece Bul ve Deðiþtir iþlevi gerçekleþtirilebileceði önerilmiþtir. Þekil-10.1’de
“akýllýlýk” sözcüðü yerine “zekâ” sözcüðünün konulmasý ve geçilen aþamalar
gösterilmiþtir. [4]
10.4 Yetkin Bul ve Deðiþtir
Türkçe için gerekli olan Bul ve Deðiþtir çalýþmalarýndan biri F. Þentürk ve E. Adalý tarafýndan
gerçekleþtirilmiþtir. Bu çalýþmanýn amacý “Türkçe Bul ve Deðiþtir” iþlevinin baþarýmýný en üst
düzeye çýkarabilecek bir yöntem geliþtirmektir. Bu amaçla;
• Verilen ölçütler doðrultusunda arama yapýlarak bul iþlevinin yapýlmasý,
• Bul iþlevinin sonuç olarak verdiði verilerin kullanýlmasýyla bulunan sözcüðün yerine
konulacak sözcüðün yapýlandýrýlmasý,
• Baþarýlý bir þekilde bul ve deðiþtir iþlevinin yapýlmasý için çözüm bulunmaya
160 – Bul ve Deðiþtir
Biçimbilimsel
çözümleyici
Biçimbilimsel
üretici
Biçimsel sözdizim
eþleþtirici
akýllýlýktan
zekadan
akýllýlýk + Dan (Abl)
zeka + Dan (Abl)
Þekil-10.1: “akýllýlýk” sözcüðünün “zeka” sözcüðü ile deðiþtirilmesinin aþamalarý
çalýþýlmýþtýr.
Bu amaçlar doðrultusunda bul ve deðiþtir iþlevi sýrasýnda karþýlaþýlmasý olasý sorunlar için
çözümler bulunmuþtur. Türkçe sözcükler için oluþturulan ayrý sonlu durum makinelerinin
birlikte çalýþarak hem eylem hem de ad soylu sözcükler için sonuca varabilmesi saðlanmýþtýr.
Bilindiði gibi yapým eki içeren sözcüklerde deðiþtirme iþlemi yanlýþ sonuçlar üretmektedir. Bu
nedenle sonlu durum makinelerinde bazý yapým eklerine yer verilmemiþtir. Bu eklerle kurulmuþ
tüm sözcükler için biçim bilimsel çözüm bulunmuþtur. Bu çözümlerin sonuçlarýndan
yararlanarak bul ve deðiþtir iþlevi gerçekleþtirilmiþtir. Bulunan sözcüðün ardýndaki ekler, eylem
ve ad soylu sözcüklerin alabileceði ek kurallarýna göre çözümlenmiþtir.
Türkçenin bitiþken bir dil olmasý nedeniyle bul ve deðiþtir iþlemi Türkçenin biçim bilimsel
özellikleri göz önüne alýnarak gerçekleþtirilmiþtir. Bu nedenle, çalýþma kapsamýnda tüm çekim
eklerinin ve bazý yapým eklerinin de aralarýnda bulunduðu bir ek kümesi için sonlu durum
makineleri oluþturulmuþ ve bu sonlu durum makineleri kullanýlarak deðiþtir iþlevinin doðru
çalýþabilmesi için zemin hazýrlanmýþtýr.
Ad soylu sözcüklerin çekim ekleri ve ek eylem ekleri, eylem soylu sözcüklerin çekim ve zaman
ekleri ve bunlara bazý yapým ekleri de eklenerek tüm sözcükler için sonlu durum makineleri
oluþturulmuþtur. Tüm bu sonlu durum makinelerinin sanki tek bir parça gibi hareket edebilmesi
için çözüm bulunmuþtur. Ýncelenen ek sayýsý toplamý 115’tir. Bu eklerin hangi tür sözcükler ile
nasýl hareket ettikleri aþaðýda açýklanmýþtýr.
10.4.1 Ad Çekim Ekleri
Ad çekim ekleri ad soylu sözcüklere eklenerek onlara tümcede görev ve anlam kazandýran
eklerdir. Çoðul, iyelik, ilgi ve durum ekleri ad çekim eki olarak bilinir.
Örneðin:
“çocuklarýnki” sözcüðünde “çocuk” sözcüðü sýrasýyla “lar” çoðul, “ýn” iyelik ve “ki”
ilgi eki almýþtýr. Þekil-10.2’de Ad çekim eklerinin ad köküne nasýl eklendiklerinin kurallarý
görülmektedir. Bu þekle baðlý kalarak ad çekim ekleri için sonlu durum makinesi tasarlanmýþtýr.
Çalýþma kapsamýnda ad köküne eklenen ekler soldan saða doðru olmak üzere incelenmiþtir.
Bu sonlu durum makinesinde herhangi ad soylu bir sözcüðü kök ve eklerine ayýrabilmemiz
mümkündür. Ad soylu sözcüklere eklenen ve ad çekim eki olarak tanýmlanan 19 ek ve 6 yapým
eki için Þekil-3`teki sonlu durum makinesi çözüm saðlamaktadýr. Bu þekli daha matematiksel
bir hâle dönüþtürerek bilgisayar sistemlerinin anlayabileceði bir þekle getirilmesi
gerekmektedir. Bunun için öncelikle bu 19 ad çekim ekinin numaralandýrmasý ve ona göre
þeklin yeniden yorumlanmasý saðlanmýþtýr. “0” numaralý geçiþler boþ geçiþleri ifade etmektedir.
Þekil-10.3`te, Çizelge-10.1`deki ek katarlarýnýn yerine ek numaralarýnýn geliþi gösterilmiþtir
(Yapým ekleri katar hâlinde gösterilmiþtir).
10.4 Yetkin Bul ve Deðiþtir – 161
Çizelge-10.1: Ad Çekim Eklerinin Numaralandýrýlmasý [2]
Ek No: Ek Açýklama Örnek
1 –lAr Çoðul kedi-ler
2 –(H)m 1. tekil kiþi iyelik kedi-m
3 –(H)mHz 1. çoðul kiþi iyelik kedi-miz
4 –(H)n 2. tekil kiþi iyelik kedi-n
5 –(H)nHz 2. çoðul kiþi iyelik kedi-niz
6 –(s)H 3. tekil kiþi iyelik kedi-si
7 –lArI 1. çoðul kiþi iyelik kedi-leri
8 –(y)H -i hali kedi-yi
9 –nH -i hali (3.t.k. iyelikten sonra) kedi-ni
162 – Bul ve Deðiþtir
Ad kökü Eylem kökü
Eylem kökü
Çoðul
Ýyelik Ýyelik (3)
Durum 1
Durum 2
ilgi
-lAS,-lA,lAn
-lArI
-lAr
-ki
-DA,(n)Hn
-NA,-nDA,-nDAn
-(n)Hn,-(y)lA,0
-nDA,(n)Hn
-nDA,(n)Hn
-nA,-nDA,-nDAn,
-(n)Hn,-(y)lA,0
-(y)A,-DA,-DAn,
-(n)Hn,-(y)lA,0
-nH,-(n)cA
0
0
-n(y)H,-(n)cA
-(H)m,-(H)n,-(H)mHz,-(H)nHz,0 -(s)H
-lH,-sHz -lAr,0
-lHK,-cH,cHk
-lH,-sHz 1
2
3 4
5
6
7
Çýkýþ
Çýkýþ
Çýkýþ
Þekil-10.2 : Ad çekim ekleri soldan saða sonlu durum makinesi [2][4]
10 –(n)Hn Tamlama kedi-nin
11 –(y)A -e hali kedi-ye
12 –nA -e hali (3.t.k. iyelikten sonra) kedi-ne
13 –DA -de hali kedi-de
14 –nDA -de hali (3.t.k. iyelikten sonra) kedi-nde
15 –Dan -den hali kedi-den
16 –nDAn -den hali (3.t.k. iyelikten sonra) kedi-nden
17 –(y)lA birliktelik kedi-yle
18 –ki Ýlgi kedi-de-ki
19 –(n)cA Görelik kedi-ce
10.4 Yetkin Bul ve Deðiþtir – 163
Çoðul
Ýyelik (3)
Ad Kökü
Ýyelik
Durum 1
Ýlgi
Durum 2
Eylem kökü Ek eylem
0,10,12
14,16,17
0,7
0,1
6
1
-lAS
-lA
-lAn 9,19
8,19
0,2,3,4,5
0
0
0,10,11
13,15,17
0,10,12
14,15,17 10,13
10,14 18
-lH,-sHz
-lHk,-cH,-cHk
2
3
1
4
5
7
8
6
Çýkýþ
Þekil-10.3: Numaralandýrýlmýþ ad çekim ekleri soldan saða sonlu durum makinesi [2][4]
10.4.2 Ek Eylem Ekleri
Týpký eylemlerde olduðu gibi adlara da ek eylem ekleri ile zaman ve kiþi anlamlarý
yüklenebilmektedir. Bu nedenle bu eklerin de incelenmesine gerek duyulmuþtur. Ek eylem
eklerinin ad soylu sözcüklere eklenme kurallarý Þekil-10.4`te gösterilmiþtir.
Ad çekim eklerinde yapýldýðý gibi ek eylem ekleri için numaralandýrýlmýþ sonlu durum makinesi
Çizelge-10. 2`deki ek numaralarý yardýmýyla Þekil-10.5`te oluþturulmuþtur.
164 – Bul ve Deðiþtir
Ek eylem 1
Durum 1
0
-(y)DH,(y)sA
-Hm,-sHn,0
-Hz,sHnHz,-lAr
-lAr,0
-DHz,0 -cAsInA
-m,-n,0
-k,nHz,-lAr
-(y)mHþ -(Y)Hm
-sHn,0
-yHz
þHnHz
lAr
-DHr -(y)ken
8 9
5
10
11
Çýkýþ Çýkýþ Çýkýþ Çýkýþ Çýkýþ Çýkýþ
Ek eylem 2
Ek eylem 2
kiþi
Ek eylem 3
Þekil-10.4: Ek Eylem Ekleri soldan saða sonlu durum makinesi [2][4]
0,1,2,3,4,5
12,13 0,5,6,7,8,9
0,10,11
0,5
14
10
0,1,2,3,4,5,15
5 9 10
8
11
Çýkýþ
Þekil-10.5: Numaralandýrýlmýþ Ek Eylem Ekleri soldan saða sonlu durum makinesi
Çizelge-10.2: Ek Eylem Eklerinin Numaralandýrýlmasý [2]
Ek No: Ek Açýklama Örnek
1 –(y)Hm 1. tekil kiþi evde-yim
2 –sHn 2. tekil kiþi evde-sin
3 –(y)Hz 1. çoðul kiþi evde-yiz
4 –sHnHz 2. çoðul kiþi evde-siniz
5 –lAr 3. çoðul kiþi evde-ler
6 –m 1. tekil kiþi ((y)DH ve (y)sA eklerinden sonra ) evdeyse-m
7 –n 2. tekil kiþi ((y)DH ve (y)sA eklerinden sonra ) evdeyse-n
8 –k 1. çoðul kiþi ((y)DH ve (y)sA eklerinden sonra ) evdeyse-k
9 –nHz 2. çoðul kiþi ((y)DH ve (y)sA eklerinden sonra ) evdeyse-niz
10 –DHr çevrik kip evde-dir
11 –cAsInA tarz zarfý ev-cesine
12 –(y)DH di’li geçmiþ zaman evde-ydi
13 –(y)sA dilek-þart kipi evde-yse
14 –(y)mHþ miþ’li geçmiþ zaman evde-ymiþ
15 –(y)ken zaman zarfý evde-yken
10.4.3 Eylem Zaman Ekleri
Eylem soylu sözcüklere zaman ve kiþi anlamlarý katan eklere eylem zaman ekleri denir.
Þekil-10.6`da eylem zaman eklerinin eylem soylu bir sözcüðe hangi kurallara göre
eklenebileceði görülmektedir.
Çizelge-10. 3`teki eklerin numaralarý yardýmýyla eylem zaman ekleri için de týpký önceki 2 ek
grubunda yapýldýðý gibi oluþturulmuþ numaralandýrýlmýþ solda saða sonlu durum makinesi
Þekil-10.7`de görülmektedir.
10.4 Yetkin Bul ve Deðiþtir – 165
Çizelge-3 Eylem Zaman Eklerinin numaralandýrýlmasý [2]
Ek No: Ek Açýklama Örnek
1 –(y)Hm 1. tekil kiþi gel-iyor-um
2 –sHn 2. tekil kiþi gel-iyor-sun
3 –(y)Hz 1. çoðul kiþi gel-iyor-uz
4 –sHnHz 2. çoðul kiþi gel-iyor-sunuz
5 –lAr 3. çoðul kiþi gel-iyor-lar
6 –mHþ miþ’li geçmiþ zaman gel-miþ
7 –(y)AcAk gelecek zaman gel-ecek
8 –(H)r geniþ zaman gel-ir
9 –Ar geniþ zaman gid-er
10 –(H)yor þimdiki zaman gel-iyor
11 –mAktA sürerlilik gel-mekte
12 –mAlI gereklilik gel-meli
13 –m 1. tekil kiþi gel-di-m
14 –n 2. tekil kiþi gel-di-n
15 –k 1. çoðul kiþi gel-di-k
16 –nHz 2. çoðul kiþi gel- di-niz
17 –DH di’li geçmiþ zaman gel-di
18 –sA dilek-þart kipi gel-se
19 –lIm 1. çoðul kiþi gel-e-lim
20 –(y)A istek kipi gel-e
21 –(y)HnHz 2. çoðul kiþi gel-iniz
22 –(y)Hn 2. tekil kiþi gel-in
23 –sHnlAr 3. çoðul kiþi gel-sinler
24 –DHr çevrik kip gel-miþ-ler-dir
25 –(y)DH hikaye bileþik zaman gel-miþ-ti
26 –(y)sA þart bileþik zaman gel-miþ-se
27 –(y)mHþ rivayet bileþik zaman gel-meli-ymiþ
28 –cAsInA tarz zarfý gel-miþ-cesine
29 –(y)ken zaman zarfý gel-miþ-ken
166 – Bul ve Deðiþtir
10.4.4 Eylem Çekim Ekleri
Eylem zaman ekleri bölümünde eylem soylu sözcüklere eklenen kiþi ve zaman ekleri
açýklanmýþtýr. Bu eklerin dýþýnda da eylem soylu sözcüklere eklenen çekim ekleri vardýr. Bu
bölümde eylem çekim ekleri olarak adlandýrdýðýmýz ekler tanýtýlacaktýr.
Þekil-8`de eylem çekim eklerinin eylem soylu bir sözcüðe hangi kurallara göre eklenebileceði
görülmektedir.
Çizelge-4’te eylem çekim eklerinin numaralanmýþ hâli verilmiþtir.
10.4 Yetkin Bul ve Deðiþtir – 167
Zaman tip II Zaman tip III Zaman tip IV
Olumsuz Eylem kökü
Bileþik z. I
Zarf
Bileþik z. II Bileþik z. III
Kiþi I Kiþi II
Zaman tip I
0
-mIþ,-(y)acak
-(H)r,-Ar,(H)yor
-mAktA,-mAlI
-M,-n,0,-k
-nHz,lAr
0,sHn,-(y)HnHz
-(y)Hn,-sHnlAr
-(y)Hm,-sHn,0
-lIm,-sHnHz,lAr
-(y)Hm,-sHn,0
-yHz,-sHnHz,lAr
-DHr,0
-(y)DH
-(y)sA
-(y)mHþ
-cAsInA
-m,-n,0,k
-nHz,-lAr
-(y)Hm,-Hn,0
-yHz,-sHnHz,lAr
-lAr -lAr,0
-(y)DH
-(y)sA
-(y)mHþ
-cAsInA,0
-cAsInA
-(y)ken
-(y)A -DH,-sA
2 3 4
1
8
11
9 10
6 7
5
Çýkýþ
Çýkýþ Çýkýþ Çýkýþ
Çýkýþ Çýkýþ
Çýkýþ Çýkýþ
Þekil-10.6: Eylem zaman ekleri soldan saða sonlu durum makinesi [2][4]
Çizelge-4: Eylem Çekim Eklerinin numaralandýrýlmasý [2]
Ek No: Ek Açýklama Örnek
1 –m 1. tekil kiþi gel-me-m
2 –zsIn 2. tekil kiþi gel-me-zsin
3 –z 3. tekil kiþi gel-me-z
4 –yIz 1. çoðul kiþi gel-me-yiz
5 –zsInIz 2. çoðul kiþi gel-me-zsiniz
6 –zlAr 3. çoðul kiþi gel-me-zler
7 –mA Olumsuzluk gel-me
8 –(y)AmA Olumsuzluk gel-eme
9 –(y)Adur sürerlik bileþik eylem kipi gel-edur
10 –(y)Hver tezlik bileþik eylem kipi gel-iver
11 –(y)Agel sürerlik bileþik eylem kipi ol-agel
12 –(y)Agör sürerlik bileþik eylem kipi gel-egör
13 –(y)Abil yeterlik bileþik eylem kipi gel-ebil
14 –(y)Ayaz yaklaþma bileþik eylem kipi gel-eyaz
168 – Bul ve Deðiþtir
6,7,8,9
10,11,12
17,18
20
27
27
27
27
27
25,26
25,26
25,26
0,5
28,29
0,24
0,28
5
0,1,2,3,4,5
25,26
0
0,1,2,3,4,5,19
0,5,13,14,15,16
0,2,21,22,23
2
3 9
4 10
5
1
7
8
6
Olumsuz Çýkýþ
11
Þekil-10.7: Numaralandýrýlmýþ eylem zaman ekleri soldan saða SDM
15 –(y)Akal sürerlik bileþik eylem kipi don-akal
16 –(y)Akoy sürerlik bileþik eylem kipi al-ýkoy
17 –mAk Mastar gel-mek
18 –(y)HcH görev eki gör-ücü
19 –(y)Hp zarf eki gel-ip
20 –(y)AlI zarf eki gel-eli
21 –DHkçA zarf eki gel-dikçe
22 –(y)ArAk zarf eki gel-erek
23 –(y)HncA zarf eki gel-ince
24 –DAn zarf eki gör-erek-ten
25 –yA zarf eki gel-ince-ye
26 –(y)An sýfat fiil gel-en
27 –(y)AcAk fiilden isim yapma eki gel-ecek
28 –(y)AsI sýfat fiil gel-esi
29 –DHk sýfat fiil görül-dük
30 –mHþ sýfat fiil gel-miþ
31 –mAzlIk fiilden isim yapma eki gel-mezlik
32 –mA mastar eki gel-me
33 –(y)Hþ fiilden isim yapma eki gel-iþ
34 –DAn -den hali gel-me-den
35 –DA -de hali gel-me-de
36 –(y)lA Birliktelik gel-me-yle
37 –(y)A -e hali gel-me-ye
38 –mAksIzIn zarf eki gel-meksizin
39 –mAdAn zarf eki gel-meden
40 –(H)n Edilgen dönüþlü gör-ün
41 –(H)þ Ýþteþ gör-üþ
42 –(H)l Edilgen dönüþlü gör-ül
43 –DHr Oldurgan ol-dur
44 -(H)t Ettirgen oku-t
Çizelge-10.4`teki eklerin numaralarý yardýmýyla eylem çekim ekleri için de týpký önceki 3 ek
grubunda yapýldýðý gibi oluþturulmuþ numaralandýrýlmýþ solda saða sonlu durum makinesi
Þekil-10.9`da görülmektedir.
10.4 Yetkin Bul ve Deðiþtir – 169
170 – Bul ve Deðiþtir
Eylem kökü
Edilgen/
dönüþlü I
Edilgen/
dönüþlü II
Edilgen/
dönüþlü III
Olumsuzluk
Olumsuzluk I Olumsuzluk II
Ýþteþ
Mastar Ýsim kökü
Zarf I Zarf II Ek Eylem
Karmaþýk
eylem I
Karmaþýk
eylem II
Ettirgen/
oldurgan
Ettirgen/
oldurgan
1
2
5
8
3
6
11
12
14 13
10
4
7
9
Çýkýþ Çýkýþ
Çýkýþ
-(H)n,0
-(H)n,0
-mA
-mAk
-(y)Adur
-(y)Hver
-(y)Agel
-(y)Agör
-(y)Abil,0
-(y)Hp
-(y)AlI
-(y)ArAk -DHkçA
-DAn,0 -yA,0
-DAn,-DA
-(y)IA,-(y)A
-(y)HncA
-m,-zsIn,-z,-yIz -z -z 0 -mAksIzIn
-mAdAn
-(y)HcH
-(y)AmA
-(y)Adur,-(y)Hver,-(y)Agel,-(y)Agör
-(y)Abil,-(y)Ayaz,-(y)Akal,-(y)Akoy,0
-(H)t
-(H)t
-(H)þ
-DHr -DHr
-DHr
-(H)l,0
-(H)l,0
-(H)l,0
-(H)l,0
0
-zsInIz,-IAr
-mAzlHk
-ma
-(y)Hþ
-(y)An
-(y)AcAk
Dhk
-(y)AsH
mHþ
Þekil-10.8: Eylem Çekim Ekleri Soldan Saða Sonlu Durum Makinesi [2][4]
10.4.5 Tüm SDM’lerinin Ortak SDM’de Toplanmasý
Þekil-10.3, Þekil-10.5, Þekil-10.7 ve Þekil-10.9 soldan saða doðru numaralandýrýlmýþ sonlu
durum makinelerinin tümünde birbirlerine geçiþler mevcuttur.
Örneðin:
Þekil-10.2 Ad kökü sonlu durum makinesinin 5 numaralý durumunda Ek Eylem makinesine
geçiþ vardýr. Benzer þekilde Þekil-10.9 eylem çekim ekleri makinesinde 8 ve 9 numaralý
durumlardan eylem zaman ekleri sonlu durum makinesinin OLUMSUZ durumuna, 10 ve 11
numaralý durumlardan ad kökü sonlu durum makinesine ve 12 numaralý durumdan da ek eylem
sonlu durum makinesine geçiþler vardýr. Tüm bu geçiþlerin tek bir sonlu durum makinesinde bir
araya alýnmasýnýn ardýndan, 0 (sýfýr) boþ geçiþlerin elenmesi gerekmektedir. Tüm eklerin bir
arada kullanýlabilmesi amacýyla her bir ek grubunda 1`den baþlanarak numaralandýrýlan ekler
için tekliði saðlamak amacýyla 1 ile 115 arasýnda numaralar verilmiþtir.
Ortak olarak oluþturulmuþ sonlu durum makinesinin boyutu büyük olduðundan
gösterilmemiþtir. Ayrýca boþ geçiþlerin de nasýl elendiðini küçük bir örnek kümesi ile
göstermekte fayda vardýr. Bu sayede son oluþturulan büyük sonlu durum makinesinde boþ
geçiþlerin nasýl elendiði ile ilgili fikir sahibi olunabilir.
10.4 Yetkin Bul ve Deðiþtir – 171
1
2
3
5 4
6
7
8
9
10
11
12
13 14
Çýkýþ
Olumsuz
Ek eylem
Ad kökü
41 43
0,42
0,42
0
0,40
44
0,42
43
43
44
0,42
0,44
3
3
8
0,9,10,11,12
13,14,15
16
34,35,36,37
18
17
0
38,39
0,13
26,27,28
29,30,31
32,33
19,20,21
1,2,3
4,5,6
0,9,10
11,12
1,2,3,4,5,6
23
0,25
22
0,24
7
Þekil-10.9: Numaralandýrýlmýþ eylem çekim ekleri soldan saða sonlu durum makinesi
4.5.1 Boþ Geçiþlerin Elenmesi
Þekil-10.10 ve Çizelge-10.2 yardýmýyla Þekil-10.11 oluþturulmuþtur. Þekil-10.11 de 0 (sýfýr)
boþ geçiþlerin elenmesi için birkaç iþlem yapýlacaktýr. Tüm iþlemler aþaðýda adým adým
gösterilmiþtir. Ýlk olarak hangi durumlara hiçbir iþlem yapmadan ulaþýlabilir ona bakýlýr ve A
kümesine bu durumlar eklenir. Þekil-11’de A kümesinde ee5 durumu bulunmaktadýr. A
kümesinde hangi ekler ile hangi kümelere gidileceðini gösteren aþaðýdaki iþlemler yapýlmýþtýr.
A={ee5}
—————————————————
ee5 durumunda çýkan ekler 1,2,3,4,5,10,12,13,14,15
1 eki ile Çýkýþ
2 eki ile Çýkýþ
3 eki ile Çýkýþ
4 eki ile Çýkýþ
5 eki ile Çýkýþ
10 eki ile {ee11}à{ee11,Çýkýþ}=B
12 eki ile {ee8}à{ee8,Çýkýþ}=C
13 eki ile C
14 eki ile {ee9}à{ee9,ee10,Çýkýþ}=D
172 – Bul ve Deðiþtir
Durum 1
ee-5
Ek eylem 1
ee-8
Ek eylem 2
ee-9
Ek eylem 2
kiþi ee-10
Ek eylem 3
kiþi ee-11
Çýkýþ
Çýkýþ Çýkýþ
Çýkýþ
Çýkýþ
Çýkýþ
-(Y)DH,-(y)sA -(Y)mHþ -DHr -(Y)ken
-lAr,0
-DHr,0 -cAsInA
-(Y)mHm
-sHn,0
-yHz
-sHnHz
-lAr
-m,n
0,-k
-nHz
-lAr
-Hm,sHn,0
-Hz,-sHnHz,-lAr
Þekil-10.10: Ek eylem ekleri soldan saða sonlu durum makinesi [2][4]
15 eki ile Çýkýþ
—————————————————
B={ee11,Çýkýþ}
—————————————————
ee11 durumunda çýkan ekler 5
5 eki ile Çýkýþ
—————————————————
C={ee5,Çýkýþ}
—————————————————
ee8 durumunda çýkan ekler 5,6,7,8,9
5 eki ile Çýkýþ
6 eki ile Çýkýþ
7 eki ile Çýkýþ
8 eki ile Çýkýþ
9 eki ile Çýkýþ
—————————————————
D={ee9,ee10,Çýkýþ}
—————————————————
ee9 durumunda çýkan ekler 1,2,3,4,5
1 eki ile {ee10}à{ee10,Çýkýþ}=E
2 eki ile E
3 eki ile E
4 eki ile E
10.4 Yetkin Bul ve Deðiþtir – 173
13,12
0,5
14
0,1,2
3,4,5
0,5,6
7,8,9
0,10,11
10
0,1,2,3,4,5,15
Ee-5
Ee-9
Ee-11
ee-8
Ee-10
Çýkýþ
Þekil-11: Numaralandýrýlmýþ ek eylem ekleri soldan saða SDM
5 eki ile E
—————————————————
ee10 durumunda çýkan ekler 10,11
10 eki ile Çýkýþ
11 eki ile Çýkýþ
—————————————————
E={ee10,Çýkýþ}
—————————————————
ee10 durumunda çýkan ekler 10,11
10 eki ile Çýkýþ
11 eki ile Çýkýþ
—————————————————
Tüm bu iþlemlerin sonucunda aþaðýdaki 6 küme oluþmaktadýr.
A={ee5}
B={ee11,Çýkýþ}
C={ee8,Çýkýþ}
D={ee9,ee10,Çýkýþ}
E={ee10,Çýkýþ}
Çýkýþ
Yukarýda örneklendirdiðimiz boþ geçiþlerin elenmesi tüm sonlu durum makinelerinin bir arada
olduðu sonlu durum makinesi için yapýldýðýnda 36 kümeden oluþan bir yapýya ulaþýlmaktadýr.
Durumlarýn kolay anlaþýlmasý için bazý kýsaltmalara baþvurulmuþtur. Bunlar ; ez: eylem zaman,
ik: ad (isim) kökü ve ee: ek eylem dir.
A={1,2,6,7,10,11,ez4}
B={2,6,7,10,11,ez4}
C={3,6,7,10,11,ez4}
D={5,6,7,10,11,ez4}
E={4,6,7,10,11,ez4}
F={6,7,10,11,ez4}
G={7,10,11,ez4}
H={8,11,ez4}
I={9,11,ez4}
J={10,11,ez4}
K={ik1,ik2,ik3,ik4,ik5,ee}
L={ez2,ez7,ez6,OLUMSUZ,ARA}
M={ez3, ARA}
MA={ez5, ARA}
N={14}
O={13}
174 – Bul ve Deðiþtir
P={12}
R={OLUMSUZ,ARA}
S={11,ez4}
T={ik2,ik3,ik5,ee}
U={ik4,ik5,ee}
V={ik3,ik5,ee}
Y={ik5,ee}
Z={ik5,ik6,ee}
A1={ee8}
B1={ee9,ee10}
C1={ee11}
D1={ez6,ez7,ez8}
E1={ez7}
F1={ez8}
G1={ez9}
H1={ez10}
I1={ee}
J1={ik7,ik5,ee}
K1={ee10}
CIKIS={}
A kümesi baþlangýç kümesi iken ÇIKIÞ kümesi sonlanmayý ifade etmektedir. Eklerin
çözümlenmesi aþamasýnda tüm durumlarda sonlanma olabilmektedir. Ek katarýnýn
parçalanmasý hangi durumda biterse orada ek çözümlemesi sonlanmýþ demektir. Bu bilgiler
ýþýðýnda yazýlýmda kullanýlan geçiþ kümeleri oluþturulmuþtur.
10.5 Bulma Ýþlevinde Karþýlaþýlan Sorunlar
Türkçe için karþýlaþýlan birçok bulma ve deðiþtirme sorunu vardýr. Bu sorunlarýn bazýlarýna ve
çözümlerine aþaðýda deðinilmiþtir.
• Bazý sözcüklerde ünlü düþmesi yaþanýr.
Örneðin:
“Ayþe oðlunu gezmeye götürdü.” tümcesinde “oðul” sözcüðü arandýðýnda mevcut bul iþlevleri
“oðlunu” sözcüðünü bulamamaktadýr. Bu nedenle ünlü düþmesi yaþayan sözcükler bir dosyada
tutularak bul denen sözcük bu dosyada var ise ünlü düþmesi yaþamýþ hâlinin de aramaya
katýlmasý saðlanmýþtýr.
• Son harfi “p, ç, t, k” sert süreksiz ünsüzü olan sözcükler ünsüz yumuþamasýna
uðradýklarýnda deðiþirler. Aramaya hem deðiþmemiþ hem de deðiþmiþ hallerinin
katýlmasý saðlanmýþtýr.
10.5 Bulma Ýþlevinde Karþýlaþýlan Sorunlar – 175
Örneðin:
“Kemal kitabýný kitaplýktan aldý.” tümcesinde “kitap” sözcüðü arandýðýnda sözcüðün
yumuþamaya uðradýðý “kitab” sözcüðü de aramaya katýlarak, hem “kitap” hem de “kitab”
aranmalýdýr. Böylece hem “kitabýný” hem de “kitaplýktan” sözcükleri yakalanarak bulunmalýdýr.
• Son harfi “p, ç, t, k” sert süreksiz ünsüzü olduðu hâlde ünsüz yumuþamasýna
uðramayan sözcükler de vardýr. Bu özelliðe sahip sözcükler bir dosyada tutularak
yumuþamaya uðratmadan olduðu gibi aranmasý saðlanmýþtýr.
Örneðin:
“aþk” sözcüðü ünsüz yumuþamasý kurallarýna göre ünlü bir harf ile baþlayan ek aldýðýnda
sondaki “k” ünsüzünün “g” ünsüzüne dönüþmesi beklenir, fakat deðiþme olmaz. Bu nedenle bu
özelliðe sahip sözcükler bir dosyada tutularak bu örnek için hem “aþk” hem de “aþg”
katarlarýnýn aramaya katýlýp verimin azalmasý engellenmiþtir.
• Bazý eylem köklü sözcüklere “yor” eki eklendiðinde eylem soylu sözcükte deðiþimler
olur. Bu deðiþimler göz önüne alýnarak bir arama yapýlmasý saðlanmýþtýr.
Örneðin:
“anla” eylem soylu sözcüðüne “yor” eki eklendiðinde “anla+yor” yerine “anlýyor” hâline dönüþ
olur. “Kenan her söyleneni anlýyor.” tümcesinde “anla” sözcüðü arandýðýnda bulunamýyor. Bu
nedenle bu þartlarý saðlayan eylem soylu sözcükler için özel bir çözümleme yapýlmýþtýr.
• “de” ve “ye” eylem soylu sözcüklerinde “ecek” eki eklendiðinde eylem soylu sözcükte
deðiþimler olur. Bu deðiþimler göz önüne alýnarak bir arama yapýlmasý saðlanmýþtýr.
Örneðin:
“de + ecek” à “diyecek”
“ye + ecek” à “yiyecek”
Þekil-10.12`de görüldüðü üzere bul iþlevinde aranan sözcük bulunmadan önce sorun yaratan
durumlarýn denetimlerinin yapýldýðý, denetimlerden geçildikten sonra bulunan sözcüðün
ardýndaki ek katarý bir çözümleyiciden geçirilerek her bir ek katarý için ek numaralarýndan
oluþan bir dizi oluþturulur.
10.6 Deðiþtirme Ýþlevinde Karþýlaþýlan Sorunlar
Deðiþtir iþlevinde de týpký bul iþlevinde olduðu gibi dile özgü sorunlarla karþýlaþýlmaktadýr. Bu
sorunlarýn baþlýca nedenleri Türkçenin sondan eklemeli bir dil olmasýndan ve eklerinin neyin
ardýna eklendiðine göre deðiþmesinden kaynaklanmaktadýr.
176 – Bul ve Deðiþtir
Örneðin:
“Özkan aldýðý kitaplarýndan bazýlarýný yenileriyle deðiþtirdi.” tümcesinde “kitap” sözcüðü
bulunup yerine “defter” sözcüðü konulmaya çalýþýldýðýnda tümce “Özkan aldýðý defterlarýndan
bazýlarýný yenileriyle deðiþtirdi.” hâlini almaktadýr. “defterlarýndan” sözcüðü Türkçede anlamlý
bir sözcük deðildir. Bunun yerine “defterlerinden” sözcüðü olmalýdýr. Bu ve benzeri sorunlarý
çözebilmek için yazýlýmda çözümler üretilmiþtir. Deðiþtir iþlevinde karþýlaþýlan sorunlar ve
çözümleri þöyledir. Türkçede sözcükler ve ekleri arasýnda nasýl bir iliþki olduðu tanýmlanmýþ ve
buna göre eklerin yapýlandýrýlmasý saðlanmýþtýr.
Örneðin:
“kedilerimizden” sözcüðünde “kedi” sözcüðü yerine “tavþan” deðiþikliði yapýlmaya
çalýþýldýðýnda “kedi” sözcüðünün ardýnda hangi ekler olduðuna bakýlarak “ler” çoðul, “imiz”
1.çoðul iyelik ve “den” ayrýlma durum eki çözümlemesi yapýlmasý saðlanmýþtýr. Bu
10.6 Deðiþtirme Ýþlevinde Karþýlaþýlan Sorunlar – 177
Bulunacak sözcük
Bulunacak sözcük ses düþmesi
denetiminden geçirilir
Bulunacak sözcük ses yumuþamasý
denetiminden geçirilir
Bulunacak sözcük veya sözcük kümesi
metin içinde aranýr
Her satýrda bulunan sözcük ve eklerinin
indisleri bir diziye deðer olarak atanýr
Þekil-10.12: Bul iþlevinin adýmlarý
çözümlemenin ardýndan “tavþan” sözcüðüne ilgili ekler “tavþan” sözcüðünün sahip olduðu ses
özelliklerine göre eklenmiþ ve “tavþanlarýmýzdan” son sözcüðünün yapýlandýrýlmasý
saðlanmýþtýr.
• Eðer Bul iþlevinde deðinilen ünlü düþmesi olan sözcüklerden biri bulunmuþ sözcüðün
yerine konacak sözcük olarak seçildiyse olasý deðiþiklikler göz önüne alýnarak deðiþtir
iþlevinin yapýlmasý saðlanmýþtýr.
Örneðin:
“Ahmet Bey kýzýnýn okuluna hiç gitmedi.” tümcesinde “kýz” yerine “oðul” deðiþikliði yapýlmaya
çalýþýldýðýnda, “oðul” sözcüðünün ses düþmesi yaþayan sözcüler dosyasýnda olduðu ve ne
durumlarda ses düþmesi yaþadýðý bilgileri ýþýðýnda deðiþiklik yapýlarak tümcenin “Ahmet Bey
oðlunun okuluna hiç gitmedi.” halini almasý saðlanmýþtýr.
• Son harfi “p, ç, t, k” ünsüzlerinden biri olan sözcük bulunan sözcük yerine konacak
sözcük olarak seçildiyse ardýna eklenen eklerin bazý özelliklerine göre bu sözcüklerde
oluþabilecek deðiþiklikler göz önüne alýnarak çözümleme yapýlmasý saðlanmýþtýr.
Örneðin:
“Özge defterini Selim`in defteriyle karýþtýrýnca olanlar oldu.” Tümcesinde “defter” yerine
“kitap” konulmaya çalýþýldýðýnda “kitap” sözcüðünün son harfinin “p, ç, t, k” harflerinden biri
olmasý ve ek alýrken aldýðý ekin ünlü ile baþlamasý nedeniyle sözcüðün son ünsüzü yumuþamaya
uðrar. Bu nedenle tümcenin “Özge kitabýný Selim`in kitabýyla karýþtýrýnca olanlar oldu.” hâlini
almasý saðlanmýþtýr.
Þekil-10.13`te görüldüðü üzere bulunacak sözcüðün ardýndaki ek katarlarý çözümlendikten
sonra yerine konacak sözcüðün ardýna ek yapýlandýrýlmasý akýþ þemasýndaki adýmlarý takip
ederek yapýlmaktadýr.
Hem deðiþtir hem de bul iþlevlerinin nasýl çalýþtýðý Þekil-10.12 ve Þekil-10.13`te görülmektedir.
Bulma iþlevinin ardýndan ek katarýnýn çözümlenmesi ve ek dizisinin oluþturulmasý da önemli bir
adýmdýr. Bu adýmýn akýþ þemasý da Þekil-10.14`te verilmiþtir.
Þekil-10.14`teki akýþ þemasýnýn oluþturduðu ek dizileri kullanýlarak yerine konacak sözcüðün
ek kýsýmlarý yapýlandýrýlýr. Bu yapýlandýrmanýn adýmlarý da Þekil-10.15’de gösterilmiþtir.
Giriþ Metni
Osmanlý devleti nedensiz bir þekilde Osman beyin ölümü ile osmanlýlaþma yolunda
osmanlýsýzlaþtýrýlmaya çalýþýlmaktadýr. Osman beyin yerine osmancýk aðasý
getirilecektir. Ve osmanlýlaþtýramadýklarýmýzdan olma durumu ortaya çýkacaktýr.
178 – Bul ve Deðiþtir
“osman” sözcüðü yerine “sipahi” sözcüðü konulmak istendiðinde aþaðýdaki çýkýþ metni elde
edilmektedir..
Çýkýþ Metni
Sipahili devleti nedensiz bir þekilde Sipahi beyin ölümü ile sipahilileþme yolunda
sipahilisizleþtirilmeye çalýþýlmaktadýr. Sipahi beyin yerine sipahicik aðasý
getirilecektir. Ve sipahilileþtiremediklerimizden olma durumu ortaya çýkacaktýr.
Programý daha büyük dosyalarda da çalýþtýrarak baþarým saðlanmýþtýr. Bunun sonucunda
dosyanýn büyüklüðünün programýn çalýþmasýnda yavaþlamaya neden olmadýðý görülmüþtür.
Metnin içerisine bulunacak olan sözcüðün hem çözümlenebilen hem de çözümlenemeyen
þekilleri de konarak programýn nasýl bir sonuç vereceði sýnanmýþtýr. Çözümleyicide
çözümlenebilen ekleri olan tüm bulunmuþ sözcükler çözümlenerek yerine konacak sözcüðün
ardýna yapýlandýrýlmýþtýr ve baþarýlý bir þekilde kural tabanlý bul ve deðiþtir saðlanmýþtýr.
10.6 Deðiþtirme Ýþlevinde Karþýlaþýlan Sorunlar – 179
Yerine konacak sözcük ve ek indisleri dizisi
Ek indisleri dizisinde bir adým ilerle
Sonlandýrma
Yerine konacak sözcüðü sýradaki ek
indisleri dizisi elemaný ile
ek yapýlandýrmaya gönder
Ek indisleri dizisinde
sýrada eleman var mý?
Ek indisleri dizisinde
sýradaki eleman boþ mu?
E
E
H
H
Þekil-10.13: Deðiþtir iþlevinin adýmlarý
Kaynakça
[1] Delibaþ, A., 2008. Doðal Dil Ýþleme Ýle Türkçe Yazým Hatalarýnýn Denetlenmesi, Yüksek
Lisans Tezi, Ý.T.Ü. Fen Bilimleri Enstitüsü,Ýstanbul.
[2] Eryiðit, G., 2002. Sözlüksüz Köke Ulaþma Yöntemi, Yüksek Lisans Tezi, Ý.T.Ü. Fen
Bilimleri Enstitüsü, Ýstanbul.
[3] Bilgin, O., Çetinoðlu Ö., Oflazer K., 2005. Efficient Find and Replace in Agglutinative
Languages: The Case of Turkish, 1 Mayýs 2008 tarihinde
http://www.hlst.sabanciuniv.edu/archive/patras.pdf kaynaðýndan alýnmýþtýr.
180 – Bul ve Deðiþtir
Bir sonraki durum << Baþlangýç durumu
Eski durum << Baþlangýç durumu
Baþarýlý sonlandýrma
Eski durum, þu anki durum yapýlýr. Þu anki durum, eski durum yapýlýr
Þu anki durum, bu ek ile gidilen
durum yapýlýr
Çözüm dizisinden son eleman çýkarýlýr
ve alternatif geçiþlere bakýlabilmesi
için bu elamanýn sonraki adýmda
çözüm dizisine eklenmesi engellenir.
Ek’in numarasý çözüm dizisine eklenir
Ek katarýnýn baþýna, çýkarýlan ek
eklenir
Ek katarýnýn baþýndan bu numaralý ek
kýsmý çýkarýlýr
Ek katarý var mý?
Bu ek ile gidilen kurallý
bir durum var mý?
E
H
H
E
Þekil-10.14: Ek dizisi aramanýn akýþý
[4] Oflazer K., 1994. Two-level Description of Turkish Morphology,
Literary and Linguistic Computing, Vol.9, Number 2.
10.6 Deðiþtirme Ýþlevinde Karþýlaþýlan Sorunlar – 181
Ýþlenen sözcük << Yeni sözcük
Ýþlenen dizi << ek dizisi
Yeni sözcük ve ek dizisi
Ýþlenen sözcüðe, iþlenen dizinin ilk
elemaný ek olarak alýnýr
Ýþlenen sözcük << iþlenen sözcük + Ek
Ýþlenen dizi << Ýþlenen dizinin ilk elemaný çýkarýlarak oluþan dizi
Ek yapýlandýrmasý
bitti sonlandýrmasý
Ýþlenen dizisi boþ mu?
E H
Þekil-10.15: Ek yapýlandýrma iþlevi akýþ þemasý
11
Bilgisayarlý Çeviri
Doðal dil iþlemenin en ilgi çekici alanlarýndan biri diller arasý çeviridir.
Diller arasý çeviri denildiðinde, insanýn aklýna, farklý dillerde konuþan
iki insanýn, arada çevirmen olmadan birbirini anlayabileceði çözümler
gelmektedir. Daha açýk bir anlatýmla, bir Türk Türkçe konuþacak,
karþýsýndaki Japon bu konuþmayý Japonca dinleyecektir. Japon’un
konuþmasýný da Türk Türkçe olarak dinleyecektir. Ýnsanlarýn ve
araþtýrmacýlarýn düþleri bu yönde olmakla beraber, günümüzdeki
biliþim olanaklarý, bu kadar yetenekli çeviri dizgelerini
saðlayamamaktadýr. Ancak, belli alanlarda çalýþan örnekler üretilmeye
baþlanmýþtýr. Örneðin, askeri emirleri, hava raporlarýný çevirebilen
dizgeler üretilmeye baþlanmýþtýr.
Günümüzde, bilgisayar desteðiyle yapýlan çeviriler, en basit olandan en
karmaþýk olana doðru sýralanabilir: Sözcük çevirisi, tümcecik çevirisi,
tümce çevirisi. Gerçekleþtirilen, metinden metine çeviri dizgelerinin
bazýlarý insan gözetimi gerektirirken bazýlarý yardýmý olmaksýzýn çeviri
yapabilmektedir.
Bir dilden diðer bir dile çeviri yapan kiþinin, iki dili iyi þekilde
bilmesinin yetmeyeceði, çeviri yaptýðý metnin konusu hakkýnda da bilgi
sahibi olmasý gerekir. Söz gelimi týp konusundaki bir kitabý çevirecek
kiþinin týp konusunda uzman olmasýnýn gerekeceði açýktýr. Bilgisayar
yardýmýyla yapýlan çevirilerde de benzer bir güçlüðün olacaðý kolayca
söylenebilir.
– 183
Dünyada konuþulan diller belli dil ailelerinin üyeleridir. Ayný dil ailesinin üyesi olan iki dil
arasýnda çeviri yapmak, doðal olarak farklý iki dil ailesinin üyesi olan iki dil arasýnda çeviri
yapmaya göre daha kolaydýr. Bilgisayarlý çeviri dizgeleri gerçekleþtirilirken kullanýlabilecek
yöntemler, dillerin ayný dil ailesinden olup olmadýðýna göre deðiþmektedir.
Bilgisayarlý çeviri amacýyla kullanýlan yöntemler, kural temelli ve istatistiksel temelli olmak
üzere genel iki kümeye ayrýlabilir. Bu iki kuralýn birlikte kullanýldýðý örnekler de
bulunmaktadýr. Kural temelli çeviri yöntemleri, yabancý dil eðitiminde izlenen yöntemlere
benzer. Öncelik her iki dilin dilbilgisi kurallarýný bilgisayara öðretmektir. Buna ek olarak çeviri
sözlüðü bilgisayara yüklenir. Ýstatistiksel temelli çeviri, çevirmenler tarafýndan yapýlmýþ olan
çeviri metinler içinde, çevirisi yapýlmak istenen tümce ya da tümceciðe en yakýn olan karþýlýðý
bulmaya dayanýr.
Bilgisayar kullanarak yapýlan çevirilerin baþarýmlarýný karþýlaþtýrabilmek için, çeviri
dizgesinden beklentilerin tanýmlanmýþ olmasý gerekir. Bir bilgisayarlý çeviri dizgesi aþaðýdaki
özellikleri saðlamalýdýr:
• Ýnsan desteksiz : Çeviri dizgesi insan katký ve desteði olmadan çalýþabilmelidir.
• Kaliteli : Çeviri dizgesinin ürettiði sonuçlar aslýna uygun ve anlaþýlýr olmalýdýr.
• Konu baðýmsýz : Çeviri dizgesi her türlü konuyu içeren metinleri çevirebilmelidir.
1.1 Dillerin Benzerlikleri ve Farklýlýklarý
Dünyada 4000 dolayýnda dilin konuþulduðu bilinmektedir. Ancak bu dillerden bazýlarý yaygýn
olarak ve çok kiþi tarafýndan konuþulurken bazýlarý çok dar alanda, binden az kiþi tarafýndan
konuþulmaktadýr. UNESCO kaynaklarýna göre, diller þöyle sýralanmaktadýr:
Konuþan sayýsýna göre
• Çince
• Hintçe
• Ýngilizce
• Ýspanyolca
• Rusça
• Arapça
• Turkçe
• Fransýzca
• Almanca
• English
Yaygýnlýða göre
• Çince
• Ýspanyolca
• Arapça
• Türkçe
• Hintçe
184 – Bilgisayarlý Çeviri
Yine ayný kaynak, diilerin Dünya üzerindeki yayýlýþýný Þekil-11.1’deki gibi vermektedir.
Yeni bir dili öðrenmeye çalýþanlarýn ilk yaptýklarý sözcüklerin karþýlýðýný ezberlemektir.
Ardýndan, öðrenmeye çalýþtýklarý dilde tümce kurabilmektir. Bazý dillerde sözcükler yalýn halde
bulunmasýna karþýn bazýlarýnda sözcükler ekler alarak anlamlarýný deðiþtirmektedir. Tümce
içinde, sözcüklerin niteliklerine göre diziliþi de dilden dile benzerlik ve farklýlýk
göstermektedir. Bu açýklamalara baðlý olarak diller arasýndaki benzerlikler ve farklýlýklarýn
aþaðýda sýralanan özellikler baðlamýnda incelenmesi gerektiði sonucuna varýlýr:
• Biçimbilimsel
• Sözdizimsel
• Dilimleme
• Anlatým biçimi
• Sözlüksel
• Olay ve tartýþma
• Yapýsal
• Konusal
1.1 Dillerin Benzerlikleri ve Farklýlýklarý – 185
Þekil-11.1: Dünyada dillerin yaygýnlýk haritasý (Kaynak UNESCO)
11.1.1 Biçimbilimsel Benzerlik ve Farklýlýklar
Dünyada yaygýn olarak kullanýlan diller ana hatlarý ile þöyle kümelenmektedir:
• Yalýnlayan diller
• Bitiþken diller
• Bükümlü diller
• Kaynaþtýran diller
Yalýnlayan dillerde sözcükler tek hecelidir ve sözcükler ek almazlar. Sözcükler tümce
içinde vurguya baðlý olarak anlam kazanýrlar. Çince, Vietnamca, Himalaya dili bu küme
içinde yer alýr.
Bitiþken dillerde sözcüðün temeli kök sözcüktür. Kök sözcüðe yapým ekleri, kurallý biçimde
eklenerek yeni sözcükler oluþturulur. Kök sözcüðe eklenebilecek eklerin sayýsýnda bir sýnýrlama
yoktur. Bu nedenle, bir kök sözcükten çok sayýda sözcük üretilebilir. Bitiþken dil kümesi içinde,
Türkçe Macarca, Fince, Moðolca, Japonca gibi diller yer almaktadýr.
Hint-Avrupa ve Sami dilleri, bükümlü dil kümesine girmektedir. Bükümlü dillerde gövde
sözcük ön ve son ek alarak yeni anlam kazanýr. Bir gövdeye eklenen ön ek ve son ek sayýsý
genelde biri aþmaz. Dolayýsýyla ekler, gövde sözcüðe kýsýtlý katký saðlarlar.
Kaynaþtýran dillerde, eylem tümcenin diðer öðeleri ile kaynaþmaktadýr. Dolayýsýyla eylem
tümcenin tamamý olabilmektedir. Amerika yerlilerinin dilleri bu küme içinde sayýlmaktadýr.
Yalýnlayan dillere en güzel örnek Vietnamcadýr. Bu dilde, sözcükler ek almazlar. Dolayýsýyla
her sözcük tekil olarak yorumlanabilir. Yalýnlanmýþ bir dilde yazýlmýþ tümcenin karþýlýðý,
bükümlü bir dilde kolayca gösterilebilir. Þekil-11.2’de Vietnemca dilinde yazýlmýþ bir tümcenin
Ýngilizce karþýlýðý verilmiþtir.
Vietnamca yazýlmýþ olan bu tümcenin Türkçe karþýlýðý þöyledir: Arkadaþýmýn evine geldiðimde
ders çalýþmaya baþladýk.
Bitiþken diller ek açýsýndan en zengin dillerdir. Ek açýsýndan zengin olan kaynak dildeki bir
sözcüðü, ek bakýmýndan fakir olan hedef dile çevirirken, tek bir sözcük karþýlýk getirilemez.
Örneðin; Bitiþken bir dil olan Türkçede “göz” sözcüðünün alacaðý ekler ile türetilmiþ
sözcüklerin Ýngilizcedeki karþýlýklarýndan bazýlarý Tablo-11.1’de verilmiþtir: Tablo-11.1’den de
186 – Bilgisayarlý Çeviri
Khi toi den nha ban toi chung toi bat dau lam bai
When I come house friend I “çoðul” I begin do lesson
Þekil-11.2: Vietnamca dilince yazýlmýþ bir tümcenin Ýngilizce karþýlýðý
görüldüðü gibi, Türkçe sadece sondan eklemeli bir dildir. Osmanlýca diyebileceðimiz eski
Türkçede ön eklerin de kullanýldýðý bilinmektedir. Örneðin “mevcut”, “namevcut” gibi.
11.1.2 Sözdizimsel Benzerlikler ve Farklýlýklar
Toplumsal geliþmeye koþut olarak geliþtiði düþünülen dillerin tümce yapýlarý birbirinden
faklýdýr. Bu fark, doðal olarak farklý dil aileleri için daha açýktýr. Tümce yapýlarýndaki farklýlýk
ve benzerlikleri göstermek üzere ayný tümcenin, Türkçe, Japonca, Fince, Macarca, Ýngilizce ve
Fransýzca karþýlýklarý Þekil-11.3 ve Þekil-11.4’te kadar gösterilmiþtir.
Þekil-11.3’e baktýðýmýzda þu yorumu yapabiliriz. Türkçe tümce yapýsýna en yakýn olan dil
Japonca olarak görülmektedir. Ayný þekil bize, Fince ve Macarca’nýn tümce yapýlarýnýn birbirine
benzediðini söylemektedir. Þekil-11.4’e baktýðýmýzda Ýngilizce bir tümcenin yapýsý Fransýzca
tümcenin yapýsýyla bire bir aynýdýr.
Tümce kuruluþlarýndaki benzerlik olan diller arasýndaki çeviri, doðal olarak, benzerliði az olan
dillere oranla daha kolay olacaktýr.
Altay dil ailesi içinde yer alan Türkçenin, zaman içinde deðiþikliklere uðramasý doðal
karþýlanmalýdýr. Bugün Türkiye’de konuþulan Türkçe ile Asya’nýn orta kýsmýnda yaþayan
Uygurlarýn konuþtuðu Türkçe çok farklý görülebilir. Özellikle sözcüklerin zaman içinde
deðiþtikleri veya ayný sözcüklerin söyleniþ biçimlerinin epey farklý olduðu bilinmektedir.
1.1 Dillerin Benzerlikleri ve Farklýlýklarý – 187
Türkçe (tekil) Türkçe (çoðul) Ýngilizce (tekil)
Göz Gözler Eye
Gözlük Gözlükler Eyeglasses
Gözlükçü Gözlükçüler Optician
Gözlükçülük Gözlükçülükler Opticians
Gözcü Gözcüler Watchman
Gözcülük Gözcülükler ophthalmology
Gözlem Gözlemler Observation
Gözleme Gözlemeler Observing
Gözlemci Gözlemciler observer
Gözlemcilik Gözlemcilikler Observation
Gözde Gözdeler favourite
Tablo-11.1: Bitiþken bir dil olan Türkçe ile Bükümlü bir dil olan Ýngilizcenin
biçimbilimsel açýdan karþýlaþtýrýlmasý
Ancak bu dillerin tümce yapýlarý birbirine çok yakýndýr. Yaklaþýk bin yýldýr birbirinden uzak
yaþayan topluluklarýn dillerinde bu kadar deðiþikliklerin olmasý olaðan karþýlanmalýdýr. Türk
dillerinin birbirine benzerlikleri coðrafi konumlarýna çok baðlýdýr. Öðneðin, Azerbaycan ve
Ýranda yaþayan Azari Türkler ve Irakta yaþayan Türkmenlerin konuþtuðu dil Türkiye’de
konuþulan Türkçeye çok yakýndýr. Bu yüzden farklý dil olarak nitelemek yerine farklý lehçe
olarak nitelemek daha doðru olur.
Türk dilleri ailesi içinde, Azeri, Uygur, Horasan, Tatar, Kazak, Özbek, Kýrgýz, Türkmen,
Gökoðuz (Gagavuz) ve Kýrgýz dilleri bulunmaktadýr.
Türkçeye yakýn olan diller içinde Moðolca, Korece ve Japonca sayýlabilir.
Tümce yapýlarý açýsýndan
benzerlik ve farklýlýklar
Þekil-11.5’teki gibi gösterilebilir:
Tümce yapýsý birbirine benzer olan
dillerde, bir tümcenin çevirisi
yapýlýrken, sözcüklerin tümce
içindeki sýrasý, büyük ölçüde ayný
tutulabilir; kaynak dildeki
sözcüðün yerine hedef dildeki
karþýlýðý yerleþtirilir. Örneðin; ben
kitap okuyorum tümcesini
sýrasýyla Ýngilizce, Fransýzca,
Almanca, Ýspanyolca ve Ýtalya
yazdýðýmýzda, sözünü ettiðimiz
188 – Bilgisayarlý Çeviri
He regards his pen as his only arm
O görür kalemini olarak tek silahý
Il considere son crayon comme sa seul arme
He regards his pen as his only arm
O görür kalemini olarak tek silahý
Ýngilizce
Fransýzca
Þekil-11.4: Ýngilizce ve Fransýzca tümce yapýsý
O kalemini tek silahý olarak görür
O olarak görür kalemini gibi kendi silah
O ugy tekinti a tollat mint sajat fegyver
Kereha pendakewo karenojuu tosite miru
O kalemini tek silahý olarak görür
O görür kalemini olarak tek silahý
Han pitaa kynaansa ainoana aseenaan
Macarca FÝnce
Japonca
Þekil-11.3: Türkçe, Japonca, Macarca ve Fince tümce yapýlarý
benzerliði kolayca görebiliriz.
Þekil-11.6
Bu örneklere dikkatli
bakýldýðýnda, bazý sözcüklerin
birebir ayný veya benzer olduðu
da söylenebilir. Örneðin,
book-buch, livre-libro gibi.
Ayný tümceyi Türkçe
yazdýðýmýzda, sözcüklerin
diziliþinin çok farklý olduðunu
görürüz.
11.1.3 Dilimleme
Bazý dillerde yazýlmýþ metinlere
baktýðýmýzda, her bir sözcüðü
ve tümceyi kesin biçimde ayýrt
edebiliriz. Buna karþýn bazý
dillerde sözcükleri birbirinden
ayýrt etmek çok zordur. Çin,
Japon, Tayland dillerinde
sözcüklerin nerede baþlayýp
nerede bittiðini anlamak,
dolayýsýyla sözcükleri ayýrt
etmek zordur.
Bazý dillerde, tümceler çok
uzun kurulmaktadýr. Bir
tümcenin beþ on satýr tuttuðu,
bir paragraf kadar uzun olduðu
görülmektedir. Arap metinleri bu özelliktedir. Benzer duruma, XIX. yüzyýl Osmanlý
metinlerinde de rastlanmaktadýr. O devirde uzun tümce kurmak bir hüner olarak görülmüþtür.
Uzun tümcelerin taþýdýðý anlamý ortaya çýkarmak için, önce tümceyi dilimlemek ve her bir
dilimi ayrý çevirmek gerekir. Benzer durum sözcükler için de geçerlidir. Bitiþik sözcükleri önce
sözcük dilimlerine ayýrmak ve dilimlenmiþ sözcüklerin hedef çeviri dilindeki karþýlýklarýný
bulmak gerekir.
Hint-Avrupa dillerinde ana ve yadýmcý tümce kesin hatlarla ayrýlabilmesine karþýn, Türkçede
böyle dilimlemenin yapýlacaðý yeri bulmak kolay deðildir. Aþaðýdaki tümceler bu durumu
açýklayacak niteliktedir.
“Kitabý okuyan adam babamdýr.”
1.1 Dillerin Benzerlikleri ve Farklýlýklarý – 189
Özne
Özne
Özne
Tümleç
Tümleç
Tümleç
Yüklem
Yüklem
Yüklem
Bitiþken diller
Bükümlü diller
Arapça
Þekil-11.5: Deðiþik dillerde tümce yapýsý
I am reading a book
Je lis un livre
Ich lese ein Buch
Estoy leyendo un libro
Sto leggendo un libro
Þekil-11.6: Ayný tümcenin, Ýngilizce, Fransýzca, Almanca,
Ýspanyolca ve Ýtalyanca’daki karþýlýklarý
“The man who is reading the book is my father.”
Ýngilizce tümce þöyle iki parçaya ayýrýlabilir:
“The man ………………………………. is my father.”
“The man is reading the book.”
Ayný anlamdaki Türkçe tümceye baktýðýmýzda, dilimlemenin bu kadar kesin yapýlamayacaðý
görülmektedir.
“Kitabý okuyan adam babamdýr.”
“………………….. adam babamdýr.”
“Kitabý okuyan adam………………”
11.1.4 Anlatým Biçimi
Ýnsanlar, istek niyet ve amaçlarýný karþýsýndakine anlatabilmek için konuþur veya yazar.
Karþýmýzdakine, isteðimizi tam, eksiksiz ve kesin biçimde aktarmak için seçtiðimiz sözcüklerin
anlaþýlýr ve kurduðumuz tümcelerin düzgün ve anlaþýlýr olmasý beklenir.
Bazý dillerde tümce yapýsý ve seçilen sözcükler, yukarýda açýkladýðýmýz düþünceye uygun
düþerken bazý dillerde dolaylý anlatým yeðlenir. Türkçe, Ýngilizce gibi dillerde, sözcükler ve
tümce kuruluþu, istek, niyet ve amacý doðrudan ve açýk biçimde karþý tarafa iletecek biçimde
gerçekleþtirilir. Buna karþýn Çince ve Japoncada üstü kapalý, yanýþtýrmaya dayalý anlatým
yöntemi yeðlenir.
Çeviri sýrasýnda, sözcüklerin ve tümcelerin gerçek anlamlarýný çýkarmak önemlidir. Dolayýsýyla,
çevirisi yapýlan dilin anlatým biçimini bilmek önemlidir.
11.1.5 Sözlüksel Benzerlikler ve Farklýlýklar
Kaynak dildeki bir sözcüðün karþýlýðýný diðer bir dilde her zaman bulamayabiliriz. Ayný duygu
ve istek farklý dillerde farklý biçimde anlatýlabilir. Sözlüksel benzerlik ve faklýlýklar aþaðýda
sýralanan bakýþ açýlarýndan ortaya konacaktýr:
• Eksiklik
• Birebir karþýlýk
• Tek karþýlýk olmamasý
• Nitelik deðiþmesi
• Cinsiyetli sözcükler
• Anlamsal zenginlikler
190 – Bilgisayarlý Çeviri
Eksiklik
Toplumlarýn ilgi alanlarý kültürel özellikleri dillerinin söz varlýðýnýn oluþmasýnda
etkindir. Çiftçi bir toplumda, çiftçilikle ilgili terimlerin zenginleþmesi doðaldýr.
Denizcilik ile ilgili olan bir toplumda, denizcilik terimlerinin sayýsý, denizi olmayan
bir toplumun dilindekine oranla çok olacaktýr. Bu tür özellikler, kaynak dildeki bir
sözcüðün, çeviri yapýlacak hedef dilde karþýlýðýnýn bulunamayabileceði sonucunu
doðurur.
Türkçede akrabalýk terimleri oldukça zengin sayýlabilir. Örneðin, amca, dayý, hala,
teyze, yeðen, eniþte, görümce, elti, yenge, bacanak, vb. Ýngilizce ve Fransýzcada,
örnek olarak verdiðimiz sözcüklerin karþýlýðýný bulamayýz. Bu dillerde hala ile teyze
ve dayý ile amca için kullanýlan sözcük aynýdýr. Eniþte ve bacanak sözcüklerinin
karþýlýðý ise yoktur.
Çevirinin yapýlacaðý hedef dilde, kaynak dildeki sözcüðün karþýlýðý yok ise, bu sözcük
birçok sözcük ya da bir tümce ile anlatýlmaya çalýþýlýr.
Birebir Karþýlýk
Kaynak ve hedef dilde, ayný anlamý veren sözcükler olabilir. Ancak, bir dilde tek
sözcükle anlatýlan bir taným diðer dilde iki hatta üç sözcük kümesiyle anlatýlýyor
olabilir.
Karpuz (Tr) – Water melon (Ýng)
Baþ parmak (Tr) – Thumb (Ýng)
Tek Karþýlýk Olmamasý
Bir dilde bir sözcüðün deðiþik anlamlarda kullanýlmasýna kaþýn, diðer bir dilde her
deðiþik anlam için bir sözcük olabilir.
Söz gelimi Türkçede ayak sözcüðü, insan ayaðý, hayvan ayaðý, masa ayaðý, yarýþ ayaðý
anlamlarýnda kullanýlmaktadýr. Kavram belirsizliðine neden olacaðý düþünülse bile,
kullanýldýðý yere göre anlamý belirlidir. Örneðin, “ayaðým aðrýyor” dediðimizde, insan
ayaðýný; “yedinci ayaðý Nilüfer kazandý” dediðimizde at yarýþýnýnýn sonucu hakkýnda
konuþtuðumuz kolayca anlaþýlýr.
Türkçede farklý anlamlarda kullanýlan ayak sözcüðü için Fransýzcada deðiþik
karþýlýklar bulunmaktadýr. Örneðin, jambe (insan ayaðý), patte (hayvan ayaðý) pied
(masa ayaðý), etape (yarýþ ayaðý).
1.1 Dillerin Benzerlikleri ve Farklýlýklarý – 191
Nitelik Deðiþmesi
Sözcüklerin kullanýþ biçimleri dilden dile deðiþebilmektedir. Br dilde eylem ile
anlatýlan bir durum bir baþka dilde isim ya da sýfat ile anlatýlmaktadýr. Örneðin;
Açým (sýfat) (Tr) – I am hungry (sýfat) (Ýng) – Ho fame (ad) (Ýta) (I have hunger)
Aç olma hali Türkçe ve Ýngilizcede eylem ile anlatýlýrken Ýtalyancada isim ile
anlatýlmaktadýr.
Cinsiyetli Sözcükler
Almanca, Fransýzca, Arapça gibi dillerde adlar cinsiyet bilgisini de içermektedir.
Ýngilizcede sadece üçüncü tekil þahýs zamiri cinsiyet bilgisi içerir. Türkçe sözcüklerde
(Arapçadan alýnmýþ rahip, rahibe gibi sözcükler hariç) cinsiyet bilgisi yoktur. Çeviri
yapýlacak hedef dil Türkçe gibi cinsiyet bilgisi içermiyor ise, sözcüðün ya da zamirin
baþýna cinsiyet bilgisinin eklenmesi gerekir. Örneðin
Katibe (Arb) – Bayan yazman
She is going – O (bayan) gidiyor
Anlamsal Zenginlikler
Türkçede abla, abi, kardeþ sözcükleri, kiþinin kardeþinin cinsiyeti ve yaþý hakkýnda
bilgi içerirken bunlarýn karþýlýklarý Ýngilizcede bulunmaz.
Türkçede el baþ parmaðý ve ayak baþ parmaðý olarak tanýmladýðýmýz parmaklar için
Ýngilizcede iki ayrý sözcük bulunmaktadýr.
11.1.6 Eylem Ýþlevindeki Farklýlýklar
Anlatým biçimi, özellikle eylemlerin neden olduðu olaylar açýsýndan deðerlendirdiðimizde
dilleri iki sýnýfa ayýrabiliriz:
Yönü Belirli Eylemler
Bazý eylemler, eylemin yönünü açýkça belirler. Dolayýsýyla, ayrýca yön belirtmeye
gerek yoktur. Örneðin; Türkçede “ödemek” eylemi borç olarak alýnmýþ ya da kabul
edilmiþ bir görevin yerine getirilmesi; karþýlýðýnýn verilmesi anlamýný taþýr.
Dolayýsýyla, “insan aldýðý borcu öder”. Bazýlarýný söylediði gibi “geri borç ödemesi”
gibi anlatýmlara gerek yoktur ayrýca yanlýþtýr.
Benzer biçimde “inmek”, eylemi, bu eylemin aþaðýya doðru yapýldýðý, “týrmanmak”
eylemi, bu eylemin yukarý doðru yapýldý bilgisini içermektedir.
192 – Bilgisayarlý Çeviri
Yön Eki Gerektiren Eylemler
Bazý eylemler, eyleme yön belirleyen bir ek eklenir. Ýngilizcede bu tür eylemlerin
sayýsý çok sayýlacak kadar fazladýr. Bu tür eylemler bir yön belirtici ile birlikte
kullanýlmalarý gerekir. Örneðin “I will pay back” (borcumu ödeyeceðim), “I jump
down” (atladým) gibi.
11.3 Bilgisayarla Çeviri Yöntemleri
Bir dilde yazýlmýþ olan bir metni ya da konuþmayý, diðer dilde yazýlý bir metne ya da konuþmaya
çevirme iþleminde bilgisayar kullanýlýyor ise bu eyleme “Bilgisayarla Çeviri- BÇ” adý
verilmektedir. Bu tanýmdan da anlaþýlacaðý gibi, diller arasý çeviri eyleminde bilgisayar
desteðinden yaralanýlmasý, en genel baðlamda BÇ olarak deðerlendirilmektedir. Bilgisayarla
gerçekletirilecek çeviriler þu özelliklere sahip olmalýdýr:
• Çeviriler insan desteði ve katkýsý olmadan gerçekleþebilmelidir.
• Hedef dildeki çeviri doðru anlaþýlabilecek nitelikte olmalýdýr.
• Çeviri yazýlýmý, çeviri iþlemini konudan baðýmsýz yapabilmelidir.
Bilgisayarlý çeviri sürecinde kullanýlan;
• Kural tabanlý
• Ýstatistiksel ve
• Örnek tabanlý
yöntemler aþaðýda açýklanmýþtýr:
11.3.1Kural Tabanlý Çeviri Yöntemleri
Kural tabanlý çeviri yöntemlerinde, kaynak tümcesinin çeþitli bilgi seviyelerinde gösterimlerini
oluþturduktan sonra bu bilgi seviyesinde aktarým yapýlmasýný öngören bir dizi yöntem kullanýr.
Bu yöntemleri görselleþtirmek için Vauquois Üçgeni yaygýn olarak kullanýlýr, Þekil-11.7.
11.3.1.1 Doðrudan Aktarým
En temel çeviri türü, kaynak dildeki sözcüklerinin karþýlýklarýnýn bulunarak hedef dile
çevrilmesidir. Ancak bu basit yöntemde bile birçok sorunla karþýlaþýlmaktadýr. Bunlarýn en
önemlisi çevrilecek sözcüðün birebir karþýlýðýnýn bulunmadýðý durumlardýr. Bu sorunlara
sözlüksel belirsizlik denilmektedir. Önceki kýsýmda bu konu ayrýntýlý biçimde açýklanmýþtýr.
Her ne kadar doðrudan aktarým yönteminde tümce üzerinde çözümleme yapýlmasý gerekmese de
birçok uygulamada biçimbilimsel çözümleme de yapýlmaktadýr.
11.3 Bilgisayarla Çeviri Yöntemleri – 193
11.3.1.2 Sözdizimsel Gösterimin Aktarýmý
Bilgisayarlý çeviri yöntemleri arasýnda diðer bir yöntem de sözdizimsel temelde çeviri
yapmaktýr. Buna göre kaynak dildeki sözcük öncelikle sözdizimsel olarak ayrýþtýrýlýr ve elde
edilen aðaç yapýsý, hedef dilde ayný anlamý taþýyan aðaç yapýsýna çevrilmeye çalýþýlýr,
Þekil-11.8.
194 – Bilgisayarlý Çeviri
Kaynak dilde tümce Hedef dilde tümce
Kaynak dilde
sezgisel aðaç
Hedef dilde
sezgisel aðaç
Aktarým
Ayrýþtýrma Oluþturma
Þekil-11.8: Sözdizimsel gösterimin aktarýmý
Kaynak dilde metin
Sözcükler Sözcükler
Sözdizimsel Yapý Sözdizimsel Yapý
Anlamsal Yapý Anlamsal Yapý
Dilden baðýmsýz
Anlamsal Yapý
Baðlamsal
Çözümleme
Baðlamsal
Üretim
Bilgi tabanlý aktarým
Anlamsal Aktarým
Sözdizimsel Aktarým
Doðrudan aktarým
Hedef dilde metin
Anlamsal
Çözümleme
Anlamsal
Üretim
Sözdizimsel
Çözümleme
Sözdizimsel
Üretim
Biçimbilimsel
Çözümleme
Biçimbilimsel
Üretim
Þekil-11.7:: Bilgi tabanlý yöntemlerin sýnýflandýrýlmasý-Vauqouis Üçgeni
Sözdizimsel yapýnýn aktarýlmasýndan sonraki süreç ise sözcüklerin aktarýlmasýdýr. Týpký
doðrudan aktarým yönteminde olduðu gibi bu aþamada da her iki dilde sözcükleri içeren bir
aktarým sözlüðü kullanýlýr. Bazý sistemlerde, bu aþamada ortaya çýkan sözcüksel belirsizliklerin
giderilmesi için kaynak tümce çözümlemeleri sýrasýnda anlamsal belirsizlik giderici yöntemler
uygulanmaktadýr.
11.3.1.3 Anlamsal Gösterimin Aktarýmý
Anlamsal çeviri, önce kaynak dildeki tümcenin sözdizimsel ayrýþtýrmasý yapýldýktan sonra
ayrýþtýrýlan yapýlara anlamsal görevlerin yüklenmesi ve aktarýmýn bu görevlere göre yapýlmasý
temeline dayanmaktadýr. Yöntem, sözdizimsel çeviride karþýlaþýlan yapý uyuþmazlýklarýnýn
bazýlarý çözebilmektedir.
11.3.1.4 Dilden Baðýmsýz Anlamsal Gösterimin Aktarýmý
Bilgisayarlý dil çevirisi yöntemlerinin sonuncusu ise “interlingua” adý verilen ve tümcenin
taþýdýðý anlamý, dilden baðýmsýz bir yapýda ifade eden yapýlarý kullanýlmasýdýr. Bu yöntemin
temel dayanak noktasý, farklý dillerde, anlamlarýn ifade edilme biçimlerinden baðýmsýz bir
anlam temsilidir.
Örnek olarak aþaðýdaki tümcenin gösterimi Þekil-11.9’da verilmiþtir:
Mehmet, bu güzel çöreði yemedi.
Bu yöntemin en yararlý yönü, ikiden fazla dil arasýnda çeviri yapýlacaðý zaman (1®N) ortaya
çýkmaktadýr. Diðer yöntemlerde bu tür bir iþlem, toplam N2 çeviri yapýlmasý anlamýna gelir.
Halbuki kaynak tümcenin dilden baðýmsýz anlamsal gösterimi elde edildikten sonra, bu
gösterime iliþkin tümcenin N adet dil için üretilmesi yeterlidir. Bu tür çeviri yöntemi, Avrupa
Birliði gibi birçok dilin kullanýldýðý ortamlar için kullanýþlý olmaktadýr.
Ancak “interlingua” adý verilen bu yapýnýn kullanýlmasý durumunda, doðal dil ile ifade edilen
anlamý, baþka bir biçimde sunacak olan “bilgi temsil diline” çevirmedeki güçlük gibi sorunlara
11.3 Bilgisayarla Çeviri Yöntemleri – 195
Olay yemek
Etmen Mehmet
Kip geçmiº
Olumluluk olumsuz
çörek
Tema Ýþaret bu
Özellikler tatlý
é ù
ê ú
ê ú
ê ú
ê ú
ê ú
ê é ù ú
ê ê ú ú ê ê ú ú
ê ê ú ú ë ë û û
Þekil-11.9 :Dilden baðýmsýz anlamsal
gösterim
neden olmaktadýr. Her dilin, belirttiði özellikler farklýlýk göstermektedir. Örneðin Türkçede 3.
tekil þahýslar için cinsiyet bilgisi yokken Ýngilizcede bulunmaktadýr. Benzer þekilde Türkçede
amca ve dayý ayrý sözcüklerle ifade edilirken Ýngilizcede her ikisi de uncle sözcüðü ile
belirtilir. Anlamsal gösterimin dilden baðýmsýz olabilmesi için her dilde farklý ifade edilen
kavramlarý içermek için de bir yol bulunmasý gerekmektedir. Bu farklýlýklardan dolayý dilden
baðýmsýz bir gösterimin tam olarak nasýl saðlanabileceði konusunda halen büyük eksiklikler
bulunmaktadýr.
11.3.2 Ýstatistiksel Yöntemler
Bilgi tabanlý bilgisayarlý çeviri yöntemlerinin ana konusu, kaynak dildeki tümcelerin hangi bilgi
seviyesinde (sözcük, sözdizimsel yapý, anlamsal yapý gibi) iþlem göreceðini belirlemek ve
seçilen gösterimin hedef dile nasýl aktarýlacaðýnýn yollarýný araþtýrmak üzerine yoðunlaþýr.
Ýstatistik tabanlý yöntemler ise tamamen sonuç odaklý çalýþýr ve aktarma iþleminin nasýl
yapýlmasý gerektiðinden çok nasýl sonuçlanmasý gerektiði üzerinde dururlar.
Ýstatistiksel çeviri yöntemi kavramý 1950’li yýllarda ortaya atýlmýþ olsa da gerçek anlamdaki
çalýþmalar 1990’lý yýllarda baþlamýþtýr Elektronik ortama aktarýlmýþ, koþut çevirilerden oluþan
metinlerin sayýsýnýn giderek artmasý ve bilgisayarlarýn yeteneklerinin hýzla artmasý, kural
tabanlý aktarým için kural karmaþasýnda zorlanan araþtýrmacýlarýn, istatistiksel çeviri
yöntemlerine doðru hýzlý bir kaymaya neden olmuþtur.
Ýstatistiksel yöntemlerin çalýþma mantýðý, çeviri iþlemini, Shannon’un Gürültü Kanal Modeli
(Noisy Channel Model) uyarýnca bozulmuþ bir iþareti düzeltme olarak deðerlendirmektedir. Bu
yaklaþýma göre hedef dildeki tümce H, iletim kanalýndan geçerken kanaldaki gürültü nedeniyle
deðiþmiþ ve çýkýþta kaynak dildeki tümce K oluþmuþtur. Yöntemin ilkesi, iletim kanalýnýn çýkýþ
ucunda gözlenen kaynak dildeki tümce K’dan yola çýkarak, gönderilen asýl metine yani “hedef
dildeki” tümceye ulaþmaktýr. Bunu saðlamak üzere aþaðýdaki denklemin çözümünün bulunmasý
yeterli olacaktýr:
H P H K
H Hedef Dil
=
Î
argmax ( | ) (11.1)
Denklem (11.1) ’deki olasýlýk deðerini Bayes kuralýna göre tekrar yazarsak:
H P K H P H
H Hedef Dil P K
=
Î
argmax ( | ) ( )
( )
(11.2)
Bu denklemde P(K) olasýlýðý bütün H tümceleri için sabit olduðundan argmax iþleci için sonucu
deðiþtirmez. Bu durumda denklem (11.2)’yi aþaðýdaki gibi yazabiliriz:
H P K H P H
H Hedef Dil
Çevirimodeli Dilmo
=
Î
argmax ( | ) ( ) 14243
deli
123 (11.3)
196 – Bilgisayarlý Çeviri
Bu denklemde iki bileþen göze çarpmaktadýr. Bunlardan P(K|H), çeviri modeli olarak
adlandýrýlýr ve hedef dildeki H tümcesinin, kaynak dildeki K tümcesinin çevirisi olma olasýlýðýný
belirtir. Ýkinci bileþen ise H tümcesinin, hedef dildeki olasýlýðýný belirtir. Bu iki olasýlýk
deðerinin çarpýmýný en çoklayan H tümcesi sonuç olarak üretilir.
Denklem (11.3)’ün sezgisel açýdan yorumu ise, kaynak dildeki K tümcesinin en yakýn çevirisi
olma (çeviri modeli bileþeni) ve ayný zamanda da hedef dil için akýcý ve geçerli bir tümce olma
(dil modeli bileþeni) koþullarýný birlikte saðlayan en olasý H tümcesinin bulunmasýdýr.
Sonuç olarak istatistiksel yöntemlerle bilgisayarlý çeviri yapabilmek için aþaðýdaki üç bileþenin
elde edilmesi gereklidir:
• P(H)’nin hesaplanabilmesi için hedef dil için bir Ýstatistiksel Dil Modeli (ÝDM)
• P(K|H)’nin hesaplanabilmesi için bir çeviri modeli
• Bütün bu olasýlýk deðerlerini kullanarak verilen bir K tümcesi için en olasý H
tümcesini üretebilen bir çözücü
Gerekli dil modelleri sadece hedef dil için üretilmek zorunda olduðundan bu dil modellerinin
oluþturulmasý çeviri modelinin üretilmesine göre daha kolaydýr.
Çeviri modelinin oluþturulmasý için, kaynak tümcedeki sözcük yada sözcük öbeklerinin, hedef
dilde hangi sözcük ya da sözcük öbeklerinin karþýlýðý olduðu (ürettiði) bilgisi gereklidir. Bu
bilgileri içeren çok sayýda tümce üzerinde çeþitli tekniklerle gerçeklenen hesaplamalar
sonucunda çeviri modeli hesaplanmaktadýr. Bu amaçla, birbirlerinin çevirisi olan, hedef ve
kaynak dildeki büyük miktarda (genellikle milyonlarca tümceden oluþan) metinler önce tümce
11.3 Bilgisayarla Çeviri Yöntemleri – 197
P(H)
Giriþ
H
Dil modeli P(H) Aktarým modeli
P(K|H)
Çýkýþ
K
En olasý
tümce H
Kaynak
Tümce
P(K|H)
Ýletme (Üretme)
Gürültülü iletiþim kanalý
Argmax
Çözme
X
Þekil-11.10: Gürültü Kanal Modeli uyarýnca çeviri iþlemi
bazýnda daha sonra da sözcük/sözcük öbeði bazýnda paralelleþtirilir. Bu iþlemlere tümce
hizalama, sözcük hizalama, sözcük öbeði hizalama adý verilir.
Ýstatistiksel çevirinin son bileþeni ise çözücüdür. En olasý çeviri olan H tümcesinin nasýl
bulunacaðý matematiksel olarak bilinse de, hedef dildeki olasý bütün tümceleri üreterek
bunlardan denklem (11.3)’e göre en olasý H tümcesini belirlemek pratik olarak olanaksýzdýr. Bu
amaçla demetli arama gibi daha verimli arama yöntemleri kullanýlabilir.
11.3.3 Örnek Tabanlý Yöntemler
Örnek tabanlý yöntemler, her iki dilde karþýlýklý tümceler içeren tümcelerden oluþan bir derlemi
kullanarak “örnekseme” yoluyla çeviri ilkesini kullanýr. Çalýþma ilkesinden dolayý
“örneksemeyle çeviri” olarak da isimlendirilir. Yöntemin çeviri üzerindeki temel varsayýmlarý
þunlardýr:
• Ýnsanlar basit tümceleri derinlemesine dilbilgisi kurallarýyla çevirmezler.
• Aksine, insanlarýn çeviri yaparken ilk adýmlarý, kaynak tümceyi belirli alt öbeklere
parçalamaktýr. Daha sonra bu öbekleri hedef dile çevirir ve son adýmda da bu öbekleri
uygun biçimde birleþtirerek daha uzun sonuç tümcesini üretir.
• Öbeklerin çevrilmesinde ise daha önceden “akýlda kalan” örneklere örnekseme yapýlýr.
Örneðin aþaðýdaki iki çeviriyi ele alalým:
A man eats vegetables « Hito wa yasai o taberu
Acid eats metal « San wa kinzoku o okasu
Bu iki örnek tümceye benzetilerek aþaðýdaki girdi tümcesi çevrilmek istensin:
He eats potatoes
Kuþkusuz çeviri iþlemi için bir aktarým sözlüðü gereklidir. Ama buradaki asýl sorun Ýngilizce eat
eylemi için olasý iki Japonca karþýlýktan (taberu ve okasu) hangisinin kullanýlacaðýna karar
vermektir. Yöntem, doðru karar vererek taberu eylemini seçer çünkü tümcenin diðer öðeleri he
ve potatoes sözcükleri, örneklerden man ve vegetables sözcüklerine, acid ve metal
sözcüklerinden anlamsal olarak daha yakýndýr. Benzer mantýkla aþaðýdaki giriþ tümcesi için de
okasu eylemi seçilir:
Sulfric acid eats iron.
Sözcüklerin anlamsal olarak birbirlerine yakýnlýk ve uzaklýklarý, bir sözlük ve kavramlar dizini
kullanýlarak bulunur. Kavramlar dizini, sözcüklerin eþ/zýt anlamlýlarýný, alt/üst kavramlarýný,
parça/bütün iliþkinlerini de içeren geniþ kapsamlý bir sözlük olarak deðerlendirilebilir.
198 – Bilgisayarlý Çeviri
Eðitim derlemindeki tümceler çoklukla birbirinden sadece tek sözcük farklý olacak þekilde
seçilir. Bu sayede yöntemin tümcelerin alt parçalarýný daha kolay öðrenmesi saðlanýr.
How much is that red umbrella? « Ano akai kasa wa ikura desu ka?
How much is that small camera? « Ano chiisai kamera wa ikura desu ka?
Bu örneklerden aþaðýdaki bilgiler çýkartýlýr:
• How much is that X? « Ano X wa ikura desu ka?
• red umbrella « akai kasa
• small camera « chiisai kamera
Öðrenilen bu bilgiler daha sonraki çevirilerde kullanýlmak üzere saklanýr. Son geliþmelerle, bu
kurallarýn saklanmadan çalýþma anýnda çýkartýlarak kullanýlmasý yoluna gidilmiþtir. Bu yöntem
yayýnlandýktan sonra Türkçe dahil birçok dilde çalýþmalar yapýlmýþtýr.
11.4 Çeviri Kalitesinin Deðerlendirilmesi
Geliþtirilen bilgisayarlý çeviri yöntemlerinin ve yöntemler üzerinde yapýlan deðiþikliklerinin
sonuçlarýnýn incelenmesi için üretilen sonuçlarýn, yani çevirilerin doðruluðu ve baþarýsý
ölçülmelidir.
Çeviri kalitesinin ölçülmesi için en basit yol, sistem çýktýlarýnýn insanlar tarafýndan çeþitli
yönlerden (üretilen tümcenin akýcýlýðý, kaynak tümcedeki anlamýn aktarýlmasýndaki doðruluk
gibi) derecelendirmesidir. Üretilen çýktýlarý insanlar kullanacaðý için en uygun deðerlendirme
yöntemi aslýnda bu olmasýna karþýn, hem maliyet açýsýndan çok pahalý hem de hýz açýsýndan
oldukça yavaþtýr. Ayrýca aktarým sistemlerinin sürekli geliþtirildiði ve her yapýlan deðiþikliðin
etkilerini görmek için böyle bir deðerlendirmeye gereksinim duyulduðu göz önüne alýnýrsa bu
yöntemin yapýlabilirliði oldukça azalmaktadýr.
Bazý deðerlendirme sistemleri ise baþarým ölçütü olarak, sistem tarafýndan üretilen çevirinin bir
çevirmen tarafýndan düzeltilmesi sürecinin karmaþýklýðýný ölçme esasýna dayanmaktadýr. Bu tür
yöntemlerin çýkýþ fikri, bilgisayarlý çeviri sistemlerinin çýktýlarýnýn genel olarak insan emeði ile
düzeltilerek kullanýldýðýný dolayýsý ile sistemin baþarýsýnýn, çevirmenin harcadýðý çaba ile
ölçülebileceði görüþüdür. Bu tür ölçme yöntemleri, çevirmenin harcadýðý çabayý, aday çeviri
üzerinde tüm düzeltmeleri yapmak için, tuþ takýmýnda kaç defa tuþa basýldýðý ya da çevirmen
tarafýndan düzeltilen son sürümü ile aday arasýndaki en kýsa deðiþim uzaklýðý (minimum edit
distance) deðeri ile orantýlý olarak hesaplar.
Deðerlendirmede izlenebilecek bir baþka yol da otomatik yöntemlerle deðerlendirme
yapmaktýr.
11.4 Çeviri Kalitesinin Deðerlendirilmesi – 199
11.4.1 BLEU/NIST
BLEU yöntemi, IBM tarafýndan 2002 yýlýnda geliþtirilmiþtir . Deðerlendirme mantýðý, sistem
çýktýsý aday tümcelerin, çevirmenler tarafýndan elle çevrilmiþ k adet referans çeviri ile olan
benzerliðinin ölçülmesine dayanýr. Benzerliðin ölçülmesi ise, sistem çýktýsýndaki sözcüklerin
(1-gram) ve sözcük dizilerinin (2,3,4,…-gram), referans çevirilerdeki sözcük ve sözcük dizileri
ile eþleþtirilmesiyle yapýlýr. Uygulamada dörtten uzun sözcük dizilerinin eþleþtirilmesinin
gereksiz olduðu görülmüþtür.
Çevirinin doðasý gereði bir tümcenin, ayný anlamý taþýyan birden fazla çevirisi olabilir. Sözcük
ve ifade seçimlerindeki bu serbestlik derecesi, deðerlendirme aþamasýnda birden fazla referans
çeviri kullanýlarak çözülmeye çalýþýlmýþtýr.
Her n-gram mertebesi için, C derlemi içindeki her S aday tümcesi için hesaplanan deðiþtirilmiþ
keskinlik deðeri pn þu þekilde bulunur:
P
A ngram
A ngram n
SeC ngram S eþleþen
ngram
= Î
Î
å å det ( )
det( ) SeC S å å (11.4)
Bu denklemde, çeviri aday tümcesinde yer alan ngram (yani sözcük yada sözcük dizisi),
referans çevirilerde birden fazla defa geçse de bir eþleþme olarak sayýlýr.
BLEU yöntemi aðýrlýklý olarak keskinlik (precision) ölçütüne dayanmaktadýr. Birden fazla
referans çeviri kullanýlabildiði için anma deðerini hesaplamak zordur. Bu nedenle, referans
çevirilerden çok daha kýsa bir aday çevirinin, yüksek keskinlik deðeri sayesinde yüksek BLEU
puanlarý almasýný engellemek amacýyla bir kýsalýk cezasý tanýmlanmýþtýr:
BP
e er c r
e r e er c r =
>
£
ìíî

1
1
ð
/ e ð (11.5)
Bu denklemde c derlemdeki aday çevirilerin tamamýnýn toplam uzunluðunu, r ise etkin
(effective) referans uzunluðunu göstermektedir. Etkin referans uzunluðu, referans tümceler
derlemi içerisinde, kendi aday tümcesinin uzunluðuna en yakýn olan referanslarýn uzunluklarý
toplamýdýr. Bu tanýmlamalardan sonra BLEU puaný aþaðýdaki gibi hesaplanýr:
BLUE BP w P n n
n
N
= ´
= å
exp( log )
1
(11.6)
BLEU deðeri temel olarak eþleþen n-gram oranlarýnýn geometrik ortalamasýnýn bulunmasýyla
hesaplanýr ve 0 ile 1 aralýðýndadýr. BLEU puanýn 1 olmasý, aday çevirilerin, referanslardan en az
1 tanesi ile birebir ayný olduðunu göstermektedir.
Yapýlan çalýþmada, bir deneme kümesindeki tümcelerin çevirilerinin BLEU puanlarý ile seçilen
hakemlerin çevirilere verdikleri puanlar karþýlaþtýrýlmýþ ve BLEU puanlarý ile bu kiþilerin
deðerlendirmeleri arasýnda ilinti olduðu gösterilmiþtir .
200 – Bilgisayarlý Çeviri
NIST yaklaþýmý da temel olarak BLEU ile ayný deðerlendirme adýmlarýný izlemesine karþýn
n-gram eþleþmelerinin geometrik ortalamasý yerine aritmetik ortalamasýný kullanýr ve
hesaplanan pn deðerlerini n-gramlarýn sýklýklarý ile iliþkilendirilir (daha az sýklýða sahip eþleþme
daha önemlidir) .
Son yýllarda yapýlan çalýþmalar sonucunda BLEU deðerlendirme sisteminin bazý olumsuz
yanlarý ortaya çýkartýlmýþtýr. Örneðin yüksek BLEU puanlarýnýn, her zaman çevirilerin daha
kaliteli olduðunun bir göstergesi olmadýðý, tersine BLEU puanlarýnda artýþ elde edilerek üretilen
çevirilerin kalitesinin yükseltilemeyebileceði ortaya çýkartýlmýþtýr. Ancak BLEU yönteminin
otomatik olmasý ve insan emeði gerektiren deðerlendirmelere oranla çok daha ucuz ve hýzlý
olmasý gibi nedenlerden dolayý günümüzde BLEU yöntemi yaygýn olarak kullanýlmaktadýr.
Anýlan nedenlerden ötürü BLEU yönteminin farklý (en azýndan istatistiksel – kural tabanlý gibi
farklý aktarým yaklaþýmlarý kullanan) sistemlerin baþarýlarýnýn karþýlaþtýrýlmasýnda
kullanýlmamasý gerektiði, BLEUnun daha çok tek bir sistem üzerinde yapýlan ardýþýk
deðiþikliklerin etkilerini deðerlendirmede kullanýlmasýnýn uygun olacaðý görüþü aðýrlýk
kazanmýþtýr .
11.4.2 F Deðeri
F-deðeri, bilgi getiriminde kullanýlan keskinlik ve anma deðerlerinin harmonik ortalamasý
olarak tanýmlanabilir. Bu yöntem, aday tümce ile referans tümce arasýnda, daha uzun sözcük
dizisi eþleþmelerini kayýracak biçimde “en uzun eþleþmeyi” bulmak üzerine yoðunlaþýr. Bu
eþleþmenin bulunmasýndan sonra keskinlik ve anma deðerleri, bulunan bu en uzun eþleþme EUE
sözcük sayýsý ile, sýrasýyla aday A ve referans R tümcelerindeki sözcük sayýlarýna bölünerek
bulunur:
Keskinlik A R EUE A R
A
( | ) | ( , )|
| |
= (11.7)
Anma A R EUE A R
R
( | ) | ( , )
| |
= (11.8)
11.4.3 Meteor
Meteor ölçütü, F-ölçütü’nü birkaç yönden deðiþtirerek kullanmaktadýr . Meteor deðerlendirme
sisteminde bazý dilbilimsel süreçler deðerlendirme aþamasýna dahil edilerek doðrudan sözcük
eþleþmeleri yerine sözcük köklerinin de eþleþmesine olanak tanýnmýþtýr. Ayrýca Meteor
yönteminde, anma deðeri üzerinde aðýrlaþtýrma yapan bir harmonik ortalama kullanýlýr :
F PR
R P ort =
+
10
9
(11.9)
11.4 Çeviri Kalitesinin Deðerlendirilmesi – 201
Keskinlik ve anma deðerlerinin sözcük eþleþmesine (1-gram) baðlý olmasýndan dolayý daha
uzun eþleþmeler deðerlendirmeye alýnmamaktadýr. Yöntem, bu açýðý kapatmak amacýyla bir
ceza katsayýsý içermektedir. Bu katsayý hesaplanmadan önce, aday ve referans tümcede
birbirlerinin karþýlýðý olan sözcük gruplarý (chunks) oluþturulur. Bu sözcük gruplarýný
oluþturulmasýnda tek kýsýt, hem aday hem de referans tümcede birbirlerinin karþýlýðý olan
sözcüklerin sýralarýnýn grup içinde de ayný kalmasýdýr. Örneðin “daha sonra beraber eve gittiler”
aday çevirisi ile “daha sonra hep beraber eve gittiler” referans çevirisinde iki grup oluþur : (1)
“daha sonra” (2) “beraber eve gittiler”. Bu gruplamadan sonra ceza katsayýsý ve sonuç puaný
aþaðýda formüllere göre hesaplanýr:
Ceza gruplar
eþleþensözcükler
= ´
é
ë ê
ù
û ú
0 5
3
, | |
| |
(11.10)
METEOR = Fort ´ (1 -Ceza) (11.11)
Meteor yönteminin en önemli olumsuz yönü, birden fazla referans çeviri olduðunda ortaya
çýkmaktadýr. Her referans çeviri için bir puan hesaplanarak en yüksek puan çýktý olarak
kullanýlýr. Oysa bazý durumlarda çevirinin bir bölümü (örneðin özneyi oluþturan ad öbeði)
referanslardan bir tanesinin bir bölümü ile eþleþirken, çevirinin baþka bir bölümü (örneðin
eylem öbeði) baþka bir referans ile eþleþebilir. Yöntemin bir baþka bir olumsuz tarafý ise
puanlamada kullanýlan katsayýlarýn deðerlerinin belirlenmesidir. Geçerli katsayýlar
deneme-yanýlma yöntemi ile bulunduðundan en uygun katsayýlar olup olmadýðý þüphelidir.
11.5 Akraba ve Bitiþken Diller Arasýnda Çeviri
Akraba diller arasýndaki yapýsal benzerlikler yardýmý ile, bu diller arasýnda bilgisayarlý çevirinin
gerçekleþtirilmesi, farklý dil aileleri arasýnda çeviri yapmaktan, en azýndan sezgisel olarak, daha
kolay görünmektedir. Tamamen farklý dil ailelerinde sýnýflandýrýlan diller arasýnda çeviri
yapmanýn zorluðu.
A. C. Tantuð tarafýndan gerçekleþtirilen çalýþmada akraba diller arasýnda bilgisayarlý metin
çevirisi için istatistiksel ve bilgi tabanlý yöntemlerin beraber kullanýldýðý karma modeller
önerilmiþtir. Önerilen bu karma modeller sayesinde hem istastiksel yöntemlerin en maliyetli
yönü olan hizalanmýþ eðitim kümesi gereksinimi ortadan kaldýrýlmýþ olmakta hem de yüksek
baþarýlar elde eden istatiksel yöntemlerin sunduðu getirilerden faydanýlmýþ olunmaktadýr.
Geliþtirilen modeller, temelde bitiþken yapýdaki akraba diller için tasarlanmýþtýr. Çalýþma
kapsamýnda önerilen modeller Türk dil ailesindeki dillerin birbirine çevrilmesi amacýyla
incelenmiþ, seçilen bir dil çifti için uygulama gerçeklenerek modellerin baþarýmý ortaya
konulmuþtur. Ancak geliþtirilen modeller Türk dillerine özgü olmayýp, dilden baðýmsýz
düþünülmüþ, akraba ve bitiþken olan tüm dil çiftleri için kullanýlabilir niteliktedir.
Modellerin çýkýþ noktasý (11.12) baðýntýsýyla verilmiþtir. Bu denklem aþaðýdaki tekrar
verilmiþtir :
202 – Bilgisayarlý Çeviri
H P K H P H
H Hedef Dil
çevirimodeli Dilmo
=
Î
argmax14(2|43) ( )
deli
123 (11.12)
Ýki bileþenden oluþan bu denklemin dil modeli bileþeni, sadece hedef dil için hazýrlandýðýndan,
çeviri modeline göre daha kolay oluþturulabilir. Çeviri modelinin oluþturulmasý için çok sayýda
hizalanmýþ tümce çiftlerine gereksinim duyulmaktadýr. Ancak günümüzde dahi her dil çifti için
birbirlerinin çevirisi olan hizalanmýþ tümcelerin yeterli miktarlarda bulunmasý mümkün
olmamaktadýr. Amacýmýz, bu olumsuz koþullarda da istatistiksel çevirinin kullanýlabilir hale
gelmesi için, istatistiksel çevirideki bu “çeviri modeli olasýlýk daðýlýmý” yerine kullanýlabilecek
bir modelin oluþturulmasýdýr.
Kuramsal açýdan denklem (11.12) hedef dildeki bütün tümceler içerisinden, çeviri ve dil
modellerine göre en yüksek olasýlýða sahip tümcenin bulunmasý anlamýna gelmektedir.
Ancak bir dildeki olasý tümcelerin sayýsýnýn sonsuz olmasý nedeni ile uygulamada çeviriyi
üreten çözücü, hedef dildeki H tümcesini adým adým (sözcük ya da sözcük öbeði adýmlarý ile)
üretmeye baþlar . Her adýmda, çeviri modeline ve dil modeline göre en yüksek olasýlýða sahip
seçenek ya da seçeneklerden devam ederek sonunda tüm çeviri tümcesini oluþturur. Bu çalýþma
düzeninde çeviri modeli, kaynak tümcenin sözcüklerinin ya da sözcük öbeklerinin karþýlýðý
olabilecek tümceleri (olasýlýklarýna göre) oluþtururken, dil modeli bileþeni de oluþan bu
tümceler içinden hedef dil için en uygununu bulmaya çalýþýr. Bir anlamda “çeviri modeli”, hedef
dildeki tüm tümcelerde arama yapmak yerine, kaynak tümcenin çevirisi olabilecek tümceleri
olasýlýklarýna göre seçerek aramayý yönlendirmektedir.
Bu çalýþmasýnda önerilen yaklaþým, akraba diller, örneðin Türk dilleri, arasýnda çeviri söz
konusu olduðunda, olasýlýk daðýlýmý esasýna göre çalýþan “çeviri bileþeninin”, kural tabanlý
çalýþan “aktarým fonksiyonu” ile deðiþtirilerek istatistiksel dil modeli ile beraber kullanýlmasý
yönündedir. Bu yaklaþým sezgisel olarak, dil modeline göre en uygun tümceyi, “çeviri
modelinin yönlendirmesi ile hedef dildeki bütün tümceler kümesinde aramak yerine, aktarým
fonksiyonu tarafýndan aktarýlan sözcük/sözcük öbekleri ile oluþturulabilecek tüm olasý tümceler
kümesinde aramak” olarak yorumlanabilir. Bu sayede, Türk dilleri gibi birbirleri ile benzer
akraba diller arasýnda kullanýlabilecek, bilgi tabanlý yöntemler ve istatistik tabanlý yöntemlerin
birleþimi olan karma bir çeviri modeli önerilmiþtir.
Önerilen bu modele göre denklem (11.12)’nin güncellenmiþ hali aþaðýdaki gibidir:
H P H
H F K
dilmodeli aktarým
fonksiyonu
^
( )
= arg max ( )
Î 123
123 (11.13)
Önerdiðimiz çeviri modeli de iki bileþenden oluþmaktadýr. Aktarým fonksiyonu, K tümcesinin
karþýlýðý olabilecek tüm tümceleri üreten bir fonksiyon olarak görev yaparken, dil modeli ise
klasik anlamda kullanýlarak üretilen karþýlýklar arasýndan hedef dile göre en yüksek olasýlýk
deðerine sahip tümcenin seçilmesini saðlar.
11.5 Akraba ve Bitiþken Diller Arasýnda Çeviri – 203
Ancak önerilen bilgisayarlý çeviri yöntemi ile istatistiksel çeviri yöntemi arasýnda vurgulanmasý
gereken önemli bir farklýlýk bulunmaktadýr. Ýstatistiksel çeviri sisteminde yer alan çeviri modeli,
kaynak dildeki tümcenin karþýlýðý olabilecek aday tümceler kümesini üretirken ayný zamanda
bunlar için birer olasýlýk deðeri de atamaktadýr. Bu olasýlýk deðeri, dil modeli olasýlýðý ile
birleþtirilerek en yüksek olasýlýklý çevirinin belirlenmesinde rol oynar. Oysa A. C. Tantuð
tarafýndan önerilen aktarým modelindeki aktarým fonksiyonu, sadece kaynak tümcenin karþýlýðý
olabilecek tümceler üretmektedir; bunlara herhangi bir olasýlýk deðeri atanmamaktadýr. Bu
tümcelerden en uygun olaný ise dil modeli bileþeni tarafýndan en yüksek olasýlýklý tümcenin
seçilmesi ile belirlenir.
Seçilen dil çiftinin bitiþken olmasý durumunda aktarým fonksiyonu ve dil modeli bileþeni,
özelleþtirilerek kullanýlmalýdýr. Sonraki bölümlerde önerilen aktarým fonksiyonu ve dil modeli
türlerinin ayrýntýlarý ele alýnmýþtýr.
11.5.1Aktarým Fonksiyonu Modelleri
Akraba diller söz konusu olduðunda, diller arasýndaki benzerlikleri kullanarak çeviri sürecini
basitleþtirmenin en kolay yolu, sözcük bazýnda çalýþan doðrudan aktarým modelinin
kullanýlmasýdýr. Özellikle sözdizimi açýsýnda büyük farklýlýklar göstermeyen akraba diller
arasýnda daha uygun olan bu doðrudan aktarým modeli, bitiþken diller için, sözcük kökleri ile
birlikte biçimbilimsel yapýlarýn da aktarýlmasýný saðlayacak biçimde deðiþtirilmiþtir.
11.5.1.1 Aktarým Modeli 0 – Temel Model
Temel aktarým modelinin matematiksel açýklamasý aþaðýda verilmiþtir.
K, toplam N adet sözcükten oluþan (k1,k2,….kn) kaynak dilde bir tümce olsun.
K k k k k n
= = N 1 2 1 …. (11.14)
Bitiþken diller söz konusu olduðunda, her bir sözcüðün hedef dile aktarýlmasý için öncelikle
biçimbilimsel çözümlemesinin yapýlmasý, sözcük kökünün ve diðer biçimbilimsel yapýlarýn
bulunmasý gereklidir. Buna göre biçimbilimsel çözümleme aþamasý, giriþi kaynak dilde
yüzeysel biçimdeki sözcük ki, çýkýþý ise bu sözcüðün olasý tüm biçimbilimsel çözümlemelerini
içeren bir küme olan C(ki) çözümleme fonksiyonu ile modellenir.
C k {c c c } i i i ini ( ) = , ,…, 1 2 (11.15)
Burada ni , ki sözcüðü için üretilen biçimbilimsel çözümlemelerin toplam sayýsýdýr ve ni ³ 1
þeklinde alttan sýnýrlýdýr. Üretilen her bir biçimbilimsel çözümleme, kök ve bu köke eklenen
deðiþken sayýda biçimbilimsel özelliklerden oluþur:
c kök b b b ij ij ij ijk ijmi
= + + + + 1 … … (11.16)
Biçimbilimsel özellikler bijk ve sözcük kökleri kokij aktarýlmasý A(cij) aktarým fonksiyonu ile
saðlanýr. Bu aktarým fonksiyonu giriþ deðeri olarak, biçimbilimsel bir çözümleme cij’yi almakta,
204 – Bilgisayarlý Çeviri
çýkýþ olarak ise sözcük kökünün ve biçimbilimsel özelliklerin hedef dile aktarýlmýþ halini
üretmektedir:
A c {a a a } ij ij ijk ijnij ( ) = ,…,+ ,…, 1 (11.17)
Sözcük köklerinin çevrilmesinde birden-çoða iliþki olduðu için bir çözümlemeye karþýlýk
birden fazla çeviri oluþabilmektedir. Dolayýsý ile A fonksiyonu çokdeðerli bir fonksiyon olarak
iþlev görmektedir. Bu koþullarda üretilen sözcük sayýsý nij ³ 1 olacaktýr. Kaynak tümcedeki ki
sözcüðünün cj çözümlemesine karþýlýk olarak üretilen her bir aijk çýktýsý, çözümleme ile benzer
yapýya sahiptir:
a kökh bh bh bhijkm ijk ijk ijk ijk ijk = + + + + 1 2 … (11.18)
Burada kokh hedef dildeki kökü, bh ise hedef dildeki biçimbilimsel özellikleri göstermektedir.
Bütün bu tanýmlamalardan sonra, transfer fonksiyonun tanýmý yapýlabilir. Aslýnda tanýmlanmasý
amaçlanan aktarým fonksiyonu F, bir fonksiyon deðildir. F, bir baðýntý olarak tanýmlanmalýdýr.
Hedef dildeki tüm tümceler üzerinde tanýmlý olan bu baðýntý, yalnýzca “kaynak dildeki
sözcüklerin hedef dildeki karþýlýklarýndan oluþan bir dizi sözcüðü içeren” bir alt kümedir:
F K F k N A C A c A c
j
c C k
j Nj
j cNj
( ) ( ) ( ) ( ) … ( )
( )
= = ´ ´ ´
Î Î
1 1 2
1 1
U
c j C(k ) C(kN )
U U
2 Î 2
=
Î =
Õ A c j
i c C k
N
ij i
( )
( )
1
1
U (11.19)
Eðer fi(K), F(K), baðýntýsýnýn i. elemaný olarak tanýmlanýrsa, geliþtirilen aktarým modelimizin
amacý, olasý bütün çeviriler içerisinden en yüksek olasýlýklý HB
^
‘yi bulmak olarak ifade
edilebilir. Buradaki alt indis B, oluþan tümcenin sözcüklerinin yüzeysel biçim yerine yapýsal
biçimde olduðunu belirtmektedir. En yüksek olasýlýklý tümcenin bulunmasý ise, E eðitim
derlemi üzerinde eðitilen bir L(E) dil modeli ile saðlanýr:
H B p f K L E
f K F K
i
i
^
( ) ( )
= arg max ( ( )| ( )
Î
(11.20)
Aktarým modelinin son aþamasý ise hedef dildeki biçimbilimsel üretici tarafýndan, dönüþtürülen
sözcük kökleri ve biçimbilimsel yapýlardan yüzeysel biçimlerin elde edilmesidir. Bu üretim
aþamasý ise bir U fonksiyonu ile temsil edilir:
H U H h h h B M
^ ^
= ( ) = … 1 2 (11.21)
Modelin son çýktýsý olan, kaynak dildeki sözcüklerin, hedef dildeki karþýlýklarýnýn sýralandýðý
tümceyi göstermektedir. Aktarým aþamasýnda birden çoða bir yöntem izlendiðinden, oluþan
çeviri tümcesinin sözcük sayýsý M ³ N’dir.
11.5 Akraba ve Bitiþken Diller Arasýnda Çeviri – 205
11.5.1.2 Aktarým Modeli I
Temel modelin en önemli olumsuzluðu, sözcük bazýnda sadece bire bir ya da birden çoða
aktarým yapýlmasýna izin vermesidir. Temel modelin bu kýsýtlamasý sonucu, kaynak tümcede
birden çok sözcükle ifade edilen yapýlar hedef dile doðru aktarýlamayacaktýr. Bu sorunu
gidermek amacý ile temel modele çoktan çoða aktarým yapmak üzere bir takým eklemeler
yapýlarak “Aktarým Modeli I” elde edilmiþtir. Bu eklemelerle öncelikle Çoklu Sözcük Gruplarý
(ÇSG) belirlenmiþ, daha sonra bu gruplar uygun þekilde hedef dile aktarýlmýþtýr.
Bitiþken diller için çoklu sözcük gruplarýnýn bulunma süreci, Ýngilizce, Çince gibi yalýtýmlý ya
da yalýtýmlýya yakýn dillerdeki kadar basit deðildir. Bunlar ve benzeri dillerde basit bir liste
kullanýlarak çoklu sözcük gruplarý belirlenebilirken, Türkçe, Fince, Japonca, Macarca gibi
bitiþken dillerde çoklu sözcük kümelerininn bileþenleri çeþitli biçimbilimsel deðiþikliklere
uðrayabilirler. Bu deðiþiklikler, ÇSG’lerin, basitçe bir listeden bakýlarak belirlenmesini
engellemektedir. Sonuç olarak, bitiþken dillerde ÇSG’lerin bulunmasý için tümcedeki
sözcüklerin kökleri ve diðer biçimbilimsel özellikleri gibi daha ayrýntýlý bilgilerle, düzenli
ifadeler ya da sonlu durumlu dönüþtürücüler gibi daha karmaþýk araçlara gerek duyulur.
Temel model tanýtýlýrken verilen matematiksel altyapýya baðlý kalýnarak ÇSG’lerin iþlenmesi ile
ortaya konulan yeni modelin matematiksel ifadesi aþaðýdaki gibi kurulmuþtur.
ÇSG’leri, bir ya da birden fazla sözcüðe ait biçimbilimsel çözümleme kümeleri arasýndan belirli
bir yönteme ya da kural dizisine göre seçilen elemanlardan oluþan sýralý eþleþmeler (ordered
pairs) olarak adlandýrýlabiliriz. Örneðin aþaðýda bir K tümcesinin ardýþýl üç sözcüðü (ki ki+1 ki+2)
için biçimbilimsel çözümleme sonuçlarý bulunmaktadýr:
C k {c c c c } i i i i x i ni ( ) ,…, ,…, ,…, , , , , = 1 2
C k {c c c c } i i i i x i ni ( ) ,…, ,…, ,…, + + , + , + , + , =
1 1 1 1 2 1 1 +1 (11.22)
C k {c c c c } i i i i x i ni ( ) ,…, ,…, ,…, + + , + , + , + , =
2 2 1 2 2 2 2 +2
Varsayalým ki ÇSG bulucu kurallar, bu üç sözcüðün çözümlemeleri içerisindeki ci,x , ci+1,y ve
ci+2,z çözümlemelerinin bir ÇSG oluþturduðunu belirlesin. Bu durumda bu üç elemanlý sýralý
eþleþmeler (ci,x , ci+1,y , ci+2,z) , G(K) kümesinin bir elemaný olur. Bu durumda G(K) aþaðýdaki
kümeler üzerinde tanýmlý bir baðýntý olmaktadýr:
G K C ki
i
N
( ) Í ( )
= Õ1
(11.23)
Tümceyi oluþturan bütün sözcüklerin tüm çözümlemelerinin kartezyen çarpýmý içerisinde
arama yapýlarak, kurallara uyan sýralý çiftler G(K) baðýntýsýnýn elemaný olarak belirlenir. Ancak
ifade bu þekli ile matematiksel olarak yanlýþtýr. Çünkü kartezyen çarpýmý ile oluþturulan
kümenin elemanlarýnýn hepsi, mutlak olarak N sözcükten oluþmalýdýr. Bu ise þu anlama
gelmektedir: sadece N sözcükten oluþmuþ ÇSG’leri iþlenebilir, yukarýda örnekteki (ci,x , ci+1,y ,
ci+2,z) gibi üç elemanlý bir sýralý eþleþme girdisi G(K) kümesinin elemaný olamaz.
206 – Bilgisayarlý Çeviri
Bunu düzeltmek için G(K) baðýntýsýnýn üzerinde tanýmlý olduðu kümelere etkisiz bir eleman
eklemek yeterli olacaktýr:
G K C k { } i
i
N
( ) Í ( ( ) È )
= Õ
e
1
(11.24)
ÇSG belirleyici kurallarýn, e girdisini boþ katar olarak yorumlayacaðý ve göz ardý edeceði
düþünüldüðünde, (ci,x , ci+1,y , ci+2,z) girdisi artýk (e, e,…, ci,x ,ci+1,y ,ci+2,z ,…,e,e) biçimine
dönüþerek G(K) kümesine eklenebilir.
Sözcük sözcük aktarma yapýlýrken, eðer sýradaki sözcüðün herhangi bir çözümlemesi cij, G(K)
içerisindeki ÇSG’lerin bir parçasý ise, bu sözcüðün hiçbir çözümlemesi aktarýlmaz. Ancak eðer
cij, bu ÇSG’nin son sözcüðü ise, cij yerine bu ÇSG birleþtirilerek aktarým fonksiyonuna
gönderilir. Buna göre yukarýda verilen (ci,x , ci+1,y , ci+2,z) örneðinin aktarýlma süreci aþaðýdaki
gibidir:
C k {c c c c } i i i i x i ni ( ) ,…, ,… , , , , = + 1 2
E C k { } i ( ( )) = Æ,Æ,…Æ,…Æ
C k {c c c c } i i i i x i ni ( ) ,…, ,… + + , + , + , + , = +
1 1 1 1 2 1 1 +1
E C k { } i ( ( )) , ,… ,… + = Æ Æ Æ Æ 1 (11.25)
C k {c c c c } i i i i x i ni ( ) ,…, ,… + + , + , + , + , = +
2 2 1 2 2 2 2 +2
E C k { B c c c } i i x i y i z ( ( )) , ,… ( , , ),… + , + , + , = Æ Æ Æ 2 1 2
Bu çalýþma düzenini saðlayan E fonksiyonunun tanýmý aþaðýda verilmiþtir:
E C
C e er j j n p p N c x
e er ij
ij i ij p
( )
ð ( : )( : ) ( )
= ð (
” £ £ ” £ £ ¹
Æ
1 1 1
$ £ £ ” £ £ = Ù ¹
$ £
+ j j n p p N c x x
B X e er j
i ij p p : )( : ) ( )
( ) ð ( :
1 1 2
1
1 e
j n p p N c x x i ij p p £ ” £ £ = Ù =
ì
í ï
î ï
+ )( :1 ) (3) 1 e
(11.26)
Denklem (11.26)’da yer alan xp, XÎG(K) sýralý eþleþmesinin p. elemanýdýr. B fonksiyonu ise X
sözcük dizisini, geçerli bir biçime getirmek için uygun þekilde birleþtirerek tek bir kök ve uygun
biçimbilimsel özellikleri içeren yapýya dönüþtüren bir birleþtirme fonksiyonudur.
E fonksiyonun üzerinde biraz açýklama yapmak uygun olacaktýr. Fonksiyonun (1). alt taným
aralýðýnda, K tümcesinin i. sözcüðü ki‘nin j. çözümlemesi cij’nin aktarýlýp aktarýlmayacaðýna
karar verilir. Eðer ki‘ye ait çözümlemelerden hiçbirisi, G(K)’da belirlenen ÇSG yapýlarýnýn
herhangi birisinin bileþeni olarak geçmiyorsa, cij olduðu gibi çýkýþ olarak üretilir. (2) ile
numaralandýrýlmýþ alt taným aralýðý ise, eðer ki sözcüðünün herhangi bir çözümlemesi,
G(K)’daki herhangi bir ÇSG’nin son bileþen (xp+1 ¹ e) dýþýndaki bir bileþeni ise , ki‘ye ait bütün
çözümlemelerin göz ardý edileceðini söylemektedir. Son taným aralýðý (3) bölgesinde ise, ki‘ye
ait bir çözümleme, G(K) baðýntýsýndaki herhangi bir ÇSG’nin son sözcüðü ise (xp+1 = e), cij
yerine ÇSG’nin tamamý (X) B fonksiyonu tarafýndan dönüþtürülerek üretilir.
11.5 Akraba ve Bitiþken Diller Arasýnda Çeviri – 207
ÇSG’lerin aktarýlmasý için bu tanýmlamalar yapýldýktan sonra, kaynak tümcenin olasý bütün
karþýlýklarýný üreten transfer fonksiyonun denklemi , aþaðýdaki gibi deðiþtirilir:
F K F k N A E c A E c
j
c C k
j
j c j C k
( ) ( ) ( ( )) ( ( ))
( ) (
= = ´ ´
Î Î
1 1 2
1 1 2 2
U
) ( )
U …´ U ( ( ))
Î
A E c Nj
cNj C kN
1
=
Î =
Õ A E c j
i c C k
N
ij i
( ( ))
( )
1
1
U (11.27)
Dil modelini kullanarak en yüksek olasýlýklý tümcenin seçildiði bundan sonraki denklemlerde
herhangi bir deðiþme olmaz.
11.5.1.3 Aktarým Modeli II
Geliþtirilen modellerdeki bir diðer eksiklik de aktarým kurallarýnýn sözcük bazýnda iþlem
görmesidir. Akraba diller arasýnda çeviri yapýlsa bile, sözcükler arasý iliþkiler her zaman
bulunur. Çeviri modelinin baþarýsýnýn arttýrýlabilmesi için bu iliþkiler göz önüne alýnarak
aktarým yapýlmalýdýr. Örneðin bazý Türk dilleri arasýnda çeviri yaparken, ortaçlarýn, niteledikleri
isimden bazý biçimbilimsel özellikleri almasý gerekmektedir. Bu ve buna benzer durumlarý
baþarýlý çevirebilmek için tümce genelinde iþlem gören bir takým aktarým kurallarý
tanýmlanmalýdýr. Tümce genelinde çalýþan aktarým kurallarý, tümcedeki sözcüklerin
biçimbilimsel bilgilerini kullanabileceði gibi bazý kurallar da sözcüklerin yüzeysel biçimlerine
gerek duyabilir.
Ancak mevcut aktarým fonksiyonu A, sadece sözcük kökleri ve sözcüðe ait biçimbilimsel
yapýlarýn aktarýmý saðlamaktadýr. Bunu geliþtirmek üzere denklem (11.21) aþaðýdaki gibi
deðiþtirilmiþtir:
H S U S H h h h Y B B M
^ ^
= ( ( ( ))) = … 1 2 (11.28)
Bu denklemde, hedef dilde oluþturulan tümceler üzerinde iþlem gören bir SB fonksiyonu
tanýmlanmýþtýr. Bu fonksiyona, giriþ olarak yapýsal gösterimde sözcüklerden oluþmuþ tümceler
kümesi gelir. Fonksiyon, her bir tümce üzerinde, sözcükler arasýnda tanýmlanan kurallara uygun
olarak aktarýmý gerçekleþtirilir. Tümcedeki sözcüklerin yüzeysel biçimlerine gerek duyarak
yapýlan deðiþiklikler ise SY fonksiyonu modellenmiþtir.
11.5.2 Bitiþken Diller Ýçin ÝDM Oluþturulmasý
Ýngilizce, Almanca gibi dillerden farklý olarak, Türkçe için dil modelleri oluþturulurken
sözcüklerin yüzeysel biçimlerinin kullanýlmasý, Türkçenin türetken ve çekimli yapýsýndan
dolayý seyrek veri sorununa yol açmaktadýr. Bu yüzden eðitim verisi olarak sözcüklerin
yüzeysel biçimleri yerine, sözcüklerin köklerinin ve diðer bazý biçimbilimsel özelliklerin
kullanýlmasý yoluna gidilmiþtir.
208 – Bilgisayarlý Çeviri
Yüzeysel biçim yerine, sözcüklere ait biçimbilimsel çözümleme sonuçlarýnýn tamamýnýn
kullanýlarak bir ÝDM oluþturulmasý durumunda, gene seyrek veri sorunu oluþmaktadýr. Seyrek
veri sorununu azaltmak için, biçimbilimsel çözümlemedeki tüm etiketler yerine bunlarýn
gruplanarak kullanýlmasý fikri ortaya çýkmýþtýr . Örneðin Türkçedeki her sözcük, kök ve bir veya
birden fazla çekim grubundan oluþmaktadýr. Çekim gruplarý birbirlerinden ^DB (derivation
boundary) ile ayrýlmaktadýr :
kök+ÇG1^DB+ÇG2^DB+…^DB+ÇGn
Burada ÇGi, sözcük türü ve çekim özelliklerini de içeren ilgili çekim grubunu ifade etmektedir.
Örnek olarak aþaðýda bir biçimbilimsel çözümleme sonucu verilmiþtir:
yararlanmanýn : yarar+Noun+A3sg+Pnon+Nom ÇG1
^DB+Verb+Acquire+Pos ÇG2
^DB+Noun+Inf2+A3sg+Pnon+Gen ÇG3
Bu örnekte, isim türlü yarar sözcüðünün sözcük türü, +lan yapým eki ile önce eyleme daha
sonra da +ma mastar eki ile de tekrar isme dönüþmüþtür. Bu dönüþme süreci içerisinde oluþan
her sözcük türünün de kendisine ait çekim özellikleri bulunabilir. Türetilmiþ bir sözcüðün etkin
sözcük türü, son ÇG’nin sözcük türü olarak kullanýlýr (örneðin etkin sözcük türü “isim”dir).
Tablo-11.2’de 1 M sözcükten oluþan bir derlem üzerinde gözlenen, kök hariç bütün etiketlerin
bulunduðu tam çözümlemelerin ve ÇG’lerin sayýlarý verilmiþtir. Bir köke eklenebilecek ek
sayýsýnýn sýnýrsýz olmasýna karþýn, derlem üzerinde yapýlan sayýma göre 10.531 farklý tam
çözümlemeye rastlanmýþtýr. Tam çözümlemeler ÇG’lere ayrýlarak ÇG’ler sayýldýðýnda 2.194
farklý ÇG’ye bulunmuþtur. Bu sonuçlar seyrek veri sorununun indirgendiði ortaya koymaktadýr.
Tablo-11.2: Derlemde Gözlenen Tam Çözümleme ve Çekim Grubu Sayýlarý
Kuramsal Üst Sýnýr Gözlenen Adet
Tam Çözümleme µ 10.531
Çekim Grubu 9.129 2.194
Sadeleþtirme açýsýndan yapýlan bir baþka genelleme de ÇG’lerden oluþan türetilmiþ bir
sözcüðün sözdizimsel açýdan baðlantýsýnýn, son ÇG’den çýkarak sonraki sözcüklerin
ÇG’lerinden herhangi bir tanesine baðlanmasý þeklinde ifade edilir.
11.5 Akraba ve Bitiþken Diller Arasýnda Çeviri – 209
11.6 Türk Dilleri Arasýndaki Benzerlikler
Türk dilleri anlam ve biçim açýsýndan incelendiðinde birçok benzerlik ve aynýlýk olduðu
görülür. Benzerlikler, sözcük daðarcýklarýndaki ortak sözcükler açýsýndan incelendiðinde
baskýn olarak adýllar, sýfatlar, ilgeçler, belirteçler, zamanla ilgili sözcükler, organ isimleri, doða,
bitki ve hayvan isimlerinde ortak kullanýmlarýn olduðu görülmektedir. Ayrýca sözdizimsel
açýdan bütün Türk dilleri özne-nesne-yüklem (SOV) sýrasýný kullanmaktadýr. Ortak sözcüklerin
dýþýnda Türk dillerinin benzerlikleri, biçimbilimsel açýdan incelendiðinde ise ek türlerinin ve
ekleniþ biçimlerinin çoðu kez ayný olduðu görülmektedir. Örneðin ’de bazý Türk dilleri için isim
durum ekleri verilmiþtir . Hemen hemen bütün Türk dillerinde özellikle adlara eklenen çekim
eklerinin türleri ve sýralarý aynýdýr. Büyük ünlü uyumu, küçük ünlü uyumu, ünsüz benzeþmesi
gibi bazý yazým kurallarý da hepsinde görülmese de bazý Türk dillerinde ortak olarak bulunur.
Tüm bu benzerliklere örnek olarak aþaðýda farklý Türk dillerinde ortak olarak kullanýlan iki
deyim verilmiþtir.
Türkçe : Aðýr kazan geç kaynar.
Azerbaycan : Aðýr qazan geç qaynayar.
Turkmen : Agyr gazan giç gaýnar.
Özbek : Çuqur därya tinç aqar.
Kýrgýz : Oor kazan keç kaynayt.
Kazak : Awur qazan keþ qaynaydý.
Turkçe : Dað daða kavuþmaz, insan insana kavuþur.
Azerbaycan : Dað daða govuþmaz, insan insana govuþur.
Turkmen : Dag daga duþmaz adama adama duþar.
Özbek : Tåð tåð bilän qavuþmas, adam adam bilän qavuþar.
Kýrgýz : Too tooðo koþulbayt, adam menen adam koþulat.
Kazak : Taw tawða qosýlmas, adam adamða qosýldý.
Görüldüðü gibi sözcük sýralarý çoðunlukla aynýdýr. Yalnýzca bazý sözcükler bazý Türk dillerinde
iki ya da daha fazla sözcükle ifade edilmektedir.
210 – Bilgisayarlý Çeviri
Tablo-11.3 : Bazý Türk Dilleri için Ýsim Durum Ekleri
Ad
Durum
Ekleri
Türkçe Azerice Türkmence Özbekçe Kýrgýzca Kazakça uygurca
Belirtme
Durumu
+ý (+i,+u,+ü)
+yý (+yi,+yu,+yü)
+ý (+i,+u,+ü)
+ný (+ni,+nu,+nü)
+y (+i)
+ny (+ni)
+ni
+ný (+ni,+nu,+nü)
+dý (+di,+du,+dü)
+tý (+ti,+tu,+tü)
+n
+ný (+ni)
+dý (+di)
+tý (+ti)
+n
+ni
Yönelme
Durumu
+a (+e)
+ya (+ye)
+a (+N)
+ya (+yN)
+a (+e, +ä)
+gä
+kä
+qa
+ga (+ge,+go,+gö)
+ka (+ke,+ko,+kö)
+na (+ne,+no,+nö)
+a (+e, +o,+ö)
+ða (+ge)
+qa (+ke)
+a (+e)
+ga (+ge)
+ka (+ke)
Kalma
Durumu
+da (+de)
+ta (+te)
+da (+dN) +da (+de) +dä +da (+de,+do,+dö)
+ta (+te,+to,+tö)
+da (+de)
+ta (+te)
+nda (+nde)
+da (+de)
+ta (+te)
+nda (+nde)
Çýkma
Durumu
+dan (+den)
+tan (+ten)
+dan (+dNn) +dan (+den) +dän
+dan(+den,+don,+dön)
+tan (+ten,+ton,+tön)
+nan(+nen,+non,+nön)
+dan (+den)
+tan (+ten)
+nan (+nen)
+din
+tin
Tamlayan
Durumu
+ýn (+in,+un,+ün)
+nýn
(+nin,+nun,+nün)
+ýn (+in,+un,+ün)
+nýn
(+nin,+nun,+nün)
+yñ (+iñ,+uñ,+üñ)
+nyñ (+niñ)
+niñ
+nýn (+nin,+nun,+nün)
+dýn (+din,+dun,+dün)
+týn (+tin,+tun,+tün)
+nýñ (+niñ)
+dýñ (+diñ)
+týñ (+tiñ)
+niñ
11.6 Türk Dilleri Arasýndaki Benzerlikler – 211
11.7 Türk Dilleri Arasýndaki Farklýlýklar
Tümceler arasýnda sözcük sýralarý açýsýndan çoðunlukla benzerlik söz konusu olsa da bazý
durumlarda tümce içindeki sözcüklerin yerleri de deðiþebilir. Örnek olarak çoðu Türk dilinde
bulunan Þekil-11.12’deki atasözü verilmiþtir:
Ancak Türk dillerinde, sözcük öbeklerinin tümce içerisinde yer deðiþtirebilmesi özelliði
bulunduðundan, Özbekçe tümce Türkçeye çevrilirken sözcük sýralarýnda bir deðiþikliðe
gidilmese bile anlamý koruyan Türkçe tümce üretilebilir:
Akýlsýz dosttan akýllý düþman yeðdir.
Türk dilleri arasýnda gözlenebilen diðer farklýlýklar özellikle eylem çekimlerinde ortaya çýkan
farklý zaman kullanýmlarý, dillere özel kipler ve özne yüklem uyumlarýndaki farklýlýklardýr.
Örneðin Türkçedeki geniþ zaman kalýbý Türkmencede gelecek zaman anlamýný taþýr. Ayrýca
Türkmencede, Türkçede bulunmayan +makçý/+mekçi ekleri ile kurulan ve “bir eylemi yapmayý
düþünmek/yapmaya niyetlenmek” anlamýnda bir eylem kipi bulunur.
11.7 Türk Dilleri Arasýnda Bilgisayarlý Çeviri
Türk dilleri arasýnda çeviri yaparken ortaya çýkan en büyük sorun, Türkçe dýþýndaki diðer Türk
dilleri için doðal dil iþleme çalýþmalarýnýn yok denecek kadar az olmasýdýr. Birçok Türk dili için
biçimbilimsel çözümleme, sözdizim çözümleme gibi araçlar ya da elektronik ortama aktarýlmýþ
sözlükler veya iþlenmiþ metinler bulmak olasý deðildir. Türkçe için bile genel amaçlý
kullanýlabilecek yüksek baþarýmlý bir sözdizimsel çözümleme aracý bulunmamaktadýr.
Bütün bu olumsuzluklara karþýn, özellikle Türk dillerinin sözdiziminin benzer olmasý (Azerice,
Türkmence gibi bazý diller için neredeyse ayný olmasý), Daha önce anlatýlan aktarým yöntemleri
arasýnda en temel yöntem olan doðrudan aktarým yönteminin bile baþarýlý sonuçlar
üretebileceðini düþündürmektedir.
212 – Bilgisayarlý Çeviri
Akýlý
Aqlsiz
akýlsýz
epchil
düþman,
döstdan
dosttan
düþman
yeðdir. Türkçe
yagþýdýr. Özbekçe
Þekil-11.12 : Türkçe-Özbekçe tümcelerde sözcük sýralarý farklýlýðý örneði
Doðrudan aktarým yöntemi hariç diðer tüm kural tabanlý aktarým yöntemlerinde, sözdizim
çözümlemesi, anlamsal çözümleme gibi üst düzey bilgiler gerekmektedir. Ancak Türk dilleri
söz konusu olduðunda bu bilgileri üretecek araçlar dahi bulunmamaktadýr.
Ýstatistiksel ve örnek tabanlý çalýþan yöntemleri kullanabilmek için ise birbirlerinin karþýlýðý
olan hizalanmýþ eðitim verilerine büyük miktarlarda gerek duyulur. Bu þekilde hazýrlanmýþ
koþut eðitim verilerinin bulunmamasý, ayrýca bu tür bir eðitim kümesinin hazýrlanmasýnýn çok
emek gerektirmesinden dolayý bu yöntemlerin uygulanabilirliði düþüktür.
Sözcük sýralarýný deðiþtirmeden, sadece sözcükleri birebir çevirerek gerçeklenecek doðrudan
aktarým yöntemi, gerek sözdizim çözümlemesi gibi daha üst seviyede bilgilere, gerekse de
istatistiksel yöntemlerin kullandýðý gibi büyük miktarlarda paralel eðitim verilerine ihtiyaç
duymadýðý için en uygun yöntem olarak görülmektedir. Ayrýca doðrudan aktarým yöntemi,
sadece sonlu durum yöntemleri kullanýlarak gerçeklenebilmektedir. Bunun sonucu olarak
düzenli ve hýzlý çalýþan bir aktarým yöntemi gerçeklenebilir. Türk dilleri gibi bitiþken diller söz
konusu olduðunda doðrudan aktarým yöntemi aþaðýdaki sýrayla geliþtirilmiþtir:
1- Kaynak dil biçimbilimsel çözümlemesi
2- Biçimbilimsel yapýlarýn hedef dile aktarýlmasý
3- Sözcük kökünün hedef dile aktarýlmasý
4- Hedef dilde biçimbilimsel üretici ile sözcüðün yüzeysel biçiminin üretilmesi
Türk dillerinin bitiþken yapýsýndan dolayý, kaynak tümcedeki bir sözcüðün karþýlýðýný sözlükte
olduðu gibi arayýp bulmak mümkün deðildir. Bu noktada, bir ön iþlem olarak biçimbilimsel
çözümlemenin yapýlmasý gereklidir. Biçimbilimsel çözümleme sonucunda sözcük kökü ve
diðer biçimbilimsel yapýlar ortaya çýkar. Doðrudan aktarým, kaynak dildeki bu yapýlarýn (sözcük
kökü ve biçimbilimsel yapýlar) hedef dile iki aþamalý olarak aktarýmý biçiminde algýlanmalýdýr.
Her ne kadar Türk dillerinin sözdizimsel ve biçimbilimsel yapýlarý birbirlerine yakýn olsa da, bu
diller arasýnda biçimbilimsel farklýlýklar da azýmsanmayacak boyuttadýr. Biçimbilimsel
farklýlýklarý gidermek üzere bir takým biçimbilimsel dönüþüm kurallarý gerçeklenmeli ve bu
kurallarýn iþletilmesi sonucunda kaynak dildeki biçimbilimsel yapýlar, hedef dil için geçerli
biçimbilimsel yapýlar haline gelmelidir.
Ýkinci aþama olarak, kaynak dilde çözümlenen sözcük kökünün karþýlýðý aktarým sözlüðünden
bulunmalý ve hedef dildeki karþýlýðý veya karþýlýklarý ile deðiþtirilmelidir.
Son adýmda ise elde edilen biçimbilimsel yapý, hedef dilin biçimbilimsel üreticisi tarafýndan
yüzeysel biçime çevrilir.
Anlatýlan geliþtirilmiþ doðrudan aktarým yöntemine göre Türkmence bir sözcüðün Türkçe
karþýlýðýnýn oluþturulma süreci Þekil-11.13’de gösterilmiþtir.
Geliþtirilmiþ doðrudan aktarým yönteminde dahi biçimbilimsel çözümleme ve sözcük kökü
aktarýmýnda belirsizlikler ortaya çýkacaktýr. Bu belirsizliklerin çözülmesi, doðrudan aktarým
11.7 Türk Dilleri Arasýnda Bilgisayarlý Çeviri  – 213
yöntemini kullanan sistemlerde karmaþýk kurallarla saðlanýr. Bunun yerine, doðrudan aktarým
yaklaþýmýný istatistiksel yöntemlerle birleþtiren modeller kullanýlarak Türk dilleri arasýnda BÇ
sistemleri gerçeklenebilir. Bu amaçla, Model 0 (temel model) üzerine gerçeklenmiþ kuramsal
bir çeviri sisteminin bileþenleri ve veri akýþý ’de verilmiþtir. Bu þekilde kesikli çizgili
dikdörtgenler veri kaynaklarýný, düz çizgili dikdörtgenler ise süreçleri göstermektedir.
11.7.1 Kaynak Dilde Biçimbilimsel Çözümleme
Biçimbilimsel çözümleme, Türk dilleri gibi bitiþken diller için doðal dil iþleme alanýnda
yapýlacak her iþlemde gerek duyulan bir aþamadýr. Sözcüðün yüzeysel biçimlerinin sayýsýnýn
çok fazla olduðu diller için biçimbilimsel çözümleme olmadan aktarým sözlükleri hazýrlamak
ya da aktarým kurallarý geliþtirmek olanaksýzdýr. Dolayýsý ile kaynak dil olarak hangi Türk dili
seçilirse seçilsin, bu dil ile ilgili biçimbilimsel çözümleyicinin de hazýrlanmasý gerekmektedir.
Türkçe için geliþtirilmiþ geniþ kapsamlý ve yüksek baþarýmlý bir biçimbilimsel çözümleyici
halihazýrda bulunmaktadýr . Diðer Türk dilleri için bu tür bir çözümleyicinin varlýðý (Kýrým
Tatarcasý hariç) bilinmemektedir.
Kaynak dil olarak seçilen dil, Türkçenin dýþýnda bir Türk dili ise bu dil için bir biçimbilimsel
geliþtiricinin gerçeklenmesi ön koþuldur. Böyle bir gerçeklemede dikkat edilecek en önemli
nokta, geliþtirilecek çözümleyicinin var olan Türkçe biçimbilimsel çözümleyici ile benzer
214 – Bilgisayarlý Çeviri
Biçimbilimsel çözümleme
Biçimbilimsel aktarým
Kök aktarma
Biçimbilimsel üretme
eñrejekdirin
eñre+Verb+Pos+Fut+Cop+A1sg
eñre+Verb+Pos+Fut+A1sg+Cop
aðla+Verb+Pos+Fut+A1sg+Cop
aðlayacaðýmdýr
Þekil-11.13 : Örnek Türkmence sözcüðün Türkçe karþýlýðýnýn oluþturulmasý
mantýkla çalýþacak ve benzer biçimbilimsel etiketler üretecek þekilde tasarlanmasýdýr. Bu
sayede aktarým kurallarý (yani A fonksiyonu) daha basit hale getirilebilir.
11.7.1.1 Kaynak Dilde Biçimbilimsel Belirsizliðin Giderilmesi
Türkçe gibi karýþýk bir biçimbilimsel yapýya sahip dillerde biçimbilimsel çözümleme sonuçlarý
çoðu zaman birden fazladýr. Bu ise biçimbilimsel belirsizliðin ortaya çýkmasýna neden
olmaktadýr. Eðer kaynak Türk dili için biçimbilimsel belirsizliði gidermek üzere bir araç varsa,
bu araç kullanýlarak istatistiksel sürecin karmaþýklýðý azaltýlabilir.
Türkçe için biçimbilimsel belirsizliklerin giderilmesi ile ilgili birçok çalýþma olmasýna karþýn
bu çalýþmalarýn sonucunda yüksek baþarýmlý bir araç henüz genel kullanýma sunulamamýþtýr.
Diðer Türk dilleri için ise bu konuda bir çalýþmaya rastlanamamýþtýr. Biçimbilimsel belirsizlik
11.7 Türk Dilleri Arasýnda Bilgisayarlý Çeviri – 215
Kaynak dilde biçimbilimsel çözümleyici
Biçimbilimsel yapýlarý aktarýcý
Kök sözcük aktarýcý
ÝDM
Hedef dilde biçimbilimsel üretici
Kaynak dilde tümce
Hedef dilde tümce
Aktarým sözlüðü
Eðitim derlemi
C(s ) k
A(c ) ij
Arg max
c(S) i
U(H ) B
HB
H
Þekil-11.14 : Temel modeli gerçekleyen örnek bir çeviri sistemi
gidericilerin tasarlanmasý için kullanýlan bir çok yöntem gözetimli çalýþtýðý için elle iþlenmiþ
çok miktarda eðitim verisine gerek duyulmaktadýr. Türkçe dýþýndaki diðer Türk dilleri için
henüz böyle bir eðitim kümesi olmamasýndan dolayý bilinen yöntemler kullanýlarak bu diller
için bir biçimbilimsel belirsizlik giderici tasarlanmasý yoluna gidilememektedir.
11.7.2Sözcük Köklerinin Kaynak Dilden Hedef Dile Aktarýmý
Kural tabanlý bütün bilgisayarlý çeviri sistemlerinde olduðu gibi öngörülen temel model için de
bir aktarým sözlüðü gereklidir. Aktarým sözlüðünde kaynak dildeki sözcük bazýnda arama
yapýlabilmeli ve buna karþýlýk gelen hedef dildeki tüm sözcükler üretilebilmelidir. Bu noktada
altý çizilmesi gereken konu, sözcük kökü aktarýmý sýrasýnda birden fazla karþýlýk
üretilebileceðidir. Yani bu bileþenin ürettiði sonuçlar içerisinde bir belirsizlik vardýr. Söz
konusu bu belirsizlik sözcüksel belirsizlik olarak adlandýrýlmaktadýr.
bar è var, bütün
Belirsizliði bir kademe azaltmak amacý ile sadece sözcük köküne bakarak arama yapmak yerine
sözcük kökü ve sözcük türüne göre arama yapýlabilir. Böylelikle yazýmý ayný, ancak sözcük
türleri farklý olan sözcük kökleri, daha az bir belirsizlikle aktarýlabilir:
bar (sýfat) è bütün (sýfat)
bar (eylem) è var (eylem)
Aktarým sözlüðü tasarlanýrken sözcük türlerine göre sýnýflandýrma yapýlabilirse bu sayede
belirsizliðin derecesi düþürülebilir.
11.3.3 Biçimbilimsel Yapýlarýn Kaynak Dilden Hedef Dile Aktarýmý
Kaynak ve hedef dil arasýndaki biçimbilimsel farklýlýklarý gidermek üzere bir dizi dönüþümün
yürütüldüðü aktarým bileþenidir. Bu dönüþüm, kaynak dildeki biçimbilimsel çözümleme
sonucunda üretilen biçimbilimsel özelliklerin, hedef dil biçimbilimsel üreticinin beklediði
þekile dönüþtürme iþlemi olarak da nitelendirilebilir. Bu aþamada sözcük köküne
dokunulmadan sadece biçimbilimsel etiketler üzerinde dönüþtürme ve sýra deðiþtirme iþlemleri
yapýlýr. Bu kurallar, iki dil arasýndaki biçimbilimsel farklýlýklar incelenerek geliþtirilir. Diðer bir
yöntem ise birbirlerinin çevirisi olan, kaynak ve hedef dildeki biçimbilimsel yapýlarý içeren bir
eðitim kümesi üzerinde, bilgisayar öðrenmesi yöntemlerinden birisinin eðitilerek kurallarýn
otomatik olarak üretilmesidir.
11.7.4 ÝDM Bileþeni
Önerilen aktarým modellerinde yer alan bütün bileþenler içerisinde iki bileþenin çýktýlarý
belirsizlik içermektedir: kaynak dilde biçimbilimsel çözümleyici ve kök aktarýmý. Eðer bölüm
216 – Bilgisayarlý Çeviri
’de anlatýlan kaynak dilde biçimbilimsel belirsizlik giderici kullanýlabilir durumda ise
biçimbilimsel belirsizlik elenir ve sadece sözcüksel belirsizlik kalýr.
Gerek biçimbilimsel belirsizlik, gerekse de sözcüksel belirsizliðin giderilmesini amaçlayan
ÝDM bileþeni, istatistiksel yöntemlerle en olasý sözcük dizisini (yani tümceyi) belirler. Bu
amaçla Bölüm ’de anlatýlan ÝDM’ler kullanýlmaktadýr. Ancak gene Türk dillerinin türetme ve
çekim özelliklerinden dolayý, ÝDM’ler salt biçimde kullanýlamaz. Sözcüklerin sadece yüzeysel
biçimlerini içeren bir ÝDM’de seyrek veri sorunu ortaya çýkmaktadýr. Bunu önlemek için farklý
tiplerde ÝDM’lerin kullanýlmasý yoluna gidilebilir.
Örneðin, sözcüklerin yüzeysel biçimleri yerine sadece sözcük kökleri üzerine kurulmuþ bir
ÝDM kullanýlmasý durumunda, hedef dilde ortaya çýkan sözcüksel belirsizliðin giderilmesi
saðlanabilir.
Aktarým sistemindeki ÝDM bileþenine girdi olarak, kaynak dildeki tümcenin bütün
sözcüklerinin aday çevirileri gelir. Bileþenin çýktýsý olarak ise tüm kombinasyonlar içerisinden
seçilen ÝDM’ye göre en yüksek olasýlýða sahip tümce üretilir.
Olasý tüm kombinasyonlarýn tamamýnýn olasýlýklarýnýn hesaplamasý yerine, aday sözcüklerden
bir Hidden Markov Modeli (HMM) oluþturularak üzerinde Viterbi algoritmasýnýn
çalýþtýrýlmasýyla en yüksek olasýlýklý sözcük dizisi elde edilebilir.
Þekil-11.15’te Türkmence bir tümce Türkçeye çevrilirken oluþturulan bir HMM örneði
verilmiþtir. ’teki özel simgeler <s> ile </s> sýrasýyla tümce baþýný ve sonunu iþaret eden
simgelerdir. HMM’deki gözlem olasýlýklarý 1 seçilerek sadece durum geçiþ olasýlýklarýnýn
kullanýlmasý saðlanmýþtýr . Þekilde, durum geçiþlerini gösteren oklara iliþtirilmiþ olarak,
sözcüklerin seçilen ÝDM’ye göre olasýlýklarý bulunmaktadýr. Örneðin ”ne” ile ”için” durumlarý
arasýndaki ok, P(“için”|”ne”) olasýlýðýný, <s> ile ”ne” arasýndaki ok ise P(“ne”|<s>)
olasýlýðýný (tümcenin baþýnda ”ne” sözcük kökünün olma olasýlýðýný) göstermektedir. Viterbi
algoritmasý ile de bu HMM üzerinde en olasý yol bulunur. Bu yol üzerindeki sözcükler seçilerek
oluþturulan tümce hedef dilde olasýlýðý en yüksek çeviridir.
11.7 Türk Dilleri Arasýnda Bilgisayarlý Çeviri – 217
<s>
Ne
kim
Için
insan
Adam
türlü dil </s>
konuþ
söyle
Türkmence näme üçin adamlar dürli dillerde gepleyärler
Tümce näme üçin adam dürli dil geple
Þekil-11.15 : Örnek bir tümcenin HMM ile çözümlenme süreci
Tablo-11.4 ve Þekil-11.15’te kurulan HMM üzerinden hesaplanan en olasý 3 aday tümce
gösterilmiþtir. Farklý derecelerde kök dil modelleri kullanýlarak aday tümcelerin olasýlýklarý
hesaplanmýþtýr. Kalýn harflerle yazýlan tümce, doðru çeviriyi göstermektedir .
Türkçede dil ismi ile birlikte söylemek yerine daha çok konuþmak eylemi kullanýlmaktadýr.
Buna uygun olarak da tek baþýna sözcük sýklýklarýna bakýldýðýnda (n=1) söylemek eylemi
konuþmak eyleminden daha çok geçmesine karþýn ÝDM derecesi arttýkça konuþmak eylemini
içeren tümcelerin olasýlýðýnýn yükseldiði görülmektedir.
Tablo-11.4 : ÝDM ile en Olasý Tümcenin Bulunmasý
ÝDM Derecesi En Olasý 3 Tümce Sýra Log.
Olasýlýk
n=1 ne için insanlar türlü dillerde söylüyorlar 1 -17.2978
ne için insanlar türlü dillerde konuþuyorlar 2 -17.5196
ne için adamlar türlü dillerde söylüyorlar 3 -17.7816
n=2 ne için insanlar türlü dillerde konuþuyorlar 1 -18.1625
ne için adamlar türlü dillerde konuþuyorlar 2 -18.3105
kim için insanlar türlü dillerde konuþuyorlar 3 -18.6553
n=3 ne için insanlar türlü dillerde konuþuyorlar 1 -18.2265
kim için insanlar türlü dillerde konuþuyorlar 2 -18.6196
ne için adamlar türlü dillerde konuþuyorlar 3 -18.6294
11.7.5 Hedef Dilde Biçimbilimsel Üretici
ÝDM bileþeninin çýktýsý, yüzeysel biçimdeki sözcükler yerine yapýsal biçimdeki sözcüklerden
oluþan bir tümcedir. Bu tümcede yer alan tüm sözcükler, hedef dile iliþkin bir biçimbilimsel
üreticiden geçirilerek yüzeysel biçimler oluþturulmalý ve sistemin son çýktýsý olan tümce
üretilmelidir. Bu amaçla hedef dile iliþkin bir biçimbilimsel üreticiye gerek duyulmaktadýr.
Türkçe için geliþtirilen biçimbilimsel çözümleyici, SDD olarak tasarlandýðý için ters yönde
çalýþtýrýldýðýnda biçimbilimsel üretici olarak iþ görmektedir. Üstelik Türkçe için bu ters
çalýþtýrma durumunda herhangi bir belirsizlik oluþmamaktadýr. Yani yapýsal biçimde bir
sözcüðe karþýlýk, o sözcüðe ait sadece bir yüzeysel sözcük üretilmektedir. Türkçe dýþýndaki
diðer Türk dilleri için bilinen bir biçimbilimsel üretici yoktur.
11.8 Türkmenceden Türkçeye Bilgisayarlý Çeviri Düzeni
Bir önceki bölümde ayrýntýlarý açýklanan çeviri modellerinin bir uygulamasý olarak
Türkmenceden Türkçeye bir çeviri sistemi tasarlanmýþ ve gerçeklenmiþtir. Çeviri sistemi ilk
218 – Bilgisayarlý Çeviri
olarak Model 0’a (temel model) uygun olarak gerçeklenmiþ daha sonra ise bu temel model
üzerine Model 1 ve Model 2’nin getirdiði iyileþtirmeler eklenmiþtir.
Gerçeklenen uygulamada, aktarým fonksiyonunda yer alan bütün bileþenler SDD biçiminde
tasarlanmýþtýr.
11.8.1Aktarým Modeli 0 Gerçeklemesi
Aktarým Modeli 0’ý temel alarak tasarlanan Türkmenceden Türkçeye çeviri sisteminin bileþen
þemasý Þekil-11.16’da verilmiþtir:
11.8.1.1 Türkmence Biçimbilimsel Çözümleyicinin Geliþtirilmesi
Ýki-düzeyli biçimbilimsel çözümleme ilkeleri esas alýnarak Xerox sonlu durumlu araçlarýyla
Türkmence için bir biçimbilimsel çözümleyici tasarlanmýþtýr. Bu biçimbilimsel çözümleyicinin
tasarým aþamalarý aþaðýdaki bölümlerde verilmiþtir.
11.8 Türkmenceden Türkçeye Bilgisayarlý Çeviri Düzeni – 219
Tümce / sözcük Ayýrýcý
Biçimbilimsel Çözümleyici
Biçimbilimsel Yapýlarýn Aktarýmý
ÝDM
Kök Sözcük aktarýmý
Hedef dilde biçimbilimsel üretici
Aktarým sözlüðü
Karakter Düzeltici
Karakter Düzeltici
Eðitim derlemi
Türkmence
metin
Türkçe
metin
Þekil-11.16 : Aktarým Modeli 0 temelinde oluþturulan sistemin bileþenleri
11.8.1.1.1 Türkmen Dilinin Biçimbilimsel Özellikleri
Türkmence dilinin biçimbilimsel yapýsý Türkçe ile benzerlik göstermektedir. Özellikle isim
çekimlerinde eklerin türleri ve geliþ sýralarý Türkçeye çok benzerdir. Bu benzerliklerden dolayý
Türkçe için gerçeklenmiþ olan biçimbilimsel çözümleyici temel olarak alýnmýþtýr.
Her ne kadar Türkmence, Türkçeye en çok benzeyen dillerden birisi olsa da, iki dil arasýnda
harfler, ses olaylarý, sözcük çekimleri ve anlamsal açýdan pek çok farklýlýklar bulunmaktadýr .
Türkmencenin Türkçeye benzerliði ilk bakýþta yararlý görülse de, bazý açýlardan zararlý
olmaktadýr. Örneðin Türkçe ile birebir ayný olan bazý sözcükler ya da ekler, Türkmencede farklý
anlamlara gelmektedir. Türkçe bilen birisi, Türkmence öðrenirken bu tür yanýlgýlara kolayca
düþebilmektedir.
Ses Olaylarý
Türkçeye en yakýn dillerden biri olsa da Türkmencede yazý dili ile konuþma dili
arasýnda büyük farklýlýklar bulunmaktadýr. Aslýnda Türkçede de bütün sözcükler,
yazýldýðý gibi okunmaz ama Türkmencede bu durum istisna olmaktan çýkmýþ ve çok
sýk karþýlaþýlan bir durum olmuþtur. Maalesef kýsýtlý sayýdaki Türkmence dilbilgisi
kaynaklarýnýn çoðunda, yazý dili ile konuþma dili arasýndaki ayrým net olarak
verilmemiþtir. Bu nedenle bazý kurallarýn sadece konuþma dili için geçerli olduðunu
ortaya çýkarmak oldukça zahmetli olmuþtur.
Türkmencede sözcüklerin okunuþlarý ile yazýlýþlarý arasýnda Türkçenin tersine çok
büyük farklýlýklar bulunmaktadýr. Bütün seslilerin kýsa ve uzun okunuþlarý
bulunmaktadýr. Ancak yazý dilinde herhangi bir seslinin kýsa mý uzun mu okunacaðýna
iliþkin bir iþaret yoktur. Aþaðýda bu konu ile ilgili örnekler verilmiþtir (uzun okunan
sesliler, “:” iþaretiyle belirtilmiþtir):
Uzun Okunuþ Kýsa Okunuþ
at (a:t) ad, isim at (at) at
ot (o:t) ateþ ot (ot) ot
daþ (da:þ) taþ daþ (daþ) dýþ
Türkmencede büyük ünlü uyumu vardýr. Sözcüklerin bazýlarý küçük ünlü uyumuna
uyarken bazýlarý da uymaz. Türkçede geniþ yuvarlak seslilerden (o, ö) sonra dar
yuvarlak (u, ü) ya da geniþ düz (a, e) seslileri gelir. Türkmencede ise o, ö seslilerinden
sonra dar düz sesliler (y, i) gelir. Bu nedenle Türkmencede bazý sözcükler küçük ünlü
uyumuna uymaz.
Türkmencede de Türkçede olduðu gibi sessiz yumuþamasý vardýr. Sözcük sonundaki
p, ç, t, k sessizleri, sesli ile baþlayan bir ek aldýklarýnda b, c, d, g harflerine dönüþürler.
Sessiz benzeþmesi de kýsmen görülür.
220 – Bilgisayarlý Çeviri
Sesli düþmesi kuralý ise Türkmencede daha kurallýdýr. Bir seslinin düþmesi için:
1. iki heceli sözcük olmalý
2. ilk S kýsa, hece açýk olmalý (S, ZS)
3. ikinci hece kapalý olmalý (ZSZ)
Ancak ne yazýk ki 2. maddede söylenin S’nin yani ünlünün kýsa olmasý, yazý dilinde
belirtilmemektedir.
Okunuþlarla ilgili bir çok kurala, biçimbilimsel çözümleyicinin geliþtirilmesi ile ilgisi
olmadýðý için burada yer verilmeyecektir.
Tekillik / Çoðulluk
Çoðulluk ekleri +lar ve +ler Türkçedeki ile ayný þekilde kullanýlýr.
Belirtme Durumu
Belirtme durumu eki Türkçedekinden farklý olarak sadece +y ve +i eklerinden
oluþmaktadýr. Ancak Türkçede ekten önce ünlü harf bulunursa araya n harfi yerine y
harfi gelir:
kitaby (kitabý) goly (kolu) baþy(baþý)
gözi (gözü) güli (güli)
Yönelme Durumu
Türkçedeki gibi +a ve +e ekleri ile kurulur.
depdere (deftere) göze(göze) bilbile (bülbüle)
Ünlü ile biten isimlerde, yaklaþma durumu eki (+a, +e, +ä) farklýlýk göstermektedir.
i) –a, –o ile biten sözcüklere yaklaþma durumu eki eklenmez, yaklaþma durumu
sadece sözcüðün sonunda seslinin uzun okunuþu ile belirtilir.
ata (ata) baba
ata (ata:) babaya
ii) –i, –e, –ä ile biten sözcüklere yaklaþma durumu eki geldiðinde, sözcüðün son
seslisi –ä olarak deðiþir.
Berdi Þ Berdä Berdi Þ Berdi’ye
11.8 Türkmenceden Türkçeye Bilgisayarlý Çeviri Düzeni – 221
iii) –y seslisi ile biten sözcüklere yaklaþma durumu eki geldiðinde, sözcüðün son
seslisi –a seslisi olarak deðiþir.
Mary Þ Mara Marý Þ Marý’ya
Kalma Durumu
Türkçedekine benzer olarak +da, +de ekleri ile kurulur. Türkçedeki kullanýmdan tek
farklý bu eklerin ünsüz benzeþmesine uymamasýdýr (+ta, +te halleri yoktur):
guþda (kuþta) altda (altta) kitapda (kitapta)
Kalma durumundan sonra –ki eki gelirse, kalma durumu ekindeki sesli uzar:
depderdäki (defterdeki) bizdäki (bizdeki) süýtdäki (sütteki)
kitapdaki (kitapdaki) adamdaki (adamdaki) ondaki (ondaki)
Çýkma Durumu
Çýkma durumu, +dan ve +den ekleri ile kurulur. Bu ekler de ünsüz benzeþmesine
uymazlar:
öýden (evden) altdan (alttan) kitapdan (kitaptan)
Tamlayan Durumu
Tamlayan durumu ekleri +yñ, +iñ, +uñ ve +üñ ekleridir:
goluñ (kolun) burnynyñ (burnunun) diliñ (dilin)
Ýsim çekimi ve eylem çekimi açýsýndan incelendiðinde, Türkmence, isim çekimi
yönünden Türkçeye çok benzerken, eylem çekiminde ciddi farklýlýklar vardýr.
Özellikle çatý kurulumu Türkmencede Türkçeye oranla çok daha karmaþýktýr.
Türkçede çatý kurulumu genelde aþaðýdaki gibidir:
görmek (Yalýn)
görüþmek (Ýþteþ)
görüþtürmek (Ýþteþ-Ettirgen)
görüþtürülmek (Ýþteþ-Ettirgen-Edilgen)
Sadece bazý durumlarda ettirgenlik birkaç defa tekrarlanabilir.
Türkmencede ise çatý eklerinin geliþ sýrasý çok daha karýþýktýr:
222 – Bilgisayarlý Çeviri
Tablo-11.12 : Türkmencede Çatý Eklerinin Sýralanýþý
Ýki Çatý Ekli Eylemler Üç Çatý Ekli Eylemler Dört Çatý Ekli Eylemler
Ettirgen + Dönüþlü
Dönüþlü + Edilgen
Ýþteþ + Edilgen
Ettirgen + Edilgen
Dönüþlü + Ýþteþ
Edilgen + Ýþteþ
Ettirgen + Ýþteþ
Ýþteþ + Ýþteþ
Dönüþlü + Ettirgen
Ýþteþ + Ettirgen
Ettirgen + Ettirgen
Dönüþlü + Ettirgen + Edilgen
Ýþteþ + Ettirgen + Edilgen
Ettirgen + Edilgen + Ýþteþ
Dönüþlü + Ettirgen + Ýþteþ
Dönüþlü + Ýþteþ + Ettirgen
Edilgen + Ýþteþ + Ettirgen
Ettirgen + Ýþteþ + Ettirgen
Dönüþlü + Ettirgen + Ettirgen
Dönüþlü + Ýþteþ + Ettirgen + Edilgen
Ettirgen + Dönüþlü + Ettirgen + Edilgen
Ayrýca Türkmencede bazý eylem kipleri çekilmezler. Örneðin gelecek zamaný belirten +jek /
+jak ekinden sonra kiþi çekim eki gelmez. Örnek kullanýmý aþaðýdaki gibidir:
Men geljek (geleceðim)
Sen geljek (geleceksin)
O geljek ([o] gelecek)
Ayrýca gereklilik kipi +malý / +meli de benzer þekilde kiþi eki almaz.
Ancak bu kiplere kesinlik anlamý katan +dyr eki geldiðinde, bu +dyr ekinden sonra kiþi çekim
ekleri gelebilir.
Men geljekdirin. (geleceðimdir)
Türkmencede, Türkçede bulunmayan bazý kipler de vardýr. Örnek olarak bir iþ için hazýrlýk
yapýldýðýný ya da o iþin yapýlmasýnýn düþünüldüðünü gösteren +mekçi / +makçy eki
bulunmaktadýr. Bu ek de istisna olarak çekim eki almayan kipler grubundandýr.
Belirsiz geçmiþ zaman eki olarak kullanýlan +mýþ / +miþ eki Türkmencede ilk zaman olamaz.
Bunun yerine +ypdy / +ipdi / +updu / +üpdü ekleri gelmektedir. Ancak ikinci zaman olarak
+mýþ / +miþ eki gelebilmektedir.
Türkçede geniþ zaman olarak kullanýlan +ar / +er eki, Türkmencede gelecek zaman anlamýný
taþýmaktadýr.
Gene Türkçedekine benzer þekilde geniþ zamanýn 3. tekil þahsýnýn olumsuzu farklýdýr. Ancak
daha büyük bir farklýlýk olarak bazý kiplerde olumsuzluk eki olarak +ma / +me gelmemekte
bunun yerine eylemden sonra däl (“deðil”) getirilmektedir. Örnek:
Men gelcek däl
11.8 Türkmenceden Türkçeye Bilgisayarlý Çeviri Düzeni – 223
Kimi durumlarda däl eylemi de çekime uðramaktadýr.
Biçimbilimsel Çözümleyicinin Gerçeklenmesi
Türkmence için biçimbilimsel çözümleyici geliþtirirken iki düzeyli biçimbilimsel çözümleme
yöntemi benimsenmiþ ve XEROX’un sonlu durumlu araçlarýndan yararlanýlmýþtýr. Öncelikle
kökler ve eklerle ilgili durum geçiþleri yani morfotaktik kurallar tasarlanmýþ ve LEXC
aracýlýðýyla gerçeklenmiþ, daha sonra iki-düzeyli kurallar TWOLC ile oluþturulmuþtur. Ek
olarak, bazý geçersiz durumlarýn elenmesi için XFST ortamýnda kurallar yazýlmýþ ve elde edilen
bu üç SDD birleþtirilerek tek bir SDD elde edilmiþtir. Oluþan bu çözümleyici, ters yönde
çalýþtýrýldýðý zaman üretici olarak da çalýþabilmektedir.
11.8.1.1.2 Ýki Düzeyli Kurallar
Türkmencedeki çeþitli ses olaylarýný ve deðiþimlerini gerçeklemek için bir dizi iki-düzeyli kural
tanýmlanmýþ ve TWOLC derleyicisi yardýmý ile bu kurallarý gerçekleyen bir SDD
oluþturulmuþtur.
Ýki düzeyli kurallarý tanýmlamadan önce, bu kurallarýn üzerinde iþlem göreceði abecenin
tanýmlanmasý gerekmektedir. Bu abece güncel Türkmen harfleri ile sadece ara aþamalarda
kullanýlan ve yazýda görünmeyen bazý ek karakterler içermektedir. Her ne kadar TWOLC
derleyicisi UTF-8 karakter kümesini destekleyerek standart olmayan ASCII karakterlerinin
kullanýmýna izin verse de, bu tür bir kullanýmda hata ayýklama ve komut satýrýndan sýnamalarýn
yapýlmasý olanaksýz olmaktadýr. Bu nedenle standart ASCII tablosunda olmayan karakterler için
bir ASCII karakteri, ’deki gibi seçilmiþ ve kurallarda bu þekilde gösterilmiþtir.
Tablo-11.13 : ASCII olmayan karakterler yerine kullanýlan karþýlýklar
ASCII dýþý karakterler ü ö Ç ñ þ ý Ÿ ä
Seçilen ASCII karþýlýk U O C N S Y Z E
11.8.1.2 Kök Sözcük Aktarým Kurallarý
Biçimbilimsel çözümlemesi yapýlmýþ Türkmence sözcük köklerinin Türkçeye aktarýlmasýný
saðlayan kurallar, SDD’ler ile gerçeklenmiþtir. Örnek bir aktarým kuralý aþaðýda verilmiþtir:
“tatlý” ¬ “Yakymly”
Bölüm ’de belirtildiði gibi, bu aktarým kurallarýnda sözcük türlerinin kullanýlmasý, sözcüksel
belirsizliði azaltmaktadýr. Yazýlan kurallar bu ilke çerçevesinde oluþturulmuþ ve kurallarýn sað
baðlamlarý sözcük türleri ile kýsýtlandýrýlmýþtýr:
“gri” ¬“boz” \/ _ “+Adj” .o.
“sil” ¬ “boz” \/ _ “+Verb”
224 – Bilgisayarlý Çeviri
Bu sayede sistemin rastladýðý bütün “boz” köklerini, “gri” ve “sil” kökleri ile deðiþtirmesinin
önüne geçilerek, aktarýlacak sözcüðün sýfat ya da eylem olma durumuna göre sadece uygun
karþýlýklarýn dönüþtürülmesi saðlanmýþtýr. Kök aktarým bileþenin örnek girdisi ve çýktýsý
Þekil-11.7’de verilmiþtir:
11.8.1.2.1 Birden Fazla Sözcükten Oluþan Karþýlýklar
Dillerin doðasý gereði, Türkmencede bir tek sözcükle ifade edilen bazý kavramlar Türkçede bir
tek sözcük ile ifade edilememekte, ancak iki ya da daha fazla sözcükten oluþan ÇSG’ler ile ifade
edilebilmektedir. Bu durumda kök deðiþtirmek yerine daha akýllý bir yönteme baþvurulmasý
gereklidir. Bu tür durumlara örnek olarak aþaðýdaki sözlük girdileri gösterilebilir:
Türkmence Türkçe
boþatmak özgür býrakmak
dillenmek dile gelmek
entegem uzun süre
Hedef dil karþýlýðý ÇSG olan sözlük girdileri için standart kök aktarým kurallarý yerine geliþmiþ
kurallarýn oluþturulmasý gereklidir. Önemli olan bir diðer nokta da, bu deðiþtirme sürecinde,
ÇSG’nin son sözcüðü hariç bütün sözcüklerin yapýsal biçimde olmasý zorunluluðudur. Bu,
hedef dilde üretilecek tüm sözcüklerin biçimbilimsel özelliklerinin de bulunmasý zorunluluðu
anlamýna gelmektedir çünkü sistemin diðer bileþenleri yürütülürken, sözcüklerin yapýsal
biçimlerine gerek duymaktadýr.
Türkçede ÇSG’lerin türetme ve/veya çekim eklerinden etkilenen kýsmý sadece ÇSG’nin
sonunda yer alan sözcüktür. Bu gerçekten hareketle, kaynak dildeki sözcüðe ait biçimbilimsel
özelliklerin, hedef dildeki ÇSG’nin sonundaki sözcüðe ait olduðu, ÇSG’nin baþýnda yer alan
diðer sözcüklerin sabit bir yapýya sahip olduðu sonucuna varýlabilir. Bu koþullarla, yukarýdaki
sözlük girdilerini aktarmak üzere oluþturulmasý gereken kurallar aþaðýda verilmiþtir:
11.8 Türkmenceden Türkçeye Bilgisayarlý Çeviri Düzeni – 225
(Bozypdy) Boz+Verb+Pos+Narr+Past+A3sg
(Silmiþti) Sil+Verb+Pos+Narr+Past+A3sg
Kök Aktarýcý
Þekil-11.17 : Kök aktarým bileþeni
“dil+Noun+A3sg+Pnon+Dat gel” <- “dillen”
“özgür+Adj býrak” <- “boSat”
“uzun+Adj süre+Noun+A3sg+Pnon+Nom”<-“entegem+Adverb”
Aþaðýdaki þekilde ise kök aktarýcýnýn örnek bir ÇSG’yi aktarmasý gösterilmiþtir. Altý çizili
olmayan Türkmence biçimbilimsel yapýlarýn, ÇSG’nin son sözcüðüne eklendiði görülmektedir.
11.8.1.2.2 Sözcüksel Aktarým Kurallarý
Uygulamada ortaya çýkan bazý durumlar göstermiþtir ki bir takým sözcükler için sadece sözcük
kökünü deðiþtiren basit bir kural yeterli olmamaktadýr. Örneðin Türkmencedeki ulumsy
sözcüðü Türkçedeki kibirli sözcüðünün karþýlýðýdýr. Standart kurallar uygulanarak sadece
sözcük kökü deðiþtirildiðinde aþaðýdaki dönüþtürme iþlemi gerçeklenir:
kibirli+Adj ç ulumsy+Adj
Ýlk bakýþta göze çarpan herhangi bir sorun olmamasýna karþýn, oluþan yapýsal biçimdeki sözcük,
Türkçe biçimbilimsel üretici tarafýndan yüzeysel biçime dönüþtürüleceði zaman herhangi bir
çýktý üretilememektedir. Bunun altýnda yatan neden ise, Türkçedeki kibirli sözcüðünün aslýnda
türemiþ bir sözcük olmasý ve bu sözcüðün doðru yapýsal biçiminin aþaðýdaki gibi olmasýdýr:
kibir+Noun+A3sg+Pnon+Nom^DB+Adj+With
Ortaya çýkan bu sorunun düzeltilmesi için, Türkmencedeki ulumsy sözcüðü için aþaðýdaki gibi
özel bir kural oluþturulmalýdýr:
“kibir+Noun+A3sg+Pnon+Nom^DB+Adj+With”<-“ulumsy+Adj”
Örnekte açýklandýðý gibi sözcüðe baðlý özel durumlarý kotaran kurallar, sözcüksel kurallar
olarak adlandýrýlmýþtýr.
Ancak her iki dilde de ortak olan türetme ekleri ile türetilebilecek sözcükler için ayrý kurallarýn
oluþturulmasýna gerek yoktur. Örneðin Türkmencedeki +lyk eki ile Türkçedeki +lýk eki, sýfattan
226 – Bilgisayarlý Çeviri
boþa+Verb+Pos+Narr+Past+A3sg
Özgür+Adj býrak+Verb+Pos+Narr+Past+A3sg
Kök Aktarýcý
Þekil-11.18 : ÇSG’lerin Aktarýlmasý
isim yapan ayný göreve sahip iki yapým ekidir. Dolayýsý ile Türkmencede bulunan ulumsylyk
sözcüðünün karþýlýðý da kibirlilik sözcüðüdür. Her iki sözcüðün biçimbilimsel çözümlemesi
aþaðýda belirtilmiþtir:
ulumsy+Adj^DB+Noun+Ness+A3sg+Pnon+Nom
kibir+Noun+A3sg+Pnon+Nom^DB+Adj+With^DB+Noun+Ness+A3sg+Pnon+Nom
Örnekten de görüldüðü gibi, kalýn ve altý çizili olarak gösterilmeyen biçimbilimsel yapýlar
aynýdýr. Dolayýsý ile bu iki sözcük için ayrý bir sözcüksel aktarým kuralý hazýrlanmasýna gerek
yoktur, yukarýda anlatýlan ve ulumsy sözcüðünü aktaran sözcüksel aktarým kuralýnýn çalýþmasý
yeterli olmaktadýr.
11.8.1.2.3 Biçimbilimsel Aktarým Kurallarý
Türkmence ve Türkçe arasýndaki biçimbilimsel farklýlýklarýn giderilerek Türkmence
biçimbilimsel çözümleme sonucu üretilen yapýlarýn, kabul edilebilir Türkçe biçimbilimsel
yapýlara dönüþtürülmesini saðlayan kurallardýr.
Örneðin Türkmencede bulunan ve emir kipinin 1. tekil ve 1. çoðul kiþiler için çekimi, Türkçede
istek kipine karþýlýk gelmektedir:
Türkmence Türkçe Karþýlýðý
alaYyn (al+Verb+Pos+Imp+A1sg) alayým (al+Verb+Pos+Opt+A1sg)
algyn (al+Verb+Pos+Imp+A2sg) al (al+Verb+Pos+Imp+A2sg)
alsyn (al+Verb+Pos+Imp+A3sg) alsýn (al+Verb+Pos+Imp+A3sg)
Her iki dil arasýndaki biçimbilimsel farklýlýklardan bir tanesi de Türkmencede olup da Türkçede
olmayan eylem kipleridir. Örneðin Türkmencede “+makçy/+mekçi” eki ile kiþinin, ekin geldiði
eylemi yapmayý düþündüðü veya niyetlendiði anlamý kurulur. Bunun Türkçede doðrudan
karþýlýðý olmadýðý için ÇSG üreten bir kural geliþtirilmiþtir:
11.8.1.2.4 Ýstatistiksel Dil Modeli Bileþeni
Aktarým sýrasýnda ortaya çýkan biçimbilimsel ve sözcüksel belirsizliklerin giderilmesi için
ÝDM’leri kullanan bu bileþenin görevi ve iþleyiþ tarzý, Bölüm ’de açýklanmýþtýr. Bu amaçla,
bitiþken diller için Bölüm ’te önerilen farklý türlerde ÝDM’ler üretilmiþtir. ÝDM’lerin
oluþturulmasý için yaygýn olarak kullanýlan iki farklý yardýmcý araç bulunmaktadýr:
CMU-Cambridge Language Modeling Toolkit ve SRILM . Bu çalýþmada kullanýlan ÝDM’ler,
En Büyük Olabilirlik Kestirimi yöntemi ile SRILM kullanýlarak oluþturulmuþtur. Olasýlýklar
oluþturulurken yumuþatma için Good-Turing yöntemi ile derece düþürme modelleme yöntemi
beraber kullanýlmýþtýr.
Uygulamada önerilen farklý ÝDM tiplerinin baþarýmlarý ayrý ayrý incelenmiþ ve en baþarýlý sonuç
üreten ÝDM belirlenmeye çalýþýlmýþtýr.
11.8 Türkmenceden Türkçeye Bilgisayarlý Çeviri Düzeni – 227
·
Musahhih
Muvakkýthane
558 9432
228 – Bilgisayarlý Çeviri
Ýçindekiler
1. Kýsým 5
Türkçenin Temel 5
Dilbilgisi 5
Dil 7
1.1 Dil Aileleri 9
1.1.1 Ural-Altay Dilleri 10
1.1.2 Hint-Avrupa Dilleri 10
1.1.3 Çin-Tibet Dilleri 10
1.1.4 Sami Dilleri 10
1.1.5 Bantu Dilleri 10
1.2 Dil Yapýlarý 11
1.2.1 Yalýnlayan Diller 11
1.2.2 Bitiþken Diller 11
1.2.3 Bükümlü Diller 11
1.2.4 Kaynaþtýran Diller 12
Sesbilim 15
2.1 Ünlüler 16
2.2 Ünsüzler 16
2.3 Türkçenin Ses Kurallarý 17
2.3.1Türkçede Bulunan ve Bulunmayan Sesler 17
2.3.1.1 Sonda Bulunamayan Ünsüzler 18
2.3.1.2 Baþta Bulunamayan Ünsüzler 18
2.3.2 Ses Deðiþmeleri 18
2.3.3 Ünlü Uyumu 19
2.3.3.1 Ünlü Uyumunda Kuralsýzlýklar 19
2.3.3.2 Ünlüler Çatýþmasýnýn Giderilmesi 20
2.3.4 Ünsüz Uyumu 21
2.3.4.1 Sözcük ve Hece Sonunda Bulunabilecek Çift Ünsüzler 22
2.3.4.2 Yanyana Gelebilecek Ünsüz Sayýsýna Ýliþkin Kurallar 22
2.3.4.3 Süreksiz Sert Ünsüzlerin Yumuþamasý 22
2.3.4.4 Ünsüz Benzeþmesi 23
2.4 Ses Düþmeleri 24
– 229
2.4.1 Orta Hece Düþmesi 24
2.4.2 Diðer Ses Düþmeleri 24
2.5 Heceler 25
2.5.1Türkçenin Heceleri 25
2.6 Türkçenin Sesbilim Teknik Özelikleri 26
2.7 Sözcükler 28
2.8 Sesçil Abece 31
Biçimbilim 35
3.1 Kökler ve Ekler 36
3.1.1 Anlamlý Birimler 36
3.1.2 Anlamsýz Birimler 37
3.2 Sözcük Çeþitleri 37
3.3 Adlar 38
3.3.1 Adýn Durumlarý 40
3.3.2 Ad Durumlarýnda Ses Benzeþmesi 41
3.3.3 Ad Tamlamalarý 42
3.3.4 Yapýlarýna Göre Adlar 42
3.4 Sýfatlar 43
3.4.1 Niteleme Sýfatlarý 43
3.4.1.1 Karþýlaþtýrma Sýfatlarý 43
3.4.1.2 Pekiþtirme Sýfatlarý 44
3.4.1.3 Küçültme Sýfatlarý 44
3.4.1.4 Unvan Sýfatlarý 45
3.4.2 Belirtme Sýfatlarý 45
3.4.2.1 Ýþaret sýfatlarý 45
3.4.2.2 Sayý sýfatlarý 45
3.4.2.3 Belgisiz sýfatlar 46
3.4.2.4 Soru sýfatlarý 46
3.4.3 Sýfat Tamlamalarý 46
3.4.4 Yapýlarýna Göre Sýfatlar 46
3.5 Adýllar 47
3.5.1 Ek Durumundaki Adýllar 47
3.6 Belirteçler 48
3.6.1 Belirteçlerin Çeþitleri 49
3.7 Ýlgeçler 50
3.8 Baðlaçlar 50
3.9 Ünlemler 51
230 –
3.10 Eylemler 51
3.10.1 Eylem Yapýsý 52
3.10.2 Eylemlerde Kiþi 52
3.10.3 Eylem Kipleri 52
3.10.4 Eylemlerin Olumluluk ve Olumsuzluk Biçimi 53
3.10.5 Eylemlerin Soru Biçimi 53
3.10.6 Ek Eylem (Ana Yardýmcý Eylem) 53
3.10.7 Eylem Çatýsý 55
3.10.7.1 Özneleri Bakýmýndan Eylemler 55
3.10.7.2 Nesnelerine Göre Eylemler 56
3.10.8 Yapýlarýna Göre Eylemler 58
3.11 Ekler 61
3.11.1 Çekim Ekleri 61
3.11.2 Yapým Ekleri 64
3.11.3 Eklerin Diziliþi 67
Sözdizimi 69
Anlambilim 71
2. Kýsým 73
Doðal Dil Ýþleme 73
Dili Ýþleme 75
6.1 Metin Seslendirme 76
6.2 Konuþmayý Yazýya Dökme 76
6.3 Yazým Hatalarýný Giderme ve Sözcük Deðiþtirme 77
6.4 Bilgiye Eriþim 79
6.5 Bilgi Çýkarma 79
6.6 Özetleme 80
6.7 Anlama 80
6.8 Soru Yanýtlama 80
6.9 Çeviri 81
Metin Seslendirme 83
7.1 Ýnsanda Konuþma Üretimi Sisteminin Anatomisi 84
7.2 Konuþma Sinyalleri 88
7.3 Ses Üretme Yöntemleri 89
7.3.1 Sesleri Ekleme Yöntemi 89
– 231
7.3.2 Yapay Ses Üretme Yöntemi 92
7.3.3 Türkçenin Ünlü ve Ünsüz Sesleri 94
Konuþmayý Yazýya Dökme 97
8.1 Konuþmayý Anlama 99
Yazým Hatalarýný Giderme ve Sözcük Deðiþtirme 103
9.1 Yazým Hatalarýný Giderme Üzerine Çalýþmalar 105
9.2 Hata Bulma ve Düzeltme 107
9.2.1 Sözcük Daðarcýðý Oluþturma 107
9.2.2 Heceleyici 109
9.2.3 Kök Bulucu 110
9.2.3.1 Yönlü Döngüsüz Sözcük Çizgesi Yapýsý 112
9.2.3.2 Yönlü Döngüsüz Sözcük Çizgesi Oluþturma 113
9.2.3.3 Aðaç Üzerinde Kök Bulma 114
9.2.3.4 Aðaç Üzerinde Kök Bulma 115
9.2.4 Sözcüðün Biçimbilimsel Çözümlenmesi 115
9.2.4.1 Ekler 115
9.2.4.2 Ayrýþtýrma Algoritmasý 116
9.2.5 Türkçe Metin Denetleyici 118
9.2.5.1 Sözcük Baþý Ünsüz Denetimi 118
9.2.5.2 Sözcük Sonu Ünsüz Denetimi 120
9.2.5.3 Sözcük Ýçi Ünsüz Denetimi 123
9.2.5.4 Ünlü Uyumlarý 123
9.2.5.5 Ünsüz Uyumu 125
9.2.5.6 Sesbilim Açýsýndan Sözcük Denetimi 126
9.2.5.6.1 Ünsüz Yumuþamasý Denetimi 126
9.2.5.6.2 Ünlü Düþmesi Denetimi 128
9.2.6 Sözcük Önerme 128
9.2.6.1 Sözlükte Bulunan Sözcükler Ýçin Önerme 128
9.2.6.2 Sözlükte Bulunmayan Sözcükler Ýçin Önerme 130
9.2.7 Baþarým 132
9.2.7.1 Sýnama Verisinin Hazýrlanmasý 133
9.2.7.2 Sýnama Sonuçlarý ve Sistemin Baþarýmý 133
Çeviri 135
10.1 Dillerin Benzerlikleri ve Farklýlýklarý 136
10.1.1 Biçimbilimsel Benzerlik ve Farklýlýklar 138
10.1.2 Sözdizimsel Benzerlikler ve Farklýlýklar 139
232 –
10.1.3 Dilimleme 141
10.1.4 Anlatým Biçimi 141
10.1.5 Sözlüksel Benzerlikler ve Farklýlýklar 142
Kaynak dildeki bir sözcüðün, çeviri yapýlacak hedef dilde bire bir karþýlýðý
bulunmayabilir. 142
142
142
142
10.1 Yüzeysel Çeviri 142
10.2
Bilgisay
ar Destekli Çeviri (BDÇ) 142
10.2.1 Sadece
Belirli Konularý Ýçeren Metinlerde 142
10.2.2 Bilgi
Tabanlý Çeviri Yöntemleri 143
*-*-*-*- IPA ——
pbtd??c?k?q??m?n?????r?????fv??sz????ç?x?????
History
– 233