Bilgisayarlı dilbilim

disiplinler arası alan

Bilgisayarlı dilbilim veya hesaplamalı dilbilim, doğal dilin istatistiksel veya kural tabanlı modelleme yöntemleriyle ve hesaplamalı bir perspektif ile inceleyen disiplinler arası bir bilgisayar bilimi alanıdır.

47 popüler haber medyasında farklı duygusallık türlerini ifade eden haber makalesi manşetlerinin yıllık ortalama yaygınlığı.

Geleneksel olarak bilgisayarlı dilbilim, bilgisayarların bilimsel olarak doğal dilin işlenmesine uygulanmasında uzmanlaşmış bilgisayar bilimcileri tarafından gerçekleştirildi. Bilgisayarlı dilbilimciler, genellikle düzenli dillerle ilgilenen bilim insanları, hedef dilde uzmanları ve bilgisayar bilimcilerini de içerebilen disiplinler arası ekip üyeleri olarak çalışırlar. Bilgisayarlı dilbilim çalışmaları genel olarak; dil bilimciler, bilgisayar bilimcileri, yapay zeka uzmanları, matematikçiler, mantıkçılar, filozoflar, bilişsel bilim insanları, bilişsel psikologlar, psikologlar, antropologlar ve nörologların birlikte görevleri paylaşmalarına dayanır.

Bilgisayarlı dilbilimin teorik ve uygulamalı bileşenleri vardır. Teorik bilgisayarlı dilbilim, dil bilimlerinde ve bilişsel bilimde yer alan teorik konulara yoğunlaşır. Uygulamalı ve bilgisayarlı dilbilim ise, insan dilinin kullanımının modellemesine ve pratik çıktısına odaklanır.[1]

Bilgisayarlı dilbilim birliği (Association for Computational Linguistics), bilgisayarlı dilbilimi şu şekilde tanımlamaktadır: "Bilgisayarlı dilbilimciler, çeşitli dilsel fenomenlerin hesaplama modellemelerinin ifadesiyle ilgilenmektedirler."[2]

Kökeni

Bilgisayarlı dilbilim genellikle yapay zeka sınıfında gruplandırılır, ancak aslında yapay zekanın geliştirilmesinin öncesinde de, bu doğrultuda çalışmalar mevcuttur. Bilgisayarlı dilbilim, 1950'lerde Birleşik Devletler'de, yabancı dildeki metinleri, özellikle Rus bilimsel dergilerinden İngilizce'ye otomatik olarak çevirmek için bilgisayarı kullanmak suretiyle ortaya konan çabalardan doğmuştur.[3] Bilgisayarlar, aritmetik hesaplamaları, insanlara göre çok daha hızlı ve daha doğru yapabildikleri için, dilin işlenmesine başlanmasından ziyade kısa zamanda hesaplama yeteneği ön plana çıkmış ve salt hesaplama işlevi düşünülmüştür.[4] Daha sonraları hesaplamalı ve niceliksel yöntemler, daha önceki modern dil formlarının yeniden yapılandırılması ve modern dillerin, geleneksel dil ailelerinin altında gruplandırılması için kullanılmaktadır. Bununla birlikte, biyolojik araştırmalardan, özellikle de gen haritalandırmasından alınan kavramları ödünç alan son zamanlardaki disiplinlerarası çalışmalar, daha karmaşık analitik araçlar sayesinde daha güvenilir sonuçlar üretmektedir.[5]

Makine çevirimi(mekanik çevirim olarak da bilinir) yaklaşık ve doğru tercümeler üretemediğinde, insan dillerinin otomatik olarak işlenmesi, başlangıçta varsayıldığından çok daha karmaşık biçimde kabul edildi. Bilgisayarlı dilbilim, dil verilerini akıllıca işlemek için algoritma ve yazılım geliştirmeye ayrılan yeni alanın adı olarak doğmuştur. Yapay zeka 1960'larda ortaya çıktığında, bilgisayarlı dilbilim alanı, insan seviyesinde anlama ve doğal dillerin üretimi ile uğraşan yapay zekanın alt bölümü haline geldi.

Bir dili diğer bir dile çevirmek için, her iki morfolojiyi (sözcük formlarının grameri) ve söz dizimini (cümle yapısının grameri) içeren her iki dilin gramerinin iyice anlaşılması gerektiği gözlemlendi. Söz dizimini anlamak için anlam bilimi ve sözlüğü yani kelime hazinesi ve hatta dil kullanımının pratikleri hakkında izah gerekliydi. Bu nedenle, diller arasında çeviri yapmak için bir çaba olarak başlayan dürtü, bilgisayarları kullanarak doğal dilleri nasıl temsil edileceğini ve nasıl işleneceğini anlamaya yönelik bütüncül bir disipline dönüşmüştür.[6]

Günümüzde bilgisayarlı dilbilim kapsamındaki araştırmalar, sayısal dilbilim bölümlerinde, bilgisayarlı dilbilim laboratuvarlarında, bilgisayar bilimleri bölümlerinde ve dilbilim bölümlerinde yapılmaktadır.[7] Bilgisayarlı dilbilim alanında yapılan bazı araştırmalar, çalışma konuşması veya metin işleme sistemleri yaratmayı amaçlarken diğerleri insan-makine etkileşimine izin veren bir sistem yaratmayı amaçlamaktadır. İnsan-makine iletişimi için kullanılan programlara "konuşmanın aracıları" denilir.[8]

Kaynakça