Derlem dilbilim
Derlem dilbilim; bir dilin, "gerçek dünya" metninin gövdesi olan metin derleminde ifade edildiği şekliyle bir dilin incelenmesidir. Derlem dilbilim, bir dilin güvenilir bir analizinin, minimum deneysel müdahale ile sahada toplanan derlemlerle - o dilin doğal bağlamı ("realia")- ile daha mümkün olduğunu öne sürer. Metin-derlem yöntemi, o dili yöneten soyut kurallar dizisini türetmek için herhangi bir doğal dilde yazılmış metinlerin derlemini kullanır. Bu sonuçlar, konu dili ile benzer bir analizden geçmiş diğer diller arasındaki ilişkileri keşfetmek için kullanılabilir. Bu tür ilk derlemler, kaynak metinlerden manuel olarak türetilmiştir ancak artık bu iş otomatikleştirilmiştir.
Metod
[değiştir | kaynağı değiştir]Derlem dilbilim, verilerden teoriye giden bir yolu izlemeye çalışan bir dizi araştırma yöntemi üretmiştir. Wallis ve Nelson (2001) ilk olarak 3A perspektifi olarak adlandırdıkları şeyi tanıtmışlardır: Ek Açıklama, Soyutlama ve Analiz.
- Açıklama, bir şemanın metinlere uygulanmasından oluşur. Ek açıklamalar, yapısal işaretleme, konuşma parçası etiketleme, ayrıştırma ve çok sayıda diğer temsilleri içerebilir.
- Soyutlama, şemadaki terimlerin teorik olarak motive edilmiş bir model veya veri kümesindeki terimlere çevrilmesinden (eşlemesinden) oluşur. Soyutlama tipik olarak dilbilimci tarafından yönlendirilen aramayı içerir, ancak örneğin ayrıştırıcılar için kural öğrenmeyi içerebilir.
- Analiz, veri setinden istatistiksel olarak araştırma, manipüle etme ve genelleştirmeden oluşur. Analiz, istatistiksel değerlendirmeleri, kural tabanlarının optimizasyonunu veya bilgi keşif yöntemlerini içerebilir.
Günümüzde sözcüksel derlemlerin çoğunda, konuşmanın bir kısmı etiketlidir (POS etiketli). Bununla birlikte, 'açıklamasız düz metin' ile çalışan derlem dilbilimcileri bile, göze çarpan terimleri izole etmek için kaçınılmaz olarak bazı yöntemler uygular. Bu gibi durumlarda açıklama ve soyutlama sözcüksel bir aramada birleştirilir.
Açıklamalı bir derlem yayınlamanın avantajı, diğer kullanıcıların daha sonra derlem üzerinde deneyler yapabilmesidir (derlem yöneticisi aracılığıyla). Yaratıcılarınkinden farklı ilgi alanlarına ve farklı bakış açılarına sahip dilbilimciler bu çalışmayı kullanabilir. Verileri paylaşarak, derlem dilbilimcileri derlemi dilbilimsel tartışma ve daha fazla çalışma yeri olarak ele alabilirler.