Çeviri belleği
Çeviri belleği (ÇB) veya Çeviri hafızası (ÇB), insan çevirmenlere yardımcı olmak için daha önce çevrilmiş cümleler, paragraflar veya cümle benzeri birimler (başlıklar, başlıklar veya bir listedeki öğeler) olabilen "segmentleri" depolayan bir veritabanıdır. Çeviri belleği, kaynak metni ve karşılık gelen çevirisini “çeviri birimleri” adı verilen dil çiftlerinde saklar. Bireysel kelimeler terminoloji temelleri tarafından ele alınır ve ÇB'nin alanı içinde değildir.
Çeviri hafızasını kullanan yazılım programları bazen çeviri hafızası yöneticileri (ÇBY) veya çeviri hafızası sistemleri (ÇB sistemleri, çeviri sürecini yönetmeye odaklanan başka bir yazılım türü olan Çeviri yönetim sistemi (ÇYS) ile karıştırılmamalıdır) olarak bilinir.
Çeviri hafızaları tipik olarak özel bir bilgisayar destekli çeviri (BDÇ) aracı, kelime işlem programı, terminoloji yönetim sistemleri, çok dilli sözlük ve hatta ham makine çevirisi çıktısı ile birlikte kullanılır.
Araştırmalar, çok dilli belgeler üreten birçok şirketin çeviri hafızası sistemlerini kullandığını gösteriyor. 2006'da dil uzmanlarıyla yapılan bir ankette, 874 yanıtın %82,5'i ÇB kullanımını doğruladı.[1] ÇB kullanımı, teknik terimler ve basit cümle yapısı (teknik, daha düşük derecede pazarlama ve finansal), bilgi işlem becerileri ve içeriğin tekrarlanabilirliği ile karakterize edilen metin türüyle ilişkilidir.[1]
Çeviri hafızasını kullanma
[değiştir | kaynağı değiştir]Program kaynak metni (çevrilecek metni) bölümlere ayırır, bölümler arasındaki eşleşmeleri ve bir çeviri hafızasında depolanan daha önce çevrilmiş kaynak-hedef çiftlerinin kaynak yarısı arasındaki eşleşmeleri arar ve bu eşleşme çiftlerini çeviri tam ve/veya kısmi eşleşmeler olarak sunar. Çevirmen bir eşleşmeyi kabul edebilir, yeni bir çeviriyle değiştirebilir veya kaynağa uyacak şekilde değiştirebilir. Son iki durumda, yeni veya değiştirilmiş çeviri veritabanına gider.
Bazı çeviri hafızası sistemleri yalnızca %100 eşleşme arar, yani yalnızca veritabanıındaki girişlerle tam olarak eşleşen metin bölümlerini alabilirken, diğerleri çevirmene işaretli farklılıklarla sunulan benzer bölümleri almak için bulanık eşleştirme algoritmaları kullanır. Tipik çeviri hafızası sistemlerinin yalnızca kaynak bölümdeki metni aradığına dikkat etmek önemlidir.
Eşleştirme algoritmasının esnekliği ve sağlamlığı, çeviri hafızasının performansını büyük ölçüde belirler, ancak bazı uygulamalar için tam eşleşmelerin geri çağırma oranı %100 eşleşme yaklaşımını haklı çıkarmaya yetecek kadar yüksek olabilir.
Eşleşmenin bulunmadığı bölümlerin çevirmen tarafından manuel olarak çevrilmesi gerekecektir. Bu yeni çevrilen bölümler, gelecekteki çeviriler için ve aynı zamanda o bölümün mevcut metindeki tekrarları için kullanılabilecekleri veritabanında saklanır.
Çeviri hafızası, teknik kılavuzlar gibi çok tekrarlı metinlerde en iyi sonucu verir. Ayrıca, örneğin bir kullanım kılavuzunun yeni bir sürümündeki küçük değişikliklere karşılık gelen, daha önce çevrilmiş bir belgedeki artımlı değişiklikleri çevirmek için de yararlıdırlar. Geleneksel olarak çeviri hafızası, kullanılan dilde çok az tekrar olması gibi basit bir nedenle edebi veya yaratıcı metinler için uygun görülmemektedir. Bununla birlikte, diğerleri onları tekrar eÇBeyen metinler için bile değerli buluyor, çünkü oluşturulan veritabanı kaynakları, terimlerin uygun kullanımını belirlemek için uygunluk araştırmaları, kalite güvencesi (boş bölümler yok) ve inceleme sürecinin basitleştirilmesi (kaynak ve çevirmenler geleneksel bir inceleme ortamında iki belgeyle çalışmak zorundayken hedef segment her zaman birlikte görüntülenir).
Ana faydalar
[değiştir | kaynağı değiştir]Çeviri hafızası yöneticileri, teknik belgeleri ve özel sözlükler içeren belgeleri çevirmek için en uygun olanlardır. Avantajları şunlardır:
- Belgenin tamamen tercüme edilmesini sağlamak (çeviri hafızaları boş hedef segmentleri kabul eÇBez)
- Ortak tanımlar, ifadeler ve terminoloji dahil olmak üzere tercüme edilen belgelerin tutarlı olmasını sağlamak. Bu, farklı çevirmenler tek bir proje üzerinde çalışırken önemlidir.
- Çevirmenlerin, genellikle bu biçimleri işlemek için gereken yazılıma sahip olmak zorunda kalmadan çok çeşitli biçimlerdeki belgeleri çevirmesine olanak tanır.
- Genel çeviri sürecini hızlandırmak; Çeviri bellekleri daha önce çevrilmiş materyali "hatırladığından", çevirmenlerin onu yalnızca bir kez çevirmesi gerekir.
- Uzun vadeli çeviri projelerinin maliyetlerinin düşürülmesi; örneğin kılavuz metinleri, uyarı mesajları veya belge dizileri yalnızca bir kez çevrilmelidir ve birkaç kez kullanılabilir.
- Büyük dokümantasyon projeleri için, bir ÇB paketinin kullanımı sayesinde (zaman veya para olarak) tasarruf, yeni bir projenin ilk çevirisi için bile zaten belirgin olabilir, ancak normalde bu tür tasarruflar, yalnızca önceden yapılmış bir projenin sonraki sürümlerinin çevirisi sırasında görülür. çeviri belleğini kullanmadan önce çevrildi.
Ana engeller
[değiştir | kaynağı değiştir]Çeviri belleği yöneticilerinin daha geniş kullanımını engelleyen başlıca sorunlar şunlardır:
- "Çeviri bellekleri" kavramı, önceki çevirilerde kullanılan cümlelerin "geri dönüştürülebileceği" öncülüne dayanmaktadır. Bununla birlikte, çevirinin yol gösterici bir ilkesi, çevirmenin, metnin bileşenlerini değil, metnin mesajını çevirmesi gerektiğidir.
- Çeviri belleği yöneticileri, mevcut çeviri veya yerelleştirme süreçlerine kolayca uymazlar. ÇB teknolojisinden yararlanmak için çeviri süreçleri yeniden tasarlanmalıdır.
- Çeviri belleği yöneticileri şu anda tüm belge biçimlerini desteklememektedir ve tüm dosya türlerini desteklemek için filtreler mevcut olmayabilir.
- Çeviri belleği yöneticilerinin kullanılmasıyla ilgili bir öğrenme eğrisi vardır ve programlar en yüksek etkinlik için özelleştirilmelidir.
- Tercüme sürecinin tamamının veya bir kısmının dışarıdan temin edildiği veya saha dışında çalışan serbest çevirmenler tarafından yürütüldüğü durumlarda, saha dışındaki çalışanlar, çeviri belleği yöneticisi tarafından oluşturulan metinlerle çalışabilmek için özel araçlara ihtiyaç duyarlar.
- Birçok çeviri belleği yöneticisinin tam sürümleri, koltuk başına 500 ABD Doları ile 2,500 ABD Doları arasında olabilir ve bu da önemli bir yatırımı temsil edebilir (ancak daha düşük maliyetli programlar da mevcuttur). Bununla birlikte, bazı geliştiriciler, bireysel çevirmenlerin bu araçların tam sürümleriyle oluşturulmuş projeler üzerinde çalışmak için kullanabileceği azaltılmış özellik setleriyle araçlarının ücretsiz veya düşük maliyetli sürümlerini üretir. (Ücretsiz ve shareware ÇB paketleri olduğunu unutmayın, ancak bunların hiçbiri henüz büyük bir pazar payı kazanmamıştır.)
- Kullanıcının geçmiş çevirilerini çeviri belleği veritabanına aktarma, eğitim ve herhangi bir ek ürünle ilgili maliyetler de önemli bir yatırımı temsil edebilir.
- Çeviri belleği veritabanlarının bakımı çoğu durumda hala manuel bir işlem olma eğilimindedir ve bunların bakımının yapılmaması, ÇB eşleşmelerinin kullanılabilirliğinin ve kalitesinin önemli ölçüde azalmasına neden olabilir.
- Daha önce belirtildiği gibi, çeviri belleği yöneticileri, dahili tekrarı olmayan veya revizyonlar arasında değişmeyen kısımlar içermeyen metinler için uygun olmayabilir. Teknik metinler genellikle çeviri belleği için en uygun olanıdır, pazarlama veya yaratıcı metinler ise daha az uygun olacaktır.
Kalite üzerindeki etkiler
[değiştir | kaynağı değiştir]ÇB sistemlerinin kullanılması, tercüme edilen metinlerin kalitesi üzerinde etkili olabilir. Ana etkisi, açıkça "hata yayılımı" ile ilgilidir: belirli bir bölümün çevirisi yanlışsa, aslında yanlış çevirinin aynı kaynak metin veya benzer bir sonraki sefer tekrar kullanılması daha olasıdır. kaynak metin çevrilir, böylece hata devam eder. Geleneksel olarak, çevrilmiş metinlerin kalitesi üzerinde iki ana etki tanımlanmıştır: "cümle-salata" etkisi (Bédard 2000; O'Hagan 2009: 50'de aktarılmıştır) ve "gözetleme deliği" etkisi (Heyn 1998). İlki, bir metin, farklı tarzlarda farklı çevirmenler tarafından çevrilmiş olan bir ÇB'dan alınan cümleler kullanılarak çevrildiğinde metin düzeyinde tutarlılık eksikliğine atıfta bulunur. İkincisine göre, çevirmenler, metin içi referanslar içermemeleri için üsluplarını ÇB sisteminin kullanımına uyarlayabilirler, böylece bölümler gelecekteki metinlerde daha iyi kullanılabilir, böylece bağdaşıklık ve okunabilirlik etkilenir (O'Hagan 2009).
Çevrilen metin üzerinde potansiyel ve varsa muhtemelen bilinçsiz bir etki vardır. Farklı diller, bir cümle içindeki mantıksal öğeler için farklı sıralar kullanır ve yarısı çevrilmiş çok yan tümceli bir cümleyle sunulan bir çevirmenin, bir cümleyi tamamen yeniden oluşturma olasılığı daha düşüktür. Tutarlı ampirik kanıtlar (Martín-Mor 2011), çevirmenlerin bir ÇB sistemi yerine bir metin işlemcisi ile çalışırken çok yan tümceli bir cümlenin yapısını büyük olasılıkla değiştireceklerini göstermektedir.
Ayrıca çevirmenin, her bir cümlenin etrafındakilerle ve bir bütün olarak metinle nasıl bir ilişki kurduğuna odaklanmak yerine, metni cümle cümle mekanik olarak ele alma potansiyeli de vardır. Araştırmacılar (Dragsted 2004), bu programların otomatik bölümleme özelliği ile ilgili olan bu etkiyi tanımladılar, ancak bunun çevirilerin kalitesi üzerinde mutlaka olumsuz bir etkisi olması gerekmiyor.
Bu etkilerin, araca özgü olmaktan ziyade eğitimle yakından ilişkili olduğunu unutmayın. Martín-Mor'a (2011) göre, ÇB sistemlerinin kullanılması, özellikle yeni başlayanlar için çevrilen metinlerin kalitesi üzerinde bir etkiye sahiptir, ancak deneyimli çevirmenler bundan kaçınabilir. Pym (2013) "ÇB/MÇ kullanan çevirmenlerin, ilerledikçe her bölümü revize etme eğiliminde olduğunu ve sonunda tüm metnin nihai bir revizyonu için çok az zaman tanıdığını" hatırlatır; bu aslında burada açıklanan etkilerin bazı sorunların nihai nedeni olabilir.
Çeviri hafızası sistemleri türleri
[değiştir | kaynağı değiştir]- Masaüstü: Masaüstü çeviri hafızası araçları, genellikle bireysel çevirmenlerin çevirileri tamamlamak için kullandığı araçlardır. Serbest çevirmenlerin masaüstü bilgisayarına indirip yüklediği programlardır.
- Sunucu tabanlı veya merkezileştirilmiş: Merkezileştirilmiş çeviri belleği sistemleri, ÇB'yi merkezi bir sunucuda depolar. Masaüstü ÇB ile birlikte çalışırlar ve ÇB eşleşme oranlarını yalnızca masaüstü ÇB ile elde edilen ÇB kaldıracından %30-60 daha fazla artırabilirler.
İşlevler
[değiştir | kaynağı değiştir]Aşağıda, bir çeviri hafızasının ana işlevlerinin bir özeti yer almaktadır.
Çevrimdışı işlevler
[değiştir | kaynağı değiştir]İçe aktarma
[değiştir | kaynağı değiştir]Bu işlev, bir metni ve çevirisini bir metin dosyasından ÇB'ye aktarmak için kullanılır. İçe aktarma, çevirisiyle birlikte bir ÇB'ye içe aktarmak için harici bir kaynak metnin mevcut olduğu bir ham biçimden yapılabilir. Bazen metinlerin kullanıcı tarafından yeniden işlenmesi gerekir. İçe aktarma için kullanılabilecek başka bir biçim daha vardır: yerel biçim . Bu biçim, çeviri belleklerini bir dosyaya kaydeÇBek için ÇB'yi kullanan biçimdir.
Analiz
[değiştir | kaynağı değiştir]Analiz süreci aşağıdaki adımları içerir:
- Metinsel ayrıştırma
- Örneğin bir cümlenin sonundaki nokta ile kısaltmadaki nokta arasındaki farkı ayırt edebilmek için noktalama işaretlerini doğru tanımak çok önemlidir. Bu nedenle, işaretleme bir tür ön düzenlemedir. Genellikle, çevirmenlerin yardım programları aracılığıyla işlenen materyaller, çeviri aşaması çok dilli bir belge üretim hattına gömülü olduğundan, işaretleme içerir. Diğer özel metin öğeleri, işaretleme ile ayrılabilir. Özel adlar ve kodlar gibi çevrilmesi gerekmeyen özel öğeler bulunurken, diğerlerinin yerel biçime dönüştürülmesi gerekebilir.
- Dilsel ayrıştırma
- Temel form indirgemesi, bir terim bankasından terimlerin otomatik olarak alınması için kelime listeleri ve bir metin hazırlamak için kullanılır. Öte yandan, bir kaynak metinden çok kelimeli terimleri veya deyimleri çıkarmak için sözdizimsel ayrıştırma kullanılabilir. Bu nedenle ayrıştırma, deyimbilimin kelime sırası varyasyonunu normalleştirmek için kullanılır, bu, hangi kelimelerin bir cümle oluşturabileceğidir.
- Segmentasyon
- Amacı, en kullanışlı çeviri birimlerini seçmektir. Segmentasyon, bir tür ayrıştırma gibidir. Yüzeysel ayrıştırma kullanılarak tek dilli olarak yapılır ve hizalama, segmentasyona dayanır. Çevirmenler segmentasyonları manuel olarak düzeltirse, program kendi hatalarını tekrarlayacağından, belgenin sonraki sürümleri düzeltilmiş segmentasyona dayalı olarak ÇB ile eşleşme bulamaz. Çevirmenler genellikle cümle cümle ilerler, ancak bir cümlenin çevirisi çevredekilerin çevirisine bağlı olabilir.
- Hizalama
- Kaynak ve hedef metinler arasındaki çeviri yazışmalarını tanımlama görevidir. Hizalamadan segmentasyona geri bildirim olmalı ve iyi bir hizalama algoritması ilk segmentasyonu düzeltebilmelidir.
- Terim çıkarma
- Girdi olarak önceki bir sözlüğe sahip olabilir. Ayrıca, bilinmeyen terimleri ayıklarken, metin istatistiklerine dayalı ayrıştırmayı kullanabilir. Bunlar, bir çeviri işinde yer alan iş miktarını tahmin etmek için kullanılır. Bu, işi planlamak ve programlamak için çok yararlıdır. Çeviri istatistikleri genellikle kelimeleri sayar ve metindeki tekrar miktarını tahmin eder.
Dışa aktarma
[değiştir | kaynağı değiştir]Dışa Aktarma, metni ÇB'den harici bir metin dosyasına aktarır. İçe ve dışa aktarma ters olmalıdır.
Çevrimiçi işlevler
[değiştir | kaynağı değiştir]Çeviri yaparken, ÇB'nin temel amaçlarından biri, çevirmenin en iyisini seçebilmesi için bellekteki en yararlı eşleşmeleri almaktır. ÇB, kimlikleri ve farklılıkları gösteren hem kaynak hem de hedef metni göstermelidir.
Alma
[değiştir | kaynağı değiştir]Bir ÇB'den birkaç farklı eşleşme türü alınabilir.
- Tam eşleşme
- Geçerli kaynak segment ile depolanan arasındaki eşleşme karakter karakter eşleşme olduğunda tam eşleşmeler görünür. Bir cümleyi çevirirken, tam eşleşme, aynı cümlenin daha önce çevrildiği anlamına gelir. Tam eşleşmeler "%100 eşleşme" olarak da adlandırılır.
- Bağlam İçi Tam (ICE) eşleşme veya Garantili Eşleşme
- ICE eşleşmesi, tam olarak aynı bağlamda, yani bir paragrafta aynı yerde gerçekleşen tam eşleşmedir. Bağlam genellikle çevredeki cümleler ve belge dosya adı, tarih ve izinler gibi niteliklerle tanımlanır.
- Bulanık eşleşme
- Eşleşme tam olmadığında, "bulanık" bir eşleşmedir. Bazı sistemler bu tür eşleşmelere yüzdeler atar; bu durumda bir bulanık eşleşme %0'dan büyük ve %100'den küçüktür. Bu rakamlar, puanlama yöntemi belirtilmedikçe sistemler arasında karşılaştırılabilir değildir.
- Uyum
- Çevirmen kaynak segmentte bir veya daha fazla kelime seçtiğinde, sistem arama kriterleriyle eşleşen segment çiftlerini alır. Bu özellik, bir terminoloji veritabanıının yokluğunda terimlerin ve deyimlerin çevirilerini bulmak için yararlıdır.
Güncelleme
[değiştir | kaynağı değiştir]Bir ÇB, çevirmen tarafından kabul edildiğinde yeni bir çeviri ile güncellenir. Her zaman olduğu gibi, bir veritabanını güncellerken, veritabanının önceki içerikleriyle ne yapılacağı sorusu vardır. Bir ÇB, ÇB'deki girişleri değiştirerek veya silerek değiştirilebilir. Bazı sistemler, çevirmenlerin aynı kaynak segmentin birden çok çevirisini kaydetmesine izin verir.
Otomatik çeviri
[değiştir | kaynağı değiştir]Çeviri hafızası araçları genellikle otomatik alma ve değiştirme sağlar.
- Otomatik alma
- ÇB sistemleri aranır ve sonuçları, çevirmen bir belgede hareket ederken otomatik olarak görüntülenir.
- Otomatik ikame
- Otomatik değiştirme ile, bir belgenin yeni bir versiyonunun çevrilmesinde tam bir eşleşme ortaya çıkarsa, yazılım eski çeviriyi tekrarlayacaktır. Çevirmen, çeviriyi kaynakla karşılaştırmazsa, önceki çeviride yapılan bir hata tekrarlanır.
Ağ
[değiştir | kaynağı değiştir]Ağ oluşturma, bir çevirmen grubunun bir metni, her birinin ayrı ayrı çalıştığından daha hızlı bir şekilde birlikte çevirmesini sağlar, çünkü bir çevirmen tarafından çevrilen cümleler ve ifadeler diğerleri tarafından kullanılabilir. Ayrıca, çeviri bellekleri son çeviriden önce paylaşılırsa, bir çevirmenin yaptığı hataların diğer ekip üyeleri tarafından düzeltilmesi olasılığı vardır.
Metin belleği
[değiştir | kaynağı değiştir]"Metin belleği", önerilen Lisa OSCAR xml:TM standardının temelidir. Metin belleği, yazar belleği ve çeviri belleğinden oluşur.
Çeviri belleği
[değiştir | kaynağı değiştir]Benzersiz tanımlayıcılar çeviri sırasında hatırlanır, böylece hedef dil belgesi metin birimi düzeyinde 'tam' hizalanır. Kaynak belge sonradan değiştirilirse, değişmeyen metin birimleri, herhangi bir çevirmen etkileşimine gerek kalmadan doğrudan belgenin yeni hedef sürümüne aktarılabilir. Bu, çeviri belleğiyle 'tam' veya 'mükemmel' eşleşme kavramıdır. xml:TM, belge içi kaldıraçlı ve bulanık eşleştirme için mekanizmalar da sağlayabilir.
Tarih
[değiştir | kaynağı değiştir]1970'ler, bilim adamlarının bir ön keşif tartışması turu yürüttüğü ÇB sistemleri için emekleme aşamasıdır. ÇB sistemleri için orijinal fikir genellikle Martin Kay'in "Uygun Yer" makalesine,[2] ancak ayrıntıları tam olarak verilmemiştir. Bu yazıda, depolama sisteminin temel kavramını göstermiştir: "Tercüman, sistemin mağazada ilgili olabilecek herhangi bir şeyi görüntülemesine neden olan bir komut vererek başlayabilir. . . . Devam etmeden önce, benzer malzeme içeren geçmiş ve gelecekteki metin parçalarını inceleyebilir". Kay'in bu gözlemi aslında Peter Arthern'in çevirmenlerin benzer, zaten tercüme edilmiş belgeleri çevrimiçi olarak kullanabileceği önerisinden etkilenmiştir. 1978 tarihli makalesinde[3] bugün ÇB sistemleri dediğimiz şeyin tam olarak gösterilmesini sağladı: Herhangi bir yeni metin bir kelime işlem istasyonuna yazılacaktı ve bu metin yazılırken sistem bu metni daha önce depolanan metinlerle karşılaştıracaktı. [Avrupa Topluluğunun] diğer tüm resmi dillerine tercümesi ile birlikte hafızası. . . . Uygun makine çevirisine göre bir avantaj, bu şekilde alınan tüm pasajların dilbilgisi açısından doğru olmasıdır. Aslında, benim hesaplamalarıma göre, çevirmenlerin verimli bir şekilde çeviri üretmek için kullandıkları zamandan en az yüzde 15 tasarruf sağlayacak elektronik bir "kes ve yapıştır" süreci yürütüyor olmalıyız.
Fikir, ilk olarak Brigham Young Üniversitesi'nden araştırmacı tarafından geliştirilen ALPS (Otomatik Dil İşleme Sistemleri) Araçlarından birleştirildi ve o zamanlar ÇB sistemleri fikri, yalnızca eşleşen dizeleri bulmayı amaçlayan "Tekrar İşleme" adlı bir araçla karıştırıldı. Ancak uzun bir süre sonra, sözde çeviri belleği kavramı ortaya çıktı.
ÇB sistemlerinin gerçek keşif aşaması 1980'ler olacaktır. ÇB sisteminin ilk uygulamalarından biri Sadler ve Vendelmans'ın İki Dilli Bilgi Bankası'nda ortaya çıktı. İki Dilli Bilgi Bankası, biri diğerinin çevirisi olan ve çeviri birimlerinin tümceler arasında çapraz kodlandığı, sözdizimsel ve referanssal olarak yapılandırılmış bir bütünlük çiftidir. İki Dilli Bilgi Bankasının amacı, makine çevirisi ve bilgisayar destekli çeviri uygulamaları için derlemi tabanlı genel amaçlı bir bilgi kaynağı geliştirmektir (Sadler ve Vendelman, 1987). Bir diğer önemli adım ise Brian Harris tarafından "Bi-text" ile atıldı. Bi-text'i, Sadler'in İki Dilli Bilgi Bankası ile benzer yankılar uyandıran çeviri birimleri aracılığıyla çevirmenin etkinliği ile ilgili kaynak ve hedef metinleri "iki boyutta tek bir metin" (1988) olarak tanımlamıştır. Ve Harris'in çalışmasında, bu adı kullanmadan ÇB sistemi gibi bir şey önerdi: tek kelime veya "bütün çeviri birimi" ile aranabilen, eşleştirilmiş çevirilerden oluşan bir veritabanı, ikinci durumda, aramanın özdeş birimler yerine benzerleri almasına izin verildi. .
ÇB teknolojisi ancak 1990'ların sonlarında geniş ölçekte ticari olarak kullanılabilir hale geldi, bu nedenle birkaç mühendis ve çevirmen tarafından yapılan çabalar. Unutulmaması gereken, Trados (günümüzde SDL Trados) adlı ilk ÇB aracıdır. Bu araçta, kaynak dosyayı açarken ve çeviri belleğini uygularken, metin içindeki herhangi bir "%100 eşleşme" (özdeş eşleşmeler) veya "bulanık eşleşmeler" (benzer, ancak aynı olmayan eşleşmeler) anında ayıklanır ve hedef dosya içine yerleştirilir. Ardından, çeviri belleği tarafından önerilen "eşleşmeler" kabul edilebilir veya yeni alternatiflerle geçersiz kılınabilir. Bir çeviri birimi manuel olarak güncellenirse, gelecekte kullanılmak üzere ve mevcut metinde tekrarlanmak üzere çeviri belleğinde saklanır. Benzer şekilde, hedef dosyadaki "eşleşme" olmayan tüm bölümler manuel olarak çevrilir ve ardından otomatik olarak çeviri belleğine eklenir.
2000'li yıllarda, çevrimiçi çeviri hizmetleri ÇB'yi dahil etmeye başladı. Google Translate gibi makine çevirisi hizmetleri ile Gengo ve Ackuna gibi siteler tarafından sağlanan profesyonel ve "hibrit" çeviri hizmetleri, diller arasında daha verimli bağlantılar kurmak için çevirmenler ve gönüllüler tarafından sağlanan ÇB verilerinin veritabanlarını birleştirir, son kullanıcılara daha hızlı çeviri hizmetleri sunar.[4]
Son trendler
[değiştir | kaynağı değiştir]Yakın tarihli bir gelişme, çeviri belleğinin aksine 'metin belleği' (text memory) kavramıdır.[5] Bu aynı zamanda önerilen LISA OSCAR standardının temelidir.[6] xml:TM içindeki metin belleği, 'yazar belleği' ve 'çeviri belleği'nden oluşur. Yazar belleği, yazma döngüsü sırasında değişiklikleri takip etmek için kullanılır. Çeviri hafızası, çeviri hafızası eşleştirmesini uygulamak için yazar belleğindeki bilgileri kullanır. Öncelikle XML belgelerini hedeflese de, xml:TM, XLIFF[7] biçimine dönüştürülebilen herhangi bir belgede kullanılabilir.
İkinci nesil çeviri hafızası
[değiştir | kaynağı değiştir]Birinci nesil ÇB sistemlerinden çok daha güçlüdürler, bir dilsel analiz motoru içerirler, segmentleri akıllı terminolojik gruplara ayırmak için yığın teknolojisini kullanırlar ve otomatik olarak belirli sözlükler oluştururlar.
İlgili standartlar
[değiştir | kaynağı değiştir]ÇBX
[değiştir | kaynağı değiştir]Translation Memory eXchange (ÇX), çeviri tedarikçileri arasında çeviri belleklerinin değişimini sağlayan bir standarttır. ÇBX, çeviri topluluğu tarafından çeviri belleklerini içe ve dışa aktarmanın en iyi yolu olarak benimsenmiştir.[kaynak belirtilmeli] . Mevcut sürüm 1.4b'dir - orijinal kaynak ve hedef belgelerin ÇBX verilerinden yeniden oluşturulmasına izin verir.
TBX
[değiştir | kaynağı değiştir]TermBase eXchange . ISO 30042 olarak revize edilen ve yeniden yayınlanan bu LISA standardı, ayrıntılı sözlüksel bilgileri içeren terminoloji verilerinin değiş tokuşuna izin verir. TBX çerçevesi üç ISO standardı tarafından sağlanır: ISO 12620, ISO 12200 ve ISO 16642. ISO 12620, veri öğesi türleri veya önceden tanımlanmış değerler olarak işlev gören standart adlarla iyi tanımlanmış "veri kategorilerinin" bir envanterini sağlar. ISO 12200 (MARTIF olarak da bilinir), TBX'in temel yapısının temelini oluşturur. ISO 16642 (Terminolojik İşaretleme Çerçevesi olarak da bilinir), genel olarak Terminoloji İşaretleme Dilleri için yapısal bir meta-model içerir.
UTX
[değiştir | kaynağı değiştir]Universal Terminoloji eXchange (UTX) biçimi, makine çevirisinin kullanıcı sözlükleri için kullanılmak üzere özel olarak tasarlanmış bir standarttır, ancak genel, insan tarafından okunabilen sözlükler için kullanılabilir. UTX'in amacı, son derece basit ve pratik özelliği sayesinde sözlük paylaşımını ve yeniden kullanımını hızlandırmaktır.
SRX
[değiştir | kaynağı değiştir]Segmentation Rules eXchange (SRX), uygulamalar arasında değiş tokuş edilen çeviri belleği verilerinin daha etkin kullanılabilmesi için ÇBX standardını geliştirmeyi amaçlar. Önceki çeviride kullanılan segmentasyon kurallarını belirleme yeteneği, elde edilebilecek kaldıraçları artırabilir.
GMX
[değiştir | kaynağı değiştir]GILT Metrics. GILT, (Globalization, Internationalization, Localization, and Translation) anlamına gelir. GILT Metrics standardı üç bölümden oluşur: hacim ölçümleri için GMX-V, karmaşıklık ölçümleri için GMX-C ve kalite ölçümleri için GMX-Q. Önerilen GILT Metrikleri standardı, verilen herhangi bir GILT görevi için iş yükünü ve kalite gereksinimlerini ölçmekle görevlendirilmiştir.
OLIF
[değiştir | kaynağı değiştir]Open Lexicon Interchange Format. OLIF, terminolojik ve sözlüksel verilerin değişimi için açık, XML uyumlu bir standarttır. Başlangıçta tescilli makine çevirisi sözlükleri arasında sözlüksel veri alışverişi için bir araç olarak tasarlanmasına rağmen, terminoloji alışverişi için daha genel bir standart haline geldi.[8]
XLIFF
[değiştir | kaynağı değiştir]XML Localisation Interchange File Format (XLIFF), herhangi bir yerelleştirme sağlayıcısı tarafından anlaşılabilen tek bir değişim dosyası biçimi sağlamayı amaçlamaktadır. XLIFF, çeviri endüstrisinde XML formatında veri alışverişi için tercih edilen[9][10] yoludur.[11]
TransWS
[değiştir | kaynağı değiştir]Translation Web Services. TransWS, yerelleştirme projeleriyle ilgili dosya ve mesajların gönderilmesi ve alınması için Web hizmetlerini kullanmak için gereken çağrıları belirtir. Web Hizmetlerinin kullanımıyla mevcut yerelleştirme sürecinin çoğunun otomasyonu için ayrıntılı bir çerçeve olarak tasarlanmıştır.[12]
xml:TM
[değiştir | kaynağı değiştir]Çeviri belleğine xml:TM (XML tabanlı Metin Belleği) yaklaşımı, yazar ve çeviri belleğinden oluşan metin belleği kavramına dayanır.[13] xml:ÇB, XML-INTL tarafından Lisa OSCAR'a bağışlanmıştır.
PO
[değiştir | kaynağı değiştir]Gettext Portable Object format. Genellikle bir çeviri belleği formatı olarak kabul edilmese de, Gettext PO dosyaları, çeviri belleklerinde olduğu gibi çeviri belleği süreçlerinde de kullanılan iki dilli dosyalardır. Tipik olarak, bir PO çeviri belleği sistemi, bir dizin ağacı yapısındaki çeşitli ayrı dosyalardan oluşacaktır. PO dosyalarıyla çalışan yaygın araçlar arasında GNU Gettext Tools ve Translate Toolkit bulunur. PO dosyalarını yalnızca kaynak metin dosyalarıymış gibi düzenleyen çeşitli araçlar ve programlar da mevcuttur.
Ayrıca bakınız
[değiştir | kaynağı değiştir]- Bilgisayar destekli çeviri araçlarının karşılaştırılması
- Çeviri yazılımı listesi
- Tercüme
- Text corpus
- Bilgisayar destekli inceleme
- Çeviri yazılımı
- Paralel metin
- Çevrimiçi iki dilli uyum
Kaynakça
[değiştir | kaynağı değiştir]- ^ a b Elina Lagoudaki (2006), "Translation Memory systems: Enlightening users' perspective. Key finding of the TM Survey 2006 carried out during July and August 2006. (Imperial College London, Translation Memories Survey 2006), p.16 "Archived copy" (PDF). 25 Mart 2007 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 25 Mart 2007.
- ^ Kay (March 1997). "The Proper Place of Men and Machines in Language Translation". Machine Translation. 12 (1–2): 3-23. doi:10.1023/A:1007911416676.
- ^ Arthern (1978). "Machine Translation and Computerized Terminology Systems: A Translator's Perspective" (PDF). Translating and the Computer: Proceedings of a Seminar, London, 14th November, 1978. ISBN 0444853022. 19 Ağustos 2019 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ Google's AI translation tool seems to have invented its own secret internal language 7 Ekim 2022 tarihinde Wayback Machine sitesinde arşivlendi. Devin Coldewey, TechCrunch, November 22, 2016
- ^ "Translating XML Documents with xml:tm". 6 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ "xml:tm". 6 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ "XLIFF". 26 Nisan 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ "Open Lexicon Interchange Format". 24 Mart 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ "DITA Translation SC | OASIS". www.oasis-open.org. 19 Haziran 2006 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Ocak 2021.
- ^ O’Hagan, Minako, (Ed.) (23 Ağustos 2019), "XML for translation technology", The Routledge Handbook of Translation and Technology, 1 (İngilizce), Abingdon, Oxon: Routledge, ss. 45-60, doi:10.4324/9781315311258-3, ISBN 978-1-315-31125-8, erişim tarihi: 29 Ocak 2021 Yazar
|ad1=
eksik|soyadı1=
(yardım) - ^ "XML Localisation Interchange File Format". 26 Nisan 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ "Translation Web Services". 4 Aralık 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ Andrzej Zydroń (August 2008). "OAXAL—What is it and why should I care". CIDM Information Management News. 17 Mayıs 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Mart 2013.
At the core of xml:tm are the following concepts which together make up 'Text Memory': Author Memory and Translation Memory.
İleri okumalar
[değiştir | kaynağı değiştir]- Dragsted, Barbara. (2004). Segmentation in translation and translation memory systems: An empirical investigation of cognitive segmentation and effects of integrating a ÇB system into the translation process. Copenhagen: Samfundslitteratur. 369 p.
- Heyn, Matthias. (1998). “Translation memories: Insights and prospects”. In: Lynne Bowker; et al. (eds.), Unity in diversity? Current trends in translation studies. Manchester: St. Jerome. P. 123–136.
- Martín-Mor, Adrià (2011), La interferència lingüística en entorns de Traducció Assistida per Ordinador: Recerca empíricoexperimental. Bellaterra: Universitat Autònoma de Barcelona. URL: http://www.tdx.cat/handle/10803/83987.
- O’Hagan, Minako. (2009). “Computer-aided translation (CAT)”. In: Mona Baker & Gabriela Saldanha (eds.), Routledge encyclopedia of translation studies. London: Routledge. P. 48–51.
- Pym, Anthony (2013). Translation Skill-Sets in a Machine-Translation Age. Meta: Translators' Journal, 58 (3), p. 487-503. URL: http://id.erudit.org/iderudit/1025047ar
Dış bağlantılar
[değiştir | kaynağı değiştir]- Çeviri anıları 21 Ekim 2008 tarihinde Wayback Machine sitesinde arşivlendi.
- Çeviri belleklerini kıyaslama 16 Haziran 2008 tarihinde Wayback Machine sitesinde arşivlendi.
- Serbest çevirmenler tarafından ÇB kullanımına ilişkin Ecolore araştırması (Word belgesi)
- Web Tabanlı Çeviri Belleğinde Güç Kaymaları