Masalah yang Perlu Dipertimbangkan Saat Melokalkan Situs Web Anda

[ad_1]

Dalam artikel ini, saya akan memberikan ikhtisar tentang beberapa masalah yang perlu dipertimbangkan saat menerjemahkan atau melokalkan situs web Anda. Dari pengalaman saya sebagai penerjemah dan pakar TI, saya akan mencoba untuk menyoroti tidak hanya berbagai pertimbangan linguistik, tetapi juga beberapa masalah praktis dan teknis kecil untuk diingat.

Mengapa situs web berbeda dengan proyek terjemahan "normal"?

Dalam kasus yang paling sederhana, menerjemahkan situs web mungkin tidak berbeda secara signifikan dari menerjemahkan dokumen biasa. Anda mungkin menemukan Anda dapat menyediakan salinan statis ke penerjemah dalam file Word, lalu mengekstrak dan mengunggah teks ketika Anda menerima kembali dalam format yang sama.

Namun, banyak situs web tidak terdiri dari beberapa halaman teks statis, yang berarti bahwa proyek terjemahan situs web mungkin memerlukan beberapa pertimbangan khusus dan keterampilan tambahan pada bagian penerjemah:

  • Anda mungkin memiliki halaman yang dibangun "on the fly" dari database daripada yang ada dalam file statis;
  • Anda mungkin memiliki aplikasi server, misalnya untuk memproses input formulir, yang dengan sendirinya menghasilkan teks yang terlihat oleh pengguna;
  • dari sudut pandang linguistik, itu jarang untuk konten situs web hanya sekitar satu bidang: beberapa terminologi TI hampir pasti akan merayap di suatu tempat.

Untuk dua alasan pertama, itu tidak biasa untuk melibatkan situs web Anda teks dalam format berbeda disimpan dalam file berbeda. Anda mungkin memiliki beberapa file HTML mentah atau teks yang dapat Anda ekstrak dengan mudah ke file teks atau dokumen kata dari sistem manajemen konten Anda, ditambah beberapa data dalam database yang mungkin perlu Anda ekstrak ke file CSV atau dump SQL, ditambah beberapa properti file yang digunakan oleh server back-end Anda. Pada tahap awal mendapatkan penawaran untuk proyek tersebut, beri tahu penerjemah format file apa yang paling nyaman untuk Anda untuk bekerja dengan (dan mengirim sampel) dan menanyakan apakah mereka dapat bekerja dengan format itu. (Dalam kasus saya, misalnya, saya melihat klien menghabiskan waktu untuk mengonversi file CSV ke dalam dokumen kata dan membuat teks dalam proses, ketika saya cukup senang bekerja dengan file CSV asli.)

Masalah linguistik

Meskipun sebagian besar situs web akan melibatkan beberapa terminologi TI pada tahap tertentu, ini mungkin tidak menjadi masalah linguistik utama yang terlibat dalam pelokalan situs web. Alasan saya mengatakan ini adalah karena masalah teknis yang akan kami lihat di bawah, saya sangat menyarankan untuk mengontrakkan terjemahan situs web kepada penerjemah yang piawai dengan IT di tempat pertama.

Keputusan linguistik awal, tetapi yang mungkin bisa dibuat oleh penerjemah untuk Anda, kekhawatiran bentuk alamat : seperti yang Anda ketahui, berbagai bahasa menggunakan bentuk kata kerja yang berbeda untuk mengatasi pembaca / pendengar baik "secara informal" atau "secara formal" misalnya tu vs vous perbedaan dalam bahasa Prancis), dengan beberapa bahasa bahkan memiliki perbedaan tiga arah. Bentuk alamat mana yang sesuai akan bergantung pada target audiens Anda dan kebiasaan negara yang Anda targetkan; Oleh karena itu penerjemah mungkin perlu berkonsultasi dengan Anda tentang siapa target audiens utama Anda dan kesan apa yang ingin Anda berikan (apakah Anda ingin teks Anda terdengar "serius" atau lebih "hip dan trendi"?).

Masalah linguistik lainnya datang dalam menerjemahkan item pendek dari database atau file properti, di mana terkadang ada kekurangan konteks. Apakah maksud Anda "cek" seperti dalam "cek", atau sebagai "verifikasi"? Apakah maksud Anda "naik" seperti "harga lebih tinggi" atau seperti "masuk ke bagian atas halaman"? Dan dalam kasus string yang dapat memiliki parameter (dilambangkan dengan urutan {0}, {1} dll dalam file properti di Java dan berbagai bahasa lainnya), apa nilai-nilai yang berbeda yang parameter ini mungkin miliki (karena mereka dapat mempengaruhi terjemahan)?

Terkadang menyelesaikan masalah ini akan mengharuskan Anda menjawab pertanyaan langsung dari penerjemah tentang interpretasi teks Anda. Tetapi sebagai langkah sederhana yang dapat menghemat waktu dan pertanyaan, saya sarankan untuk menggunakannya beberapa file properti . Biarkan setiap area utama dari situs / aplikasi Anda memiliki file properti sendiri. Dan khususnya, biarkan bagian dari server / situs Anda yang alamat orang yang berbeda memiliki file properti mereka sendiri. Sangat penting, jika Anda mungkin dapat menghindarinya, jangan mencampur dalam string file yang sama yang ditujukan untuk pengunjung situs web dan string yang merupakan bagian dari sistem administrasi back-end Anda.

Masalah praktis dan teknis

Ketika Anda mendapatkan materi yang diterjemahkan kembali dari penerjemah (atau memang, idealnya sebelumnya!), Ada satu atau dua masalah praktis yang mungkin perlu Anda pertimbangkan. Anda mungkin telah mengamati perbedaan dalam jumlah kata yang dapat terjadi antara satu bahasa dan bahasa lainnya (biasanya, teks dalam bahasa yang berasal dari bahasa Latin seperti Prancis dan Spanyol sekitar 20-30% lebih panjang daripada bahasa Inggrisnya). Ini bisa memiliki efek tidak hanya pada tata letak halaman Anda tetapi juga pada ukuran bidang basis data. Lebih subtly, penghitungan karakter dalam bahasa lain mungkin serupa, tetapi jumlah kata bisa berubah secara drastis jika bahasa itu digunakan penggabungan lebih luas daripada bahasa Inggris (misalnya, Anda mungkin menemukan bahwa teks yang diterjemahkan dalam Bahasa Finlandia memiliki jumlah karakter yang mirip dengan bahasa Inggris, tetapi setengah jumlah kata). Tata letak dengan kolom sempit yang berfungsi pada halaman bahasa Inggris Anda mungkin tiba-tiba terlihat malapetaka ketika diterapkan pada terjemahan Jerman atau Finlandia.

Jika situs Anda bersifat interaktif, maka Anda memiliki masalah tambahan dalam menerima memasukkan bahwa pengguna akan mengharapkan untuk dapat menyediakan dalam formulir web Anda, dll. Ini akan mencakup, misalnya, kemampuan untuk memasukkan karakter beraksen atau rentang karakter yang lebih besar, ditambah beberapa perubahan lebih banyak perbedaan pada validasi situs Anda. Dalam bahasa Inggris, Anda mungkin memiliki ruang yang tidak diizinkan di bidang Nama Keluarga. Tetapi pembicara dari berbagai bahasa lain biasanya memiliki beberapa nama keluarga dan berharap untuk dapat memasukkan spasi di bidang ini.

Dua masalah lain, kadang terkait, adalah pengkodean karakter dan pemeriksaan . Esai pertama mengacu pada cara di mana karakter disimpan / diwakili oleh komputer (bagaimana karakter diterjemahkan ke dalam byte). Pengarah kedua tentang bagaimana karakter dan string dibandingkan dan diurutkan: misalnya, apakah e dengan aksen akut dianggap sama dengan satu tanpa aksen untuk tujuan pencarian, dan di mana urutannya muncul ketika menyortir. Masalah-masalah ini biasanya tidak muncul ketika berhubungan murni dengan bahasa Inggris, tetapi biasanya perlu dipertimbangkan ketika berhadapan dengan teks dalam bahasa lain.

Encoding karakter berbeda dari sistem ke sistem, dengan beberapa standar umum termasuk ISO-8859-1, UTF-8 plus encode lain seperti Mac OS Roman. Bergantung pada situs web / aplikasi Anda, Anda mungkin perlu memastikan bahwa Anda memiliki pengkodean karakter yang benar yang dikonfigurasi pada berbagai lapisan:

  • saat membaca di file yang diterjemahkan;
  • saat membaca / menulis ke database Anda melalui JDBC atau kerangka lapisan aplikasi lainnya;
  • saat membaca input data oleh pengguna melalui Servlet API dll;
  • pada bidang database definisi sendiri, untuk memastikan mereka dapat menyimpan berbagai karakter yang diperlukan.

Bagaimana Anda tahu jika Anda memiliki pengkodean karakter yang benar? Tanda-tanda dari pengkodean karakter yang salah dalam berbagai bahasa berbasis Latin seperti Perancis dan Spanyol adalah jika Anda sering melihat urutan dua karakter beraksen di samping satu sama lain, mungkin termasuk huruf kapital di tengah kata-kata. (Ini terjadi ketika file yang dikodekan dalam UTF-8 salah diartikan seolah-olah berada dalam pengkodean ISO-8859-1 atau Mac OS.)

Masalah pengumpulan (penyortiran / pencocokan) dapat ditangani pada lapisan basis data (kebanyakan sistem DB memungkinkan mode penumpukan dikonfigurasikan untuk kolom / tabel / basis data tertentu). Atau mungkin berhubungan dengan pada lapisan aplikasi (di Java, lihat kelas Collator sebagai alternatif atau ekstensi ke metode Collections.sort () dan String.equals () mentah).

Kesimpulan

Saya harap dalam artikel ini telah menyoroti beberapa bidang utama yang menjadi perhatian ketika melokalkan situs web, dan menunjukkan bahwa masalah tersebut dapat melampaui terjemahan itu sendiri. Bekerja dengan penerjemah yang sadar akan masalah ini dapat menghemat waktu dan upaya Anda dalam membuat bisnis Anda tersedia di berbagai negara yang ingin Anda targetkan.

[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *