Thứ Hai, 2 tháng 4, 2012

Dich tự động

Dịch “tự động”

(Bài này viết đã lâu, chỉ đưa lên đây để lưu làm tư liệu).

Giấc mơ viết các loại phần mềm dịch tự động hoàn chỉnh vẫn còn xa vời. Tuy nhiên với người dịch chuyên nghiệp, nhất là dịch văn bản khoa học, kỹ thuật, pháp lý, kinh doanh… đã có những phần mềm hữu dụng, có thể giúp họ nâng năng suất vài ba lần.

Có khá nhiều phần mềm hỗ trợ dịch thuật nhưng tựu trung chúng có ba chức năng chính: phân đoạn văn bản nguồn, duy trì định dạng văn bản nguồn khi dịch và cung cấp bộ nhớ dịch thuật tự động (translation memory – TM). Dĩ nhiên văn bản nguồn phải có sẵn trong máy.

Phân đoạn sẽ giúp người dịch không cần đảo mắt tìm câu cần dịch. Các phần mềm tự động tô màu câu cần dịch và chuyển con trỏ vào một ô sẵn sàng để người dịch gõ vào. Chức năng tự động đơn giản này hoá ra rất hữu ích vì nhờ nó người dịch không bỏ sót câu nào. Ngoài ra người dịch không cần mất công định dạng văn bản dịch vì phần mềm tự động chuyển định dạng ở văn bản nguồn sang văn bản dịch một cách chính xác, kể cả bảng biểu, canh lề, đánh dấu…

Chức năng quan trọng nhất là bộ nhớ TM - điều này có nghĩa những từ, cụm từ hay câu nào đã dịch rồi, người dịch không cần lập lại. Phần mềm sẽ tự động lấy từ bộ nhớ nó tạo ra trong quá trình dịch và mỗi khi gặp câu lập lại, nó sẽ tự động gợi ý ngay trong ô đang dịch. Chức năng này rất có lợi vì đa số các loại văn bản kỹ thuật, các sách hướng dẫn sử dụng hay văn bản pháp lý, câu giống nhau hay gần giống nhau rất nhiều. Nó cũng giúp người dịch dùng từ nhất quán và chính xác trong suốt văn bản. Nhờ chức năng này, người ta có thể dùng phần mềm dịch thuật cho hầu hết các ngôn ngữ, miễn sao chúng có thể xử lý bằng Word và Unicode. Và dĩ nhiên, người dịch sử dụng càng lâu, tạo ra bộ nhớ càng lớn thì khả năng gặp lại cụm từ hay câu đã dịch càng lớn.

Trong các loại phần mềm dịch thuật trên thị trường, phổ biến nhất có Trados, Déjà Vu và Wordfast. Trados nổi tiếng nhất nhờ chiến dịch marketing rất rầm rộ đến nỗi rất nhiều hợp đồng dịch trên mạng mỗi khi gọi thầu đều yêu cầu người dịch sử dụng Trados. Tuy nhiên, Trados khá đắt, khoảng 700 đô-la Mỹ và khó sử dụng, muốn thành thạo cũng mất phải hai ba tuần. Déjà Vu cũng có giá khoảng 850 đô-la.

Do đã sử dụng Wordfast một thời gian, xin giới thiệu kỹ hơn về phần mềm này. Thật ra, Wordfast là một tập hợp nhiều macro trong một template có thể cài ngay trong Microsoft Word. Đầu tiên bạn vào trang web của Wordfast (www.wordfast.net hay www.champollion.net), tải về một file nén chỉ khoảng 0,5MB. Giải nén, bạn sẽ thấy một file wordfast.dot, dùng Word để mở file này như các file văn bản thông thường. Trước đó, trong Word, bạn phải mở Tools/Macro/Security, chọn “Low”; trong thẻ Trusted sources, chọn “Trust the Visual Basic project”. Nhấn vào nút “Install Wordfast”. Cài đặt xong, bạn sẽ thấy trên menu của Word bây giờ có thêm một menu phụ của riêng Wordfast.

Menu của Wordfast

Bây giờ bạn có thể mở văn bản cần dịch, nhấn vào biểu tượng của Wordfast trên thanh menu của Word, hình 1 sẽ xuất hiện. Nhấn thẻ TM, và nhấn vào nút New TM để tạo một bộ nhớ dịch mới. Bạn chọn ngôn ngữ nguồn và ngôn ngữ đích (mã của các ngôn ngữ nằm trong file hướng dẫn bạn tải về kèm theo phần mềm).

Hình 1


Bắt đầu dịch bằng cách nhấn tổ hợp phím Alt+Down (tức lệnh Next), phần mềm sẽ tự động tô màu câu đầu tiên cần dịch và tạo sẵn một ô khác cho bạn dịch vào. Cứ tiếp tục cho đến hết văn bản. Trong quá trình này nếu gặp lại câu bạn đã dịch, ô tạo sẵn có luôn câu dịch, nếu hai câu không giống nhau hoàn toàn, bạn cũng có thể chỉnh sửa dễ dàng. Nếu gặp những cụm từ giống nhau, phần giống nhau đó sẽ được tô màu khác, nếu đồng ý, bạn chỉ cần nhấn nút chấp nhận để phần mềm tự động đưa nó xuống ô tạo sẵn cho bạn (các lệnh và phím tắt, xin tham khảo file hướng dẫn sử dụng tải về cùng phần mềm).

Wordfast có một chức năng rất hay là giúp bạn tạo một mục từ (glossary) để đến khi gặp các từ trong glossary, nó sẽ dịch tự động cho bạn; glossary có thể chứa đến 200.000 cụm từ. Đến khi dịch xong bạn sẽ thấy văn bản bây giờ rất lộn xộn, mất định dạng cũ và gồm cả từng câu văn bản gốc (ở dạng hidden text) xen lẫn câu vừa dịch. Chỉ cần bấm vào menu Wordfast, chọn chức năng “Clean up”, một văn bản dịch hoàn chỉnh, sạch sẽ sẽ hiện ra.

Cái hay của Wordfast là nó gần như miễn phí, bản bạn tải về có đầy đủ mọi chức năng, chỉ có điều bộ nhớ dịch chỉ chứa 500 đơn vị (đủ để dịch một tài liệu vài chục trang). Nếu trả tiền, bạn sẽ mở rộng bộ nhớ đến nửa triệu đơn vị. Nhưng với những tài liệu có độ dài trung bình, bạn sẽ không dùng hết 500 đơn vị Wordfast cho sử dụng miễn phí.





Link to full article

Không có nhận xét nào:

Đăng nhận xét

Girls Generation - Korean