Hiệu đính bản dịch máy – Các yêu cầu

Hiệu đính bản dịch máy – Các yêu cầu

Sự tiến hóa của dịch máy (MT) có thể được coi là một yếu tố thay đổi cuộc chơi trong ngành dịch thuật. Các công ty dịch thuật cần xem xét về chất lượng của các dịch vụ dịch thuật, và định nghĩa lại dịch vụ dịch thuật là gì trong bối cảnh dịch thuật có sự tham gia của cả máy móc.
Hiệu đính dịch máy
Artificial intelligence, machine learning, ai, data deep learning for future technology artwork, mining, isometric, neural network, machine programming and Responsive web banner. vector.

Định nghĩa thuật ngữ sử dụng trong bài viết

  • Post-editing – hiệu đính bản dịch máy / sửa lỗi bản dịch máy: Có nghĩa là quá trình một người thực hiện sửa lỗi bản dịch do phần mềm máy tính tạo ra.
  • Bản dịch thô: Là bản dịch được tạo ra trực tiếp từ máy dịch mà chưa có sự can thiệp chỉnh sửa bởi con người
  • Dịch máy (MT) là tự động và người dùng có quyền truy cập vào công cụ Dịch máy, chẳng hạn như Google Dịch, có khả năng nhận được văn bản dịch thô ngay lập tức. Máy dịch MT thường dùng kết quả dịch có sẵn trong cơ sở dữ liệu và dịch như một dạng tự điển theo câu.
  • Dịch máy Nơ-rôn (Dịch máy thần kinh – NMT) liên quan đến việc sử dụng mạng lưới Nơ-rôn để đạt được các bản dịch gần hơn với những bản dịch mà con người tạo ra. Dịch máy Nơ-rôntiến bộ hơn dịch máy MT do nó có khả năng tự học hỏi và tự đào tạo trong quá trình dịch thuật giống như não người.
  • Post-editor – Người hiệu đính bản dịch máy: là người thực hiện việc sửa lỗi các bản dịch thô do máy tạo ra.

ISO 18587:2017 Dịch vụ Dịch thuật – Hiệu đính bản dịch máy – Các yêu cầu

Dịch Máy (Machine Translation – MT) hay Dịch Tự Động là sự kết hợp giữa ngôn ngữ – dịch thuật – khoa học máy tính. Trong những năm gần đây, với sự xuất hiện của Dịch Máy Nơ-ron (NMT) cùng hệ thống dữ liệu đồ sộ nên các máy dịch đã cải thiện được khá nhiều về tính tự nhiên của ngôn ngữ. Tuy nhiên đầu ra của MT vẫn còn cách xa sự hoàn hảo và đòi hỏi có sự tham gia của con người vào quá trình sửa lỗi (Post-Editing) để có kết quả chất lượng cao. ISO 18587:2017 ra đời nhằm đưa ra các yêu cầu đối với quá trình Post-Editing  hoàn chỉnh, có con người tham gia vào đầu ra của bản dịch máy cũng như yêu cầu về năng lực của người thực hiện.

Phạm vi của Tiêu chuẩn chất lượng của ISO 18587:2017

Chính sự cải tiến nhanh chóng và những tiến bộ rõ rệt của Máy dịch đã khuyến khích Tổ chức Tiêu chuẩn Quốc tế tập trung vào khía cạnh thứ hai, cụ thể là Hiệu đính bản dịch máy.

ISO 18587:2017 mô tả các quy trình liên quan đến việc Hiệu đính bản Dịch máy bởi một nhà ngôn ngữ học có năng lực (post-editor), và thiết lập các yêu cầu về năng lực cần thiết cho người hiệu đính. Hiệu đính bản dịch máy là quá trình trong đó một nhà ngôn ngữ học sửa lại (đọc và sửa) bản dịch đầu ra MT thô.

Vai trò mới của người dịch và người soát xét

Tiêu chuẩn chủ yếu đề cập đến thuật ngữ “hiệu đính bản dịch máy” và tập trung vào “người hiệu đính” thay vì người dịch. Theo nghĩa chặt chẽ, bất cứ khi nào văn bản đầu vào vượt qua quá trình kiểm tra của công cụ CAT ban đầu hoặc bất kỳ phân tích trước khi dịch hoặc xử lý nội dung nào được máy tính hỗ trợ, nó sẽ trở thành một bản dịch đầu ra của máy.

Người hiệu đính bản dịch máy cần có trình độ tương tự như các dịch giả

Trong ISO 18578, những người sửa lỗi được coi là các chuyên gia dịch thuật theo cùng một định nghĩa như trong ISO 17100, do đó một nhà cung cấp dịch vụ dịch thuật cần cung cấp bằng chứng rằng những người sửa lỗi bản dịch máy chứng minh được:

  • có bằng cấp ngôn ngữ thông qua một chương trình đào tạo dịch thuật viên từ một tổ chức được công nhận, hoặc
  • có bằng cấp từ một lĩnh vực khác ngoài dịch thuật, có hai năm kinh nghiệm làm việc chuyên nghiệp trong dịch hoặc sửa lỗi, hoặc
  • có kinh nghiệm 5 năm làm dịch hoặc sửa lỗi toàn thời gian.

Đào tạo là bắt buộc đối với người hiệu đính bản dịch máy

Sửa lỗi bản dịch máy cũng có những đặc tính riêng mà khi các dịch giả biến đổi thành người sửa lỗi bản dịch máy cũng cần phải bổ sung kỹ năng. Do máy móc được sử dụng nhiều trong quá trình dịch thuật nên việc chỉnh sửa đầu ra của MT đòi hỏi kiến thức đặc biệt về các công cụ CAT và hiểu biết về cách các hệ thống quản lý dịch và thuật ngữ tương tác với MT và các hệ thống MT. Người sửa lỗi cần được đào tạo kỹ lưỡng để sử dụng đúng các công cụ sửa lỗi, nhận biết các lỗi MT phổ biến, đánh giá xem có ý nghĩa để sửa lỗi đầu ra của MT dựa trên công sức và thời gian đã bỏ ra và làm quen với sự khác biệt giữa các quy trình sửa lỗi đầy đủ và sửa lỗi nhẹ cũng như kết quả cuối cùng.

Để duy trì một sự tôn trọng cao đối với các nhà hoạt động trong ngành dịch thuật, và đặc biệt là đối với các công ty phụ thuộc vào việc sử dụng bộ nhớ dịch và các nguồn và quy trình dịch khác bao gồm MT, chúng tôi rất khuyến khích làm quen với tiêu chuẩn ISO 18587 và cũng xem xét phương pháp chất lượng của các nhà cung cấp dịch bên thứ ba của họ trong ngữ cảnh của sửa lỗi sau đầu ra của MT.

Sự trỗi dậy của Máy dịch

Bạn đã bao giờ sử dụng Google Dịch để dịch một email hoặc một từ hoặc văn bản mà bạn không hiểu sang ngôn ngữ mẹ đẻ của mình chưa? Bạn đã bao giờ đọc một bình luận trên Facebook được dịch tự động từ một ngôn ngữ mà bạn không hiểu chưa? Nếu câu trả lời là có thì bạn đã sử dụng MT. MT đã trở nên phổ biến trong cuộc sống hàng ngày của công ty dịch thuật, nhà ngôn ngữ học và thậm chí cả những người không cố ý liên kết công việc hoặc sở thích của họ với dịch thuật. Một nghiên cứu được thực hiện tại Việt Nam năm 2023 của AM Việt Nam cho thấy gần 100% các công ty dịch thuật và dịch thuật viên ứng dụng MT.

Một trong những lý do khiến Dịch máy có được những cải tiến như vậy là nhờ sự đóng góp của những gã khổng lồ công nghệ như Microsoft, Google, ChatGPT.

Hiện nay có 4 công nghệ dịch máy là Dịch máy Nơ-rôn, Dịch máy thống kê (SMT), Dịch máy dựa trên quy tắc (RBMT) và Dịch máy dựa trên cụm từ (PBMT). Chính Dịch máy Nơ-rôn đã cho thấy kết quả tốt nhất và là động lực chính thúc đẩy Dịch máy phát triển.

Một nghiên cứu đã chỉ ra rằng việc sử dụng PBMT dẫn đến năng suất dịch tăng 18%, trong khi NMT giúp tăng 36% và giúp giảm 42% số lần nhấn phím mà các nhà ngôn ngữ học cần thực hiện trong quá trình chỉnh sửa hậu kỳ.

Thuật ngữ “Dịch như Google”

Theo nghiên cứu gần đây của AM Việt Nam, thuật ngữ dịch như Google được khách hàng sử dụng để đánh giá bản dịch của một công ty hoặc dịch thuật viên. Nghe có vẻ họ đang chỉ trích khéo về chất lượng của bản dịch, có thể khách hàng đang không hài lòng với cách bản dịch của bạn thể hiện. Đây là một thực tế hay gặp khi khách hàng thuê những công ty dịch giá rẻ hoặc thuê người dịch thiếu năng lực trong khi phải chạy tiến độ khá gay gắt.

Trên thực tế ứng dụng, Máy dịch kể cả là Máy dịch Nơ-rôn cũng còn nhiều hạn chế rõ rệt mà người dịch không thể trông chờ. Các bản dịch máy thường dịch theo đại ý, dễ mắc sai lầm do không thể đoán định ngữ cảnh hay đơn giản là dùng thuật ngữ không trúng. Để giải thích điều này rất đơn giản: Ngôn ngữ là văn hóa tự nhiên được tạo ra và tích lũy, một cỗ máy vô tri thì không thể hiểu hết được ý tứ của văn bản.

Tuy nhiên, việc ứng dụng MT vào dịch thuật sẽ giúp cho các công ty dịch thuật:

  • Tăng năng suất
  • Giảm thời gian xử lý các dự án dịch thuật của họ
  • Giảm chi phí so với dịch thuật truyền thống do con người thực hiện TEP đầy đủ
  • Tùy chỉnh máy dịch cho từng khách hàng cụ thể để có bản dịch tốt hơn

Tiêu chuẩn hóa chất lượng dịch thuật

Ý tưởng đằng sau việc tiêu chuẩn hóa và đặc biệt là các tiêu chuẩn ISO khá đơn giản. Về cơ bản, nó là việc tìm ra cách thực hành tốt nhất để thực hiện điều gì đó, tập hợp các phương pháp thực hành tốt nhất trong ngành vào một tài liệu tiêu chuẩn duy nhất được quốc tế công nhận và trao chứng chỉ tuân thủ cho những ai đáp ứng các tiêu chuẩn này. Ngoài ra, những người nhận chứng chỉ còn được đánh giá thường xuyên để đảm bảo rằng họ tiếp tục đáp ứng các yêu cầu.

Hiệu đính bản dịch máy: cơ hội và những hạn chế

Điểm đầu tiên cần nhấn mạnh là Dịch máy phụ thuộc rất nhiều vào công nghệ được sử dụng, được biết đến trong ngành là Công cụ dịch máy. Ngược lại, chất lượng của công cụ phụ thuộc vào công nghệ điều khiển nó và lượng dữ liệu song song, được gọi là văn bản song song đóng vai trò là nguồn dữ liệu cho công cụ MT.

Không thể phủ nhận rằng Máy dịch đã có sự tiến bộ đáng kể trong những năm gần đây. Tuy nhiên, đầu ra MT “thô” sẽ cần được một nhà ngôn ngữ học sửa lại trong một quy trình được gọi là Post-editing nếu khách hàng yêu cầu bản dịch cần văn bản dịch phải rất chính xác, hoàn toàn nhất quán, thể hiện một dòng ngôn ngữ xuất sắc và tuân thủ theo những yêu cầu cụ thể hay tham khảo theo nội dung dịch thuật hiện có, chẳng hạn như Bộ nhớ dịch (TM) của khách hàng, bảng thuật ngữ (cơ sở thuật ngữ).

Mặc dù tùy thuộc vào loại văn bản và mức độ sáng tạo về mặt ngôn ngữ văn bản nguồn, nhưng kết quả đầu ra MT thô có khả năng tạo ra văn bản trôi chảy và có vẻ như thể hiện rất tốt những ý nghĩa thông điệp có trong bản gốc, đặc biệt là ngay từ cái nhìn đầu tiên.

Tuy nhiên, nếu không có bất kỳ sửa đổi nào thêm, có thể các sắc thái ý nghĩa tinh tế hơn sẽ bị mất, văn bản thu được sẽ có một số điểm không chính xác với các chữ viết tắt, từ viết tắt và phần place-holder, đồng thời văn bản sẽ không hoàn toàn nhất quán với chính nó (đặc biệt đối với các văn bản dài) và với các nội dung dịch hiện có, chẳng hạn như TM hoặc bảng chú giải.

Các hình thức Hiệu đính bản dịch máy theo ISO 18587:2017

ISO 18587:2017 chỉ ra hai loại Hiệu đính MT riêng biệt:

  • Hiệu đính đầy đủ cung cấp một bản dịch có thể tương đương với một sản phẩm được thực hiện hoàn toàn bởi con người theo tiêu chuẩn ISO 17100
  • Hiệu đính nhẹ cung cấp một bản dịch chỉ đơn giản là có thể hiểu được

Trong quá trình hiệu đính đầy đủ, nhà ngôn ngữ học đảm bảo rằng văn bản dịch thu được có chất lượng tương đương với chất lượng được thực hiện hoàn toàn do con người dịch (tương tự Tiêu chuẩn ISO 17100). Cách tiếp cận này cung cấp chất lượng dịch thuật cao nhất. Rõ ràng, nếu chiếu theo quan điểm “chất lượng” hiện nay trong ngành dịch thuật thì chỉ sự sửa lỗi đầy đủ mới đáp ứng các tiêu chuẩn chất lượng khi nó cung cấp một kết quả hoàn hảo và chuyên nghiệp.

Trong quá trình hiệu đính nhẹ, nhà ngôn ngữ học sẽ xem xét bản dịch thô và thực hiện các thay đổi tối thiểu để tạo ra văn bản dễ hiểu. Trong trường hợp này, người hiệu đính không cố gắng tạo ra một văn bản có thể so sánh được với chất lượng do người dịch cung cấp. Điều này mang lại chất lượng dịch chỉ ở mức cơ bản và người sử dụng có thể gặp phải những rủi ro về ý nghĩa do quá trình soát xét không được thực hiện một cách tỷ mỉ.

Trên thực tế còn phụ thuộc vào cách dùng bản dịch cuối cùng, ví dụ bản dịch có được xuất bản công chúng hay chỉ dừng ở mức tham khảo để lựa chọn sử dụng phương pháp sửa lỗi nào. Tiêu chuẩn cũng đã nêu ra những yêu cầu mà “sửa lỗi nhẹ” cần đáp ứng để được xem là một dịch vụ. Việc xem xét liệu chất lượng đầu ra sau sửa lỗi khả thi trong tương lai gần hay không là một vấn đề cần thảo luận thêm.

Sự khác nhau cơ bản của Hiệu đính đầy đủ và Hiệu đính nhẹ

Nhiệm vụ của người hiệu đính bản dịch máy là xem lại đầu ra MT, kiểm tra độ chính xác, tính nhất quán, khả năng đọc và các thông số khác cũng như sửa bất kỳ lỗi nào. Điều quan trọng cần lưu ý là chất lượng đầu ra MT thô phụ thuộc vào một số yếu tố sau đây:

  • Công cụ MT và chất lượng cũng như độ lớn của kho dữ liệu song ngữ
  • Sự kết hợp ngôn ngữ
  • Dạng văn bản
  • Văn phong được sử dụng trong văn bản nguồn

Những người thực hiện công việc Hiệu đính nhẹ sẽ thường tập trung vào 4 khía cạnh sau:

  • Đảm bảo không có nội dung nào được thêm hoặc lược bỏ trong bản dịch so với văn bản nguồn.
  • Sửa bất kỳ lỗi nghiêm trọng nào trong bản dịch thô
  • Sắp xếp lại câu để làm rõ hoặc đưa ra nghĩa đúng
  • Bám sát đầu ra thô nhất nếu có thể và chỉ khắc phục những vấn đề dịch thuật rõ ràng nhất

Về cơ bản, điều này có nghĩa là kết quả cuối cùng sẽ thể hiện ý chính của văn bản nguồn, với tất cả nội dung nguồn hiện diện và phản ánh trong văn bản đích. Tuy nhiên, văn bản thu được có thể sẽ thiếu về phong cách ngôn ngữ, tính nhất quán của thuật ngữ và các sắc thái ý nghĩa kém tinh tế hơn.

Những người thực hiện công việc hiệu đính đầy đủ sẽ tập trung vào nhiều khía cạnh hơn, bao gồm:

  • Đảm bảo đầy đủ thông tin, nghĩa là văn bản dịch không có bất kỳ thiếu sót hoặc bổ sung nào so với nguồn
  • Sửa mọi lỗi xuất hiện trong bản dịch
  • Điều chỉnh cấu trúc câu để đảm bảo nghĩa rõ ràng và đúng
  • Đảm bảo rằng bản dịch chính xác về các yêu cầu ngữ pháp, cú pháp và ngữ nghĩa của ngôn ngữ đích
  • Sử dụng thuật ngữ chính xác và nhất quán theo chuyên ngành và hoặc theo khách hàng cụ thể
  • Đảm bảo văn bản đúng về chính tả và dấu câu
  • Đảm bảo rằng văn phong phù hợp với loại văn bản, đối tượng mục tiêu và, nếu có, nhất quán với bất kỳ hướng dẫn về văn phong cụ thể nào
  • Điều chỉnh bất kỳ phần place-holder nào và định dạng của bản dịch cũng như các liên kết để phù hợp với nguồn và các quy ước của ngôn ngữ đích
  • Sửa đổi bản dịch để đảm bảo tuân thủ mọi hướng dẫn hoặc nguyên tắc bổ sung dành riêng cho khách hàng hoặc dự án

Nói chung, các tiêu chí này tương tự như các tiêu chí của bản dịch do con người thực hiện.

Vậy nên sử dụng hình thức Hiệu đính nào?

Câu trả lời là: phụ thuộc vào cách bản dịch sẽ được sử dụng.

Bạn có đang tìm cách tăng tốc quá trình dịch, đồng thời muốn chất lượng bản dịch có thể so sánh được với quá trình dịch thuật của con người theo tiêu chuẩn ISO 17100:2015? Bạn nên sử dụng Hiệu đính đầy đủ.

Hoặc khi bạn chỉ cần dịch thuật tìm kiếm những thông tin hữu ích của tài liệu mà không tốn quá nhiều chi phí? Có lẽ bạn đang tìm kiếm giải pháp Hiệu đính nhẹ.

ISO 18587: Ý nghĩa đối với các nhà cung cấp dịch thuật

Chất lượng là một trong những yếu tố quan trọng nhất trong ngành dịch thuật. Các công ty dịch thuật biết rằng chất lượng dịch cao là không chỉ một chiến lược bán hàng liên tục, mà còn hiểu rằng sự nhận thức về chất lượng trong toàn bộ ngành là quan trọng đối với tất cả các bên tham gia.

Sự tiến hóa của dịch máy (MT) có thể được coi là một yếu tố thay đổi cuộc chơi trong ngành dịch thuật.  Các công ty dịch thuật cần xem xét về chất lượng của các dịch vụ dịch thuật, và định nghĩa lại dịch vụ dịch thuật là gì trong bối cảnh dịch thuật có sự tham gia của cả máy móc.

Tổ chức Tiêu chuẩn Hóa Quốc tế (ISO) cùng với các chuyên gia trong ngành dịch thuật đã giải quyết vấn đề này bằng cách ban hành hai tiêu chuẩn quốc tế liên quan đến dịch thuật, đó là:

ISO 17100:2015 Dịch Vụ Dịch Thuật – Yêu Cầu cho Dịch Vụ Dịch Thuật, được cải tiến từ tiêu chuẩn EN 15038.

ISO 18587:2017 Dịch vụ dịch thuật – Các yêu cầu Hiệu đính bản dịch máy, một tiêu chuẩn hoàn toàn mới xác định một khung và các yêu cầu cho người hiệu đính bản dịch máy (sửa bản dịch đầu ra của máy).

Hiệu đính bản dịch máy – Các yêu cầu

84222_Xu hướng L&D

Top 7 Xu hướng Học tập và Phát triển trong Năm 2024

L&D đóng vai trò quan trọn trong đào tạo, thu hút và giữ chân nhân tài. Trong bối cảnh ngày càng xuất hiện nhiều xu hướng Học tập và Phát triển mới, nhiệm vụ này càng trở nên quan trọng hơn trong bối cảnh lực lượng lao động toàn cầu hiện đại, với việc các tổ chức cạnh gay gắt nhằm tuyển dụng được nhân sự chất lượng cho các phòng ban và vị trí, chưa kể đến sự cần thiết phải liên tục nâng cao trình độ kiến thức để bắt kịp với nhu cầu kinh doanh.

84149-Su dung Google dich hieu qua-2

04 Cách Sử dụng Google Translate Hiệu quả nhất

Google Translate đã được phát triển thành một công cụ đạt năng suất cao, giúp bạn tiết kiệm đáng kể thời gian và giải quyết được nhu cầu có một bản dịch đủ để hiểu nghĩa. Trong bài viết này, AM Việt Nam sẽ chia sẻ về 4 cách để sử dụng Google Translate hiệu quả nhất.