Tìm hiểu về các tiêu chuẩn trong ngành ngôn ngữ

Tìm hiểu về các tiêu chuẩn trong ngành ngôn ngữ

Tiêu chuẩn có thể hiểu đơn giản là cách thống nhất làm một việc gì đó. Hay nói cách khác, mọi công việc đều cần có trình tự và quy luật thực hiện. Tiêu chuẩn giúp nhà quản lý kiểm soát công việc một cách khoa học, kiểm soát chất lượng sản phẩm hoặc đáp ứng những tiêu chí thị trường. 

Tiêu chuẩn giúp chuẩn hóa quá trình, chuẩn hóa sản phẩm và từ đó, trở thành một biểu tượng về chất lượng. Hoặc như cách nói của ISO, tiêu chuẩn “thúc đẩy hoạt động hiệu quả.”

Chúng ta đã quen thuộc với nhiều tiêu chuẩn trong các lĩnh vực khác nhau, như tiêu chuẩn ISO về quản lý chất lượng, thiết bị y tế, tiêu chuẩn châu Âu, tiêu chuẩn của Đức, v.v. Trong số đó có các tiêu chuẩn cho ngành ngôn ngữ. Có thể bạn chưa biết, nhưng rất nhiều tiêu chuẩn trong số đó đang được áp dụng hàng ngày mà không được nhận ra.

Câu chuyện về tầm quan trọng của tiêu chuẩn

Hãy tưởng tượng về một thế giới không có tiêu chuẩn…

Thật là một giả định thú vị. Đầu tiên, thế giới này có lẽ sẽ không có đơn vị tiền tệ, do vậy, giao dịch sẽ chỉ được giới hạn với việc đổi chác, trong đó tiếp tục chỉ giới hạn với những vật được tạo thủ công. Riêng việc đến được trung tâm giao dịch cũng là một vấn đề không xác định. Đường xá có đủ rộng để xe chở hàng đi qua không trong khi không có tiêu chuẩn cho chiều rộng của đường?

Chương trình Podcast của Radiolab trước đó có một tập rất hay miêu tả về cuộc sống ở vùng Trung Tây nước Mỹ những năm 1800 trước khi áp dụng tính giờ theo tiêu chuẩn. Trước khi đưa hệ thống đường sắt vào ứng dụng, đồng hồ trong ngân hàng, quán rượu và cửa hiệu, cũng như đồng hồ bỏ túi được đặt theo thời gian mặt trời mọc và lặn.

Khi những thị trấn này được kết nối bởi đường ray, sự thiếu vắng của một tiêu chuẩn thời gian nổi lên thành một vấn đề. Làm thế nào phát triển được một hệ thống đường được kết nối trong khi “muộn” của một tàu lại là “sớm” với tàu khác? Vấn đề này cuối cùng đã yêu cầu phải ứng dụng hệ thống thời gian tiêu chuẩn gọi là “thời gian chạy tàu.” Ngày nay, thế giới (và các đoàn tàu) sử dụng Giờ Phối hợp Quốc tế.

Ngành ngôn ngữ cũng gặp phải các biến cố trong thời kỳ chưa có tiêu chuẩn. Khi phải dịch văn bản trước khi bộ mã Unicode được sử dụng rộng rãi, mỗi ngôn ngữ và nền tảng đều có những công cụ mã hóa hoán vị riêng. Một đoạn văn bản bằng tiếng Séc sẽ cần được mã hóa bằng bảng mã Windows-1250 nếu đọc trên máy cài Windows, trong khi đó máy cài Mac sẽ phải dùng bảng mã “Code Page 10029.” Thời đó, nội dung được chuyển mã liên tục, và thường xuyên xảy ra lỗi phông chữ.

Vấn đề còn nan giải hơn khi có một sự thật là rất nhiều bản dịch được thực hiện trên Microsoft Word sử dụng định dạng RTF, một giao thức chuyển đổi thực hiện mã hóa dựa vào loại phông chữ được dùng trong văn bản. Vì phông chữ cũng có thể được mã hóa theo nhiều cách, và mọi người thường không dùng cùng một phông trên máy, một văn bản trông đẹp mắt trong Microsoft Word này có thể bị lỗi phông trong Microsoft Word khác!

Điều may mắn sau đó là định dạng ngữ liệu song ngữ RTF được thay thế bằng XLIFF. Nhờ đó, ngày nay chúng ta hiếm khi còn gặp phải lỗi phông chữ này.

2. Chuẩn ngôn ngữ dịch thuật

Unicode và XML là hai chuẩn hiển thị ngôn ngữ rất nổi tiếng. Bạn cũng có thể quen với các chuẩn định dạng TMX, TBX và SRX trong việc chuyển đổi nội dung bộ nhớ dịch, ngữ liệu về thuật ngữ và quy tắc phân đoạn — được phát triển bởi Hiệp hội Tiêu chuẩn Ngành Bản địa hóa (LISA).

Sau đây là một số định dạng tiêu chuẩn khác mà bạn có thể chưa quen.

XLIFF 2

XLIFF 2 là một phiên bản của XLIFF, nhưng về cơ bản nó tự hình thành một tiêu chuẩn riêng vì XLIFF 2 không tương thích ngược lại với XLIFF. XLIFF 2 là kết quả của nhiều năm ứng dụng XLIFF trong thực tiễn, và vì thế nó là là một giải pháp cho các hạn chế của XLIFF. Giải pháp này cung cấp một phiên bản mở rộng hơn (thông qua các mô đun), bao gồm Mô đun Siêu dữ liệu, một tính năng có giá trị trong bối cảnh cần mở rộng nội dung.

XLIFF 2 được nhắc riêng vì, là một ngành đã hỗ trợ tốt cho phiên bản XLIFF trước, chúng ta hiểu nhầm rằng chúng ta đã “tiêu chuẩn hóa”. XLIFF 1 chắc chắn tốt hơn nhiều không có XLIFF, nhưng XLIFF 2 tốt hơn XLIFF 1. Có nhiều việc cần làm hơn.

TAPICC

TAPICC là Trường hợp và Phân loại trong Giao diện Lập trình Ứng dụng Dịch, một dự án xây dựng tiêu chuẩn. TAPICC là một sáng kiến được tài trợ bởi GALA (Hiệp hội Toàn cầu hóa và Bản địa hóa) nhằm mục đích tiêu chuẩn hóa các phương thức API (Giao diện Lập trình Ứng dụng) trong ứng dụng bằng nhiều công cụ CMS, TMS, LQA và các hệ thống khác cần thiết trao đổi thông tin trong khi thực hiện bản địa hóa.

MQM/DQF

Chuẩn đo Chất lượng Đa phương diện (MQM) và Khung Chất lượng Động lực (DQF) kết hợp phương thức MQM của Mạng lưới dữ liệu tiếng TAUS cung cấp một tiêu chuẩn thông qua đó chúng ta, với tư cách là một ngành, có thể xác định và lượng hóa tiêu chuẩn khi sử dụng cùng một ngôn ngữ.

Bộ Thẻ Phổ quát (ITS)

Bộ Thẻ Phổ quát là một cách để tăng lượng thông tin hỗ trợ công việc văn bản hóa trong các văn bản dạng XML và HTML (hoặc có thể tăng lượng thông tin về công việc văn bản hóa trong các văn bản).

Trong cuộc phỏng vấn với Giáo sư Dave Lewis trong Trung tâm Nghiên cứu ADAPT về vấn đề Nguồn Nội dung Toàn cầu, giáo sư đã miêu tả một trong những công trình ông đã thực hiện để hỗ trợ ý tưởng theo dõi nguồn với bộ thẻ.

Ở trên, chúng ta đã được giới thiệu về một số tiêu chuẩn phổ biến và thường dùng trong ngành ngôn ngữ. Theo dõi tại đây để tìm hiểu thêm các kiến thức phong phú khác về lĩnh vực ngôn ngữ cũng như nội dung số.

Là đơn vị tiên phong trong lĩnh vực dịch thuật và các giải pháp ngôn ngữ tại Việt Nam, AM Việt Nam luôn cập nhật và áp dụng những tiêu chuẩn mới nhất trong ngành. Với hai nền tảng cơ bản là tiêu chuẩn ISO 9001 và ISO 17100, AM Việt Nam tự tin đáp ứng được mọi yêu cầu của khách hàng, dù về chất lượng hay về yếu tố kỹ thuật.