02:53 PM 26/11/2018  |   Lượt xem: 650  | 

Quy định đã đưa ra được một quy trình thực hiện tương đối khoa học, hợp lý và mang tính phổ biến.

      Ở thời điểm hiện tại, công tác số hóa tài liệu lưu trữ đã được triển khai rộng rãi tại tất cả các cơ quan lưu trữ trên toàn lãnh thổ Trung Quốc. Tuy nhiên, do có nhiều loại hình vật mang tin nên mức độ triển khai số hóa tài liệu lưu trữ trên các loại hình vật mang tin khác nhau có sự khác biệt tương đối lớn, đặc biệt là trong công tác số hóa tài liệu lưu trữ ghi âm và ghi hình được tạo thành dưới dạng tín hiệu tương tự (analog signal)(1).

      Bởi nhiều nguyên nhân về mặt công nghệ, quản lý, tiêu chuẩn, được khởi đầu muộn, phát triển chậm chạp nên công tác số hóa đã làm ảnh hưởng lớn đến việc lưu trữ và khai thác, sử dụng tài liệu lưu trữ ghi âm, ghi hình. Vì vậy, để bảo đảm được tính pháp lý và tính khoa học của công tác số hóa tài liệu lưu trữ ghi âm, ghi hình, một số đơn vị thuộc Cục Lưu trữ nhà nước Trung Quốc, trong đó có Phòng Nghiên cứu Khoa học – Kĩ thuật, đã phối hợp xây dựng dự thảo “Quy định về việc số hóa tài liệu lưu trữ ghi âm, ghi hình” (DA/T 62-2017). Quy định này được công bố ngày 02 tháng 8 năm 2017, được áp dụng từ ngày 01 tháng 01 năm 2018.

      Bối cảnh ban hành

      Trước khi có sự xuất hiện của kĩ thuật số, tài liệu lưu trữ ghi âm, ghi hình đa phần đều được tạo lập dưới dạng tín hiệu tương tự (analog signal) và phụ thuộc vào các thiết bị đọc chuyên dụng. Cùng với thời gian, do chịu ảnh hưởng của nhiều yếu tố như sự thay đổi tự nhiên và điều kiện bảo quản, các tài liệu lưu trữ ghi âm, ghi hình đang dần bị hư hại. Bên cạnh đó, do sự phát triển của công nghệ, nhiều chủng loại thiết bị đọc chuyên dụng đang hoặc đã bị mất đi, nếu không kịp thời áp dụng các biện pháp để cấp cứu những nguồn thông tin lưu trữ  này sẽ tạo ra những tổn thất lớn cho nhà nước và xã hội. Bởi vậy, một xu hướng tất yếu hiện nay là phải thực hiện xử lý số hóa tài liệu lưu trữ ghi âm, ghi hình, từng bước hình thành nên nguồn tài liệu lưu trữ số, nhằm mục đích bảo vệ và giữ gìn cứu nguồn tài liệu lưu trữ quý báu, đồng thời, cung cấp để khai thác, sử dụng tài liệu số hóa một cách tiện lợi, hiệu quả.

      Tuy nhiên, trong thực tiễn công tác số hóa tài liệu lưu trữ ghi âm, ghi hình tồn tại nhiều vấn đề lớn, là những hạn chế về trình độ công nghệ, thiếu quy định về tiêu chuẩn hóa ... Chủng loại tài liệu lưu trữ ghi âm, ghi hình nhiều, chúng phụ thuộc vào kĩ thuật số hóa, phương pháp quản lý phức tạp hơn nhiều so với tài liệu lưu trữ giấy. Chủng loại vật mang tin của tài liệu lưu trữ ghi âm, ghi hình rất đa dạng, mỗi một loại lại có thể phân chia thành các dạng khác nhau dựa vào định dạng kĩ thuật. Tài liệu lưu trữ ghi âm, ghi hình ở định dạng kĩ thuật khác nhau sẽ có những thiết bị đọc chuyên dụng khác nhau, điều này đã làm tăng thêm tính phức tạp và độ khó của công tác số hóa. Việc các kho lưu trữ áp dụng những tiêu chuẩn kĩ thuật số hóa tài liệu lưu trữ ghi âm, ghi hình không thống nhất đã dẫn đến việc khó có thể đảm bảo được chất lượng của sản phẩm số hóa và tạo ra sự khác biệt về phương thức lưu trữ, định dạng lưu trữ. Điều này gây khó khăn cho các khâu như lưu trữ, trao đổi và khai thác, sử dụng các sản phẩm số hóa, làm ảnh hưởng đến việc triển khai công tác số hóa tài liệu lưu trữ ghi âm, ghi hình.

      Trong bối cảnh đó, năm 2012, Phòng Nghiên cứu Khoa học – Kĩ thuật trực thuộc Cục Lưu trữ nhà nước Trung Quốc đã đề xuất ý kiến xây dựng “Quy phạm về việc số hóa tài liệu lưu trữ ghi âm, ghi hình”. Nội dung này đã được Ủy ban Kĩ thuật Tiêu chuẩn hóa công tác lưu trữ toàn quốc thông qua.

      Nguyên tắc ban hành

     Trong quá trình ban hành Quy định nói trên, Tổ biên tập đã lấy việc phân tích các số liệu nghiên cứu và thực nghiệm làm cơ sở, xuất phát điểm là nhằm đáp ứng yêu cầu của thực tế, đưa ra những nguyên tắc chính như sau:

    1. Phải phù hợp với các tiêu chuẩn đã được ban hành;

    2. Phải chi tiết hóa các yêu cầu kĩ thuật của công tác số hóa;

    3. Phải tăng cường các yêu cầu về việc quản lý công tác số hóa;

     4. Phải tăng cường quan điểm về quản lý an toàn.

     Nội dung chủ yếu

     Quy định gồm có 13 chương, đặt ra những yêu cầu mang tính bắt buộc đối với toàn bộ quá trình thực hiện công tác số hóa tài liệu lưu trữ ghi âm, ghi hình.

    1. Phạm vi áp dụng và yêu cầu tổng thể

     Đối tượng áp dụng Quy định này là tài liệu lưu trữ ghi âm, ghi hình được tạo thành dưới dạng  tín hiệu tương tự, gồm có băng ghi âm, đĩa hát và băng ghi hình (U-matic, Betamax, VHS, Betacam, 8mm ...).

     Trên cơ sở điều tra, nghiên cứu, Tổ biên tập đã tiến hành tổng hợp nhiều quy trình số hóa tài liệu lưu trữ ghi âm, ghi hình đã được triển khai, chọn lọc những ưu điểm, từ đó, xây dựng được một quy trình thực hiện tương đối khoa học, hợp lý và mang tính phổ biến. Bố cục của Quy định cũng được sắp xếp theo quy trình công tác như vậy. (Xem hình vẽ 1 dưới đây).

    2. Tổ chức và quản lý

     Quy định này đã có riêng một chương “Tổ chức và quản lý”, đặt ra những yêu cầu quản lý hệ thống hóa về các mặt như cơ cấu, con người, cơ sở vật chất, phương án thực thi, cơ chế quản lý, kiểm soát quy trình thực hiện và việc thuê mướn bên ngoài thực hiện số hóa tài liệu lưu trữ.

    3. Tài liệu lưu trữ xuất (nhập) kho

     Đây là một bước quan trọng nhằm đảm bảo sự an toàn của tài liệu lưu trữ trong quá trình số hóa. Quy định đã quy định việc xuất kho, nhập kho đối với tài liệu lưu trữ, đặt ra những yêu cầu về quản lý tài liệu lưu trữ trong quá trình xuất (nhập) kho.

    4. Xử lý trước khi thực hiện số hóa

     Công việc này mang tính nền tảng nhằm đảm bảo chất lượng sản phẩm và hiệu quả công việc. Quy định đặt ra nhiều yêu cầu về các mặt như xác định phạm vi phân loại thông tin, các nội dung kiểm tra đối với tài liệu lưu trữ ghi âm, ghi hình.

     5. Xây dựng cơ sở dữ liệu

    Quy định yêu cầu, trước khi thực hiện công tác số hóa cần xây dựng cơ sở dữ liệu, quy định về các yêu cầu có liên quan đến việc xây dựng cơ sở dữ liệu này. Trong quá trình khảo sát, Tổ biên tập nhận thấy rằng, trước khi thực hiện công tác số hóa, rất nhiều kho lưu trữ đã xây dựng được cơ sở dữ liệu, như vậy, trong quá trình thực hiện số hóa chỉ cần xử lý quy phạm mã hóa nguồn cơ sở dữ liệu này là được. Việc xây dựng cơ sở dữ liệu là một khâu độc lập, có thể triển khai một cách linh hoạt trước khi thực hiện công tác số hóa.

    6. Thu thập thông tin

    Thu thập thông tin là một phần quan trọng liên quan đến những yêu cầu về tham số kĩ thuật trong Quy định, cũng là một trong những điểm quan trọng và khó khi xây dựng Quy định. Trong đó, phần “những yêu cầu cơ bản” đã chỉ ra một số yêu cầu mang tính nguyên tắc đối với việc thu thập thông tin của tài liệu lưu trữ ghi âm, ghi hình. Quy định những yêu cầu cụ thể về trang thiết bị thu thập thông tin, tham số kĩ thuật, cách thức đặt tên cho tài liệu, kiểm tra chất lượng, khôi phục tài liệu lưu trữ ...

    Đối với những nội dung liên quan đến tham số kĩ thuật số hóa, Tổ biên tập đã nghiên cứu kỹ về việc lựa chọn các tham số kĩ thuật và lựa chọn được những loại hình tài liệu lưu trữ ghi âm, ghi hình tiêu biểu, tiến hành thực nghiệm ..., sau đó tổng kết và phân tích các kết quả thực nghiệm, kết hợp với kinh nghiệm và thực tế để tiến hành nghiên cứu, xác định việc lựa chọn tham số kĩ thuật.

    6.1. Những tham số kĩ thuật chủ yếu khi số hóa tài liệu lưu trữ ghi âm

    - Định dạng tài liệu: Quy định đề xuất, định dạng tài liệu ghi âm nên sử dụng định dạng WAVE. Định dạng WAVE là định dạng ghi âm số xuất hiện sớm nhất, được xem là định dạng lưu trữ lâu dài thông dụng đối với tài liệu ghi âm số.

    - Tần số lấy mẫu: Tần số lấy mẫu là số lượng tín hiệu rời rạc thu được từ những tín hiệu âm thanh liên tục trong một giây, là nhân tố quan trọng của việc đánh giá chất lượng âm thanh số. Quy định này đề xuất tần xuất lấy mẫu không được thấp hơn 44.1kHz, tần xuất lấy mẫu của các tài liệu lưu trữ ghi âm quý hiếm hoặc được sử dụng với mục đích đặc biệt không nên thấp hơn 96 kHz. Bình thường, chất lượng âm thanh của CD là âm thanh 16 bit với tần số lấy mẫu là 44.1kHz, vì vậy, đối với những tài liệu lưu trữ cần được lưu trữ lâu dài thì tần xuất lấy mẫu của chúng không được thấp hơn đĩa CD.

    - Độ sâu số: Độ sâu số là số lượng nhiều hay ít thông tin trong một âm thanh được lấy mẫu, cũng là một chỉ tiêu quan trọng để đánh giá chất lượng âm thanh số. Quy định đề xuất độ sâu số nên là 24 bit. Từ các kết quả thử nghiệm thực tế, đã rút ra kết luận: Tài liệu nếu độ sâu số là 8 bit, cho dù tần số lấy mẫu có cao thì chất lượng âm thanh vẫn tương đối thấp, có thể nghe thấy rõ tạp âm; tài liệu có độ sâu số là 16 bit thì khi lưu trữ khó có thể lưu trữ một cách hoàn chỉnh những chi tiết âm thanh. Vậy, chỉ có tài liệu mà độ sâu số là 24 bit trở lên mới có thể đáp ứng được yêu cầu về số hóa và bảo quản.

    6.2. Những tham số kĩ thuật chủ yếu khi số hóa tài liệu lưu trữ ghi hình

    -  Định dạng tài liệu: Tài liệu ghi hình là một loại tài liệu khá phức tạp. Để đáp ứng được các yêu cầu về lưu trữ và khai thác, sử dụng tài liệu ghi hình, người ta phải tạo lập nên nhiều định dạng tài liệu khác nhau. Trong Quy định này, tài liệu ghi hình được khuyến nghị nên áp dụng định dạng AVI hoặc MXF.

     AVI (Audio Video Interleave, lưu trữ xen kẽ âm thanh và hình ảnh) là loại định dạng tài liệu xuất hiện vào đầu thập kỷ 90 của thế kỷ XX, là định dạng tài liệu ghi hình khá phổ biến. AVI đóng gói các âm thanh và hình ảnh trong một tài liệu, âm thanh và hình ảnh được sắp xếp xen kẽ nhau nhằm mục đích là phát đồng thời cả hình ảnh và âm thanh. Bản thân AVI chỉ là tạo ra một khung còn các dữ liệu âm thanh và dữ liệu hình ảnh bên trong có thể áp dụng nhiều loại định dạng mã hóa.

     MXF (Material Exchange Format, định dạng phương tiện trao đổi) là một loại định dạng tài liệu đa phương tiện chuyên dụng của SMPTE (Society of Motion Picture and Television Engineer – Hiệp hội Kỹ sư Điện ảnh và Truyền hình của Mỹ). Vai trò của MXF là xây dựng nên tiêu chuẩn thông dụng về việc chuyển đổi những định dạng dữ liệu khác nhau cho người gửi và người nhận dữ liệu. MXF được ứng dụng rộng rãi trong các khâu như tạo lập, biên tập, gửi và lưu trữ tài liệu đa phương tiện trong lĩnh vực điện ảnh.

     - Định dạng mã hóa video: Quy định đề xuất sử dụng định dạng mã hóa video là H.264 và MPEG-2 IBP.

     H.264 là tiêu chuẩn được ra đời nhờ sự hợp tác phát triển của Tổ chức ITU-T (thuộc Liên hiệp Truyền thông quốc tế) và ISO/IEC (Hội đồng liên kết giữa Tổ chức Tiêu chuẩn hóa quốc tế và Hội đồng Kĩ thuật Điện tử quốc tế).

     MPEG-2 là tiêu chuẩn được MPEG (Moving Pictures Experts Group, Nhóm chuyên gia hình ảnh chuyển động) ban hành, dùng để nén và mã hóa hình ảnh, âm thanh chất lượng cao, được ứng dụng nhiều trong lĩnh vực lưu trữ và truyền dẫn hình ảnh, âm thanh. Để bảo đảm được hiệu quả và chất lượng nén, Quy định yêu cầu áp dụng phương thức nén IBP.

    - Tốc độ khung hình, tỉ lệ khung hình: Để phản ánh một cách chân thực nội dung nguyên thủy của bản gốc tài liệu lưu trữ, Quy  định yêu cầu không được thực hiện chuyển đổi tốc độ khung hình, tỉ lệ khung hình của tài liệu ghi hình mà nên giữ nguyên y như bản gốc.

    7. Xử lý tài liệu ghi âm, ghi hình

    Theo Quy định đề ra, trước khi cung cấp tài liệu ghi âm, ghi hình cho khai thác, sử dụng, có thể tiến hành xử lý bằng cách chuyển đổi định dạng, giảm tạp âm, hiệu chỉnh màu sắc và cố định tỉ lệ khung hình đối với bản sao của tài liệu ghi âm, ghi hình. Tuy nhiên, Tổ biên tập cho rằng, những tài liệu ghi âm, ghi hình được lưu trữ lâu dài phải là những tài liệu gốc, không nên là những tài liệu đã được xử lý. Nguyên nhân là, cùng với sự tiến bộ của khoa học – kĩ thuật, các kĩ thuật như giảm tạp âm, hiệu chỉnh màu sắc ... cũng hoàn thiện hơn, nếu bản gốc tài liệu vẫn còn được lưu trữ thì trong tương lai có thể sẽ có được những tài liệu được xử lý có chất lượng cao hơn.

    8. Kết nối dữ liệu

     Thông qua kết nối dữ liệu, thực hiện liên kết nối giữa dữ liệu mục lục và tài liệu ghi âm, ghi hình, đồng thời, tạo lập mối liên hệ giữa tài liệu ghi âm, ghi hình được số hóa với bản gốc của nó.

      9. Nghiệm thu và chuyển giao kết quả

     Quy định đặt ra những yêu cầu đối với khâu nghiệm thu kết quả số hóa tài liệu lưu trữ ghi âm, ghi hình, cụ thể bao gồm: phương thức nghiệm thu, nội dung nghiệm thu, chỉ tiêu nghiệm thu, kết luận nghiệm thu. Nhiệm vụ của công tác số hóa tài liệu lưu trữ rất lớn, nếu chỉ dựa vào những người thực hiện thì không thể nghiệm thu toàn diện được, cũng khó có thể đảm bảo được chất lượng của việc nghiệm thu. Cần kết hợp được việc kiểm tra tự động bằng máy tính và kiểm tra bằng con người trong quá trình nghiệm thu các kết quả số hóa.

     Việc kiểm nghiệm tự động bằng máy tính không chỉ giúp kiểm nghiệm toàn diện 100% các kết quả số hóa mà còn đảm bảo được độ chính xác cao. Đối với những chỉ tiêu nghiệm thu không thể thực hiện bằng phương pháp tự động hóa với máy tính, có thể căn cứ vào tình hình thực tiễn để đưa ra những yêu cầu khác nhau về tỉ lệ đạt tiêu chuẩn.

    Toàn văn “Quy định về việc số hóa tài liệu lưu trữ ghi âm, ghi hình” của Trung Quốc xin mời xem tại địa chỉ: http://www.saac.gov.cn/daj/hybz/201806/9d13ff4963f146ce861527917def163c/files/47f8ce35645147398656f798434f154b.pdf

Chú thích:

1. Tín hiệu tương tự có nghĩa là tín hiệu lúc sau có dạng tương tự như lúc trước đó, tương tự ở đây không có nghĩa y chang mà là tương tự về bản chất tín hiệu, nhưng khác về cường độ giữa tín hiệu lúc trước và lúc sau.

* Tiêu đề bài viết  đã được biên tập lại.

Từ Lượng

Vũ Thị Thu Hiền – Trung tâm Khoa học và Công nghệ Văn thư, lưu trữ (Dịch từ Tạp chí Lưu trữ Trung Quốc, kỳ 3 năm 2018, trang 26 – 28)