Thư viện là nơi lưu trữ tài liệu quan trọng và khổng lồ nhất của mỗi trường học. Số lượng tài liệu được lưu trữ trong thư viện vô cùng phong phú như sách, giáo trình, tài liệu, văn bản, hợp đồng…Thư viện số/Thư viện điện tử được coi như một hệ thống dữ liệu tự động hóa. Ở đó, người dùng có thể đơn giản trong việc truy cập và tìm kiếm những thông tin cần thiết chỉ bằng một click trong thời gian nhanh chóng. Điều này giúp tiết kiệm được nhiều thời gian, nguồn lực.

Thư viện số là một nền tảng trực tuyến, được xem là thư viện ảo cho phép người dùng truy cập vào các tài liệu kỹ thuật số như sách, báo, tạp chí, hình ảnh, âm thanh, video, tài liệu lịch sử,... Tất cả những tài liệu này được chuyển đổi sang dạng số hóa từ phiên bản bản giấy, tạo ra sự tiện lợi cho người dùng truy cập vào chúng.

 

 

Trong thời đại hiện nay, khi nguồn tài nguyên thông tin số là huyết mạch, là linh hồn của thư viện số thì công tác số hóa tài liệu có vai trò vô cùng quan trọng. Số hóa tài liệu trong thư viện là quá trình chuyển đổi tài liệu từ dạng truyền thống -  thông tin trên giấy thành định dạng kỹ thuật số và được lưu trên máy tính nhằm bảo quản, chia sẻ và phục vụ trực tuyến. Số hóa tài liệu giúp thư viện tăng tính khả dụng và truy cập của tài liệu. Trong thời đại kỷ nguyên công nghệ 4.0, người dùng có thể truy cập vào các tài liệu trực tuyến từ bất kỳ đâu và bất kỳ khi nào, chỉ với một thiết bị thông minh có kết nối Internet. Việc số hóa các tài liệu giúp thư viện đáp ứng nhanh chóng nhu cầu của người dùng về truy cập thông tin, đồng thời giảm bớt áp lực về không gian lưu trữ tài liệu bản giấy.

Với tầm quan trọng của công tác số hóa tài liệu, Thư viện Nguyễn Thúc Hào Trường Đại học Vinh đã trang bị hệ thống máy scan hiện đại - Máy scan sách tự động ScanRobot 2.0 MDS được thiết kế để số hóa khối lượng lớn cho mọi loại hình tài liệu với tốc độ nhanh; là dòng máy quét tự động cho hình ảnh chất lượng cao với tốc độ quét lên đến 2.500 trang/1 giờ đối với mọi loại hình tài liệu, có khả năng xử lí hình ảnh tốt, màu sắc rõ nét và đều màu, hình ảnh sau quét không bị chói sáng, làm phẳng dòng chữ và khả năng cân đối khổ giấy. Nhờ vậy, ScanRobot 2.0 MDS làm tăng đáng kể hiệu quả công việc, cũng như giảm thiểu chi phí chung cho các dự án số hóa.

 

(Máy ScanRobot 2.0 MDS được sử dụng để số hóa tài liệu tại Thư viện Nguyễn Thúc Hào)

 

Để tiến hành số hóa tài liệu, xây dựng kho tài nguyên thông tin số tại Thư viện Nguyễn Thúc Hào, chúng tôi luôn chú trọng đến các yếu tố: (1) Xác định mục tiêu số hóa tài liệu: Đây là công việc đầu tiên khi triển khai số hóa, xác định tài liệu được số hóa để phục vụ đối tượng nào? Hiện tại, đối tượng chúng tôi hướng đến và ưu tiên là giáo trình và các tài liệu tham khảo có trong khung chương trình đào tạo của Nhà trường. (2) Quy trình thực hiện: Thực hiện nghiêm túc, chặt chẽ quy trình 7 bước để số hóa và xử lý tài liệu để tạo nên một thư viện số, gồm: Thu thập tài liệu - Sắp xếp, phân loại - Quét tài liệu - Kiểm tra tài liệu quét - Nhập liệu, nhận dạng ký tự - Kiểm tra nhập liệu - Lưu trữ. (3) Lựa chọn các trang thiết bị chuyên dụng và phần mềm quản lý đảm bảo chất lượng tài liệu số và quản lý tài liệu số bền vững. Hiện tại, chúng tôi đang sử dụng phần mềm Kipos để lưu trữ, quản lý và khai thác các loại tài liệu đã được số hóa với nhiều định dạng khác nhau và cho phép học sinh, sinh viên, giảng viên có thể truy cập khai thác thông tin trực tuyến bất kỳ thời điểm nào.

Các bước xử lý tài liệu:

Bước 1: Fix Orientation -  Điều chỉnh lại hướng trang: Đây là bước kiểm tra ảnh cần xử lý, bởi trong quá trình quét ảnh có những trang bị lộn ngược hoặc không đúng với chiều đọc thông thường. Để thực hiện điều hướng trang, có thể chọn từng trang và nhấn chọn các biểu tượng trong phần Rotate cho đúng yêu cầu, hoặc có thể chọn ảnh cùng một lúc bằng cách nhấn giữ phím Ctrl+ trang cần chọn.

Bước 2: Split Pages -  Tách trang: Đây là tính năng hoàn toàn tự động, cắt một lượt tất cả các trang, tuy nhiên đối với các tài liệu phức tạp, có nhiều khung bảng hoặc trang đặc biệt thì cần phải kiểm tra và điều chỉnh lại các trang đó.

Bước 3: Deskew – Chỉnh nghiêng: Chỉnh thẳng ảnh là một trong những khâu khá quan trọng trong công tác số hóa, xử lý tài liệu số hóa, bước này sẽ giúp xử lý những trang bị nghiêng trong quá trình scan. Ở công đoạn này, bạn có thể để máy thực hiện tự động điều chỉnh trang cho các trang, tuy nhiên máy chỉnh chưa thẳng thì có thể dùng bằng tay bằng cách bấm và giữ chuột vào một trong hai điểm đánh dấu vòng tròn phân giữa trang xoay theo ý bạn.

Bước 4: Select content – Chọn vùng nội dung: Đây là một trong những tính năng quan trọng và cực kì hiệu quả của scan tailor là tự động nhận dạng được vùng nội dung của sách, tính năng này giúp nhận diện, gợi ý vùng nội dung sẽ được lấy, hỗ trợ phần xác định lề, tái tạo lại trang ở phần sau.

Bước 5: Margins - Chỉnh lề: Ở bước này, cần xác định lề trên, dưới, trái, phải cần lấy bằng cách điều chỉnh thông số margins, vùng sẽ được thêm vào khi quá trình Output thực hiện. Phần lề được đánh dầu bằng màu xanh. Lề cứng là khoảng cách giữa 2 vùng có đường viền liền, đường viền này sẽ cố định giữ nguyên khi trang được xuất ra. Lề mềm là khoảng cách giữa 2 vùng có đường viền liền nhau và đường viền vạch đứt, đường viền này sẽ được thêm vào trang khi được xuất ra.

Bước 6: Output - Xuất dữ liệu đầu ra: Đây là công đoạn cuối cùng, chất lượng của giai đoạn này phụ thuộc vào các công đoạn trước đó. Kết quả của bước này được xuất hiện ngay trên màn hình hiển thị khung giữa chương trình, đồng thời nó được lưu vào máy tính của bạn. Trong bước này chúng ta cần xác định chế độ đầu ra cho sản phẩm, mặc định chương trình để chế độ đen - trắng, ta có thể chuyển chế độ màu xám hoặc chế độ hỗn hợp tùy vào tài liệu.

Hiện tại, Thư viện Nguyễn Thúc Hào đang sử dụng phần mềm Abbyy và Adobe Acrobat DC để hỗ trợ xử lý, quản lý văn bản trong các tác vụ như chỉnh sửa, nén và giải nén tải liệu, chia sẻ văn bản… Tài liệu sau khi tiến hành scan, file PDF và hình ảnh thành dạng văn bản có thể chỉnh sửa được trong Microsoft Word, Excel và EBooks. Bên cạnh đó phần mềm có thể bảo lưu tài liệu gốc, tránh các chỉnh sửa không mong muốn từ người dùng tin.

Trong quá trình tiến hành số hóa tài liệu, Thư viện Nguyễn Thúc Hào thường xuyên nghiên cứu, tham khảo, trao đổi kinh nghiệm với các thư viện khác để cùng nhau học hỏi, chia sẻ, đúc rút nhiều kinh nghiệm và có giải pháp mới để phù hợp với yêu cầu thực tiễn về công tác số hóa tài liệu tại thư viện. Tài liệu qua xử lý số hóa sẽ được mở ra rất nhanh, chất lượng hình ảnh sẽ được tối ưu ở mức cao nhất để bạn đọc, người dùng tin có thể truy cập, sử dụng tốt nhất.

(Cán bộ Thư viện Quân khu 4 tham quan, trao đổi, chia sẻ kinh nghiệm về công tác số hóa và xử lý tài liệu số tại Thư viện Nguyễn Thúc Hào)

 

(Bài: Lưu Vân Anh & Hồ Oanh - TV NTH)