Thư viện là nơi lưu trữ tài liệu quan trọng và khổng
lồ nhất của mỗi trường học. Số lượng tài liệu được lưu trữ trong thư viện vô
cùng phong phú như sách, giáo trình, tài liệu, văn bản, hợp đồng…Thư viện số/Thư
viện điện tử được coi như một hệ thống dữ liệu tự động hóa. Ở đó, người dùng có
thể đơn giản trong việc truy cập và tìm kiếm những thông tin cần thiết chỉ bằng
một click trong thời gian nhanh chóng. Điều này giúp tiết kiệm được nhiều thời
gian, nguồn lực.
Thư
viện số là một nền tảng trực tuyến, được xem là thư viện ảo cho
phép người dùng truy cập vào các tài liệu kỹ thuật số như sách, báo, tạp chí,
hình ảnh, âm thanh, video, tài liệu lịch sử,... Tất cả những tài liệu này được
chuyển đổi sang dạng số hóa từ phiên bản bản giấy, tạo ra sự tiện lợi cho người
dùng truy cập vào chúng.
Trong thời đại hiện nay, khi nguồn tài nguyên
thông tin số là huyết mạch, là linh hồn của thư viện số thì công tác số hóa tài
liệu có vai trò vô cùng quan trọng. Số hóa tài liệu trong thư viện là quá
trình chuyển đổi tài liệu từ dạng truyền thống - thông tin trên giấy thành định dạng kỹ thuật số
và được lưu trên máy tính nhằm bảo quản, chia sẻ và phục vụ trực tuyến. Số hóa
tài liệu giúp thư viện tăng tính khả dụng và truy cập của tài liệu. Trong thời
đại kỷ nguyên công nghệ 4.0, người dùng có thể truy cập vào các tài liệu trực
tuyến từ bất kỳ đâu và bất kỳ khi nào, chỉ với một thiết bị thông minh có kết nối
Internet. Việc số hóa các tài liệu giúp thư viện đáp ứng nhanh chóng nhu cầu của
người dùng về truy cập thông tin, đồng thời giảm bớt áp lực về không gian lưu
trữ tài liệu bản giấy.
Với tầm quan trọng của công
tác số hóa tài liệu, Thư viện Nguyễn Thúc Hào Trường Đại học Vinh đã trang bị hệ
thống máy scan hiện đại - Máy scan sách tự động ScanRobot 2.0 MDS được thiết
kế để số hóa khối lượng lớn cho mọi loại hình tài liệu với tốc độ nhanh; là
dòng máy quét tự động cho hình ảnh chất lượng cao với tốc độ quét lên đến 2.500
trang/1 giờ đối với mọi loại hình tài liệu, có khả năng xử lí hình ảnh tốt, màu
sắc rõ nét và đều màu, hình ảnh sau quét không bị chói sáng, làm phẳng dòng chữ
và khả năng cân đối khổ giấy. Nhờ vậy, ScanRobot 2.0 MDS làm tăng
đáng kể hiệu quả công việc, cũng như giảm thiểu chi phí chung cho các dự án số
hóa.
(Máy ScanRobot 2.0 MDS được sử dụng
để số hóa tài liệu tại Thư viện Nguyễn Thúc Hào)
Để tiến hành số hóa tài liệu, xây dựng kho tài nguyên thông
tin số tại Thư viện Nguyễn Thúc Hào, chúng tôi luôn chú trọng đến các yếu tố:
(1) Xác định mục tiêu số hóa tài liệu: Đây là công việc đầu tiên khi triển khai
số hóa, xác định tài liệu được số hóa để phục vụ đối tượng nào? Hiện tại, đối
tượng chúng tôi hướng đến và ưu tiên là giáo trình và các tài liệu tham khảo có
trong khung chương trình đào tạo của Nhà trường. (2) Quy
trình thực hiện: Thực hiện nghiêm túc, chặt chẽ quy
trình 7 bước để số hóa và xử lý tài liệu để tạo nên một thư viện số, gồm: Thu
thập tài liệu - Sắp xếp, phân loại - Quét tài liệu - Kiểm tra tài liệu quét -
Nhập liệu, nhận dạng ký tự - Kiểm tra nhập liệu - Lưu trữ. (3) Lựa chọn các trang thiết bị chuyên dụng và phần mềm quản
lý đảm bảo chất lượng tài liệu số và quản lý tài liệu số bền vững. Hiện tại, chúng
tôi đang sử dụng phần mềm Kipos để lưu trữ, quản lý và khai thác các loại tài
liệu đã được số hóa với nhiều định dạng khác nhau và cho phép học sinh, sinh
viên, giảng viên có thể truy cập khai thác thông tin trực tuyến bất kỳ thời điểm
nào.
Các bước xử lý tài liệu:
Bước 1: Fix Orientation - Điều chỉnh lại hướng trang: Đây là bước kiểm
tra ảnh cần xử lý, bởi trong quá trình quét ảnh có những trang bị lộn ngược
hoặc không đúng với chiều đọc thông thường. Để thực hiện điều hướng trang, có
thể chọn từng trang và nhấn chọn các biểu tượng trong phần Rotate cho đúng yêu
cầu, hoặc có thể chọn ảnh cùng một lúc bằng cách nhấn giữ phím Ctrl+ trang cần
chọn.
Bước 2: Split Pages - Tách trang: Đây là tính năng hoàn toàn tự
động, cắt một lượt tất cả các trang, tuy nhiên đối với các tài liệu phức tạp,
có nhiều khung bảng hoặc trang đặc biệt thì cần phải kiểm tra và điều chỉnh lại
các trang đó.
Bước 3: Deskew – Chỉnh nghiêng:
Chỉnh thẳng ảnh là một trong những khâu khá quan trọng trong công tác số hóa,
xử lý tài liệu số hóa, bước này sẽ giúp xử lý những trang bị nghiêng trong quá
trình scan. Ở công đoạn này, bạn có thể để máy thực hiện tự động điều chỉnh
trang cho các trang, tuy nhiên máy chỉnh chưa thẳng thì có thể dùng bằng tay
bằng cách bấm và giữ chuột vào một trong hai điểm đánh dấu vòng tròn phân giữa
trang xoay theo ý bạn.
Bước 4: Select content – Chọn vùng
nội dung: Đây là một trong những tính năng quan trọng và cực kì hiệu quả của
scan tailor là tự động nhận dạng được vùng nội dung của sách, tính năng này
giúp nhận diện, gợi ý vùng nội dung sẽ được lấy, hỗ trợ phần xác định lề, tái
tạo lại trang ở phần sau.
Bước 5: Margins - Chỉnh lề: Ở bước
này, cần xác định lề trên, dưới, trái, phải cần lấy bằng cách điều chỉnh thông
số margins, vùng sẽ được thêm vào khi quá trình Output thực hiện. Phần lề được
đánh dầu bằng màu xanh. Lề cứng là khoảng cách giữa 2 vùng có đường viền liền,
đường viền này sẽ cố định giữ nguyên khi trang được xuất ra. Lề mềm là khoảng
cách giữa 2 vùng có đường viền liền nhau và đường viền vạch đứt, đường viền này
sẽ được thêm vào trang khi được xuất ra.
Bước 6: Output - Xuất dữ liệu đầu
ra: Đây là công đoạn cuối cùng, chất lượng của giai đoạn này phụ thuộc vào các
công đoạn trước đó. Kết quả của bước này được xuất hiện ngay trên màn hình hiển
thị khung giữa chương trình, đồng thời nó được lưu vào máy tính của bạn. Trong
bước này chúng ta cần xác định chế độ đầu ra cho sản phẩm, mặc định chương
trình để chế độ đen - trắng, ta có thể chuyển chế độ màu xám hoặc chế độ hỗn
hợp tùy vào tài liệu.
Hiện tại, Thư viện Nguyễn Thúc Hào
đang sử dụng phần mềm Abbyy và Adobe Acrobat DC để hỗ trợ xử lý, quản lý văn
bản trong các tác vụ như chỉnh sửa, nén và giải nén tải liệu, chia sẻ văn bản…
Tài liệu sau khi tiến hành scan, file PDF và hình ảnh thành dạng văn bản có thể
chỉnh sửa được trong Microsoft Word, Excel và EBooks. Bên cạnh đó phần mềm có
thể bảo lưu tài liệu gốc, tránh các chỉnh sửa không mong muốn từ người dùng
tin.
Trong
quá trình tiến hành số hóa tài liệu, Thư viện Nguyễn Thúc Hào thường xuyên
nghiên cứu, tham khảo, trao đổi kinh nghiệm với các thư viện khác để cùng nhau
học hỏi, chia sẻ, đúc rút nhiều kinh nghiệm và có giải pháp mới để phù hợp với
yêu cầu thực tiễn về công tác số hóa tài liệu tại thư viện. Tài liệu qua xử lý số hóa sẽ được
mở ra rất nhanh, chất lượng hình ảnh sẽ được tối ưu ở mức cao nhất để bạn đọc,
người dùng tin có thể truy cập, sử dụng tốt nhất.
(Cán bộ Thư viện Quân khu 4 tham
quan, trao đổi, chia sẻ kinh nghiệm về công tác số hóa và xử lý tài liệu số tại
Thư viện Nguyễn Thúc Hào)
(Bài: Lưu Vân Anh & Hồ Oanh - TV
NTH)