Tại sao PDF lại không thể truy cập hơn bất kỳ định dạng nào khác
PDF không được thiết kế cho khả năng truy cập. Chúng được thiết kế để bảo toàn bố cục trực quan trên các máy tính khác nhau—để đảm bảo rằng một tài liệu trông giống hệt nhau bất kể bạn mở nó trên Windows 95 hay Mac. Mục tiêu thiết kế cơ bản đó xung đột trực tiếp với khả năng truy cập, điều này yêu cầu nội dung linh hoạt, có thể điều chỉnh, có thể thay đổi kích thước, sắp xếp lại và tiêu thụ không nhìn thấy. Khi bạn xuất một tài liệu Word sang PDF, bạn thực chất đang biến nội dung có cấu trúc thành một đại diện trực quan. Các tiêu đề trở thành văn bản trông lớn hơn. Các danh sách trở thành văn bản với các ký tự gạch trước. Các bảng trở thành lưới các hộp văn bản. Tất cả các ý nghĩa ngữ nghĩa mà công nghệ hỗ trợ cần sẽ bị loại bỏ trừ khi bạn duy trì nó thông qua gắn thẻ đúng cách. Tôi đã học điều này theo cách khó khăn vào năm 2019 khi Bộ Giáo dục thuê tôi để kiểm tra các tài liệu hướng dẫn giáo dục đặc biệt của họ. Đây là các tệp PDF được tạo ra bởi các nhân viên có thiện chí đã tham gia đào tạo về khả năng truy cập. Họ biết sử dụng các kiểu tiêu đề trong Word. Họ biết thêm văn bản thay thế vào hình ảnh. Họ đã đánh dấu ô "PDF có thể truy cập" khi xuất ra. Mỗi tài liệu đều thất bại. Vấn đề không phải là kiến thức—mà là mười lăm bước giữa "tài liệu Word có thể truy cập" và "PDF có thể truy cập" mà không ai đã giải thích cho họ. Các cài đặt xuất mặc định là tắt. Các kiểm tra Acrobat Pro cần diễn ra sau khi xuất. Trật tự đọc bị xáo trộn ngay cả khi các thẻ có mặt. Họ đã làm mọi thứ mà họ nghĩ là đúng, và nó vẫn không hoạt động. Một tài liệu đặc biệt ám ảnh tôi: một hướng dẫn 127 trang cho phụ huynh của trẻ em khuyết tật. Thiết kế đẹp, viết rõ ràng, sơ đồ hữu ích. Hoàn toàn không thể sử dụng với trình đọc màn hình. Trật tự đọc nhảy ngẫu nhiên giữa các cột. Mô tả hình ảnh bị thiếu. Mục lục không có liên kết. Một phụ huynh sử dụng JAWS sẽ nghe "trống, trống, trống, đồ họa, trống" trong ba trang đầu tiên trước khi vào bất kỳ nội dung thực tế nào. Tôi đã gọi cho tác giả của tài liệu. Cô ấy đã dành sáu tháng để viết nó. Cô ấy đã yêu cầu đào tạo về khả năng truy cập trước khi bắt đầu. Cô rất đau lòng. "Tôi đã làm tất cả những gì họ bảo tôi làm," cô ấy nói. "Tôi đã sử dụng các kiểu tiêu đề. Tôi đã thêm văn bản thay thế trong Word. Tôi đã đánh dấu ô." Cô đã làm. Đào tạo chỉ không đề cập đến 90% còn lại của những gì làm cho một PDF có thể truy cập.Chi phí thực sự của PDF không thể truy cập
Hãy để tôi chỉ cho bạn những PDF không thể truy cập thực sự tốn kém cho các tổ chức như thế nào, dựa trên dữ liệu từ các cuộc kiểm tra của tôi:| Loại tổ chức | Số lượng PDF trung bình | Chi phí khắc phục | Rủi ro pháp lý | Thiệt hại năng suất |
|---|---|---|---|---|
| Cơ quan liên bang | 12,000-50,000 | $600K-$2.5M | Cao (Mục 508) | 340 giờ/năm trong hỗ trợ |
| Chính phủ bang | 5,000-20,000 | $250K-$1M | Cao (ADA Tiêu đề II) | 180 giờ/năm trong hỗ trợ |
| Giáo dục đại học | 8,000-35,000 | $400K-$1.75M | Rất cao (khiếu nại OCR) | 520 giờ/năm trong hỗ trợ |
| Chăm sóc sức khỏe | 3,000-15,000 | $150K-$750K | Cấp bách (safety bệnh nhân) | 280 giờ/năm trong hỗ trợ |
| Dịch vụ tài chính | 2,000-10,000 | $100K-$500K | Cao (quy định) | 160 giờ/năm trong hỗ trợ |
Huyền thoại rằng các PDF có thể truy cập trông tệ hơn
Huyền thoại dai dẳng nhất mà tôi gặp phải là các PDF có thể truy cập phải hy sinh thiết kế trực quan. Các giám đốc điều hành lo lắng rằng khả năng truy cập có nghĩa là tài liệu xấu xí. Các nhà thiết kế chống lại các yêu cầu về khả năng truy cập vì họ nghĩ rằng điều đó có nghĩa là từ bỏ bố cục được họ tạo ra cẩn thận. Điều này hoàn toàn sai, và tôi có thể chứng minh điều đó."Chúng tôi không thể làm cho điều này có thể truy cập mà không làm hỏng thiết kế. Bố cục quá phức tạp. Khả năng truy cập sẽ buộc chúng tôi phải đơn giản hóa mọi thứ và làm cho nó trông như một tài liệu Word từ năm 1995."Tôi đã nghe điều này từ một giám đốc sáng tạo tại một công ty dịch vụ tài chính lớn. Họ vừa chi 120,000 đô la cho thiết kế báo cáo thường niên của mình. Kiểu chữ đẹp, bố cục tinh vi, đồ họa tùy chỉnh. Họ tin rằng khả năng truy cập sẽ phá hủy nó. Tôi đã lấy tệp PDF của họ và làm cho nó hoàn toàn tuân thủ WCAG 2.1 AA trong bốn giờ. Không thay đổi gì về mặt trực quan. Không một pixel. Phiên bản có thể truy cập trông giống hệt bản gốc. Sự khác biệt duy nhất là người dùng trình đọc màn hình giờ đây có thể thực sự đọc nó, và PDF đã vượt qua các kiểm tra khả năng truy cập tự động. Sự nhầm lẫn đến từ việc đồng nhất khả năng truy cập với sự đơn giản. Đúng, các tài liệu đơn giản hơn dễ làm cho chúng có thể truy cập hơn. Nhưng độ phức tạp không phải là kẻ thù—thiếu cấu trúc mới là. Bạn có thể có một PDF trực quan phức tạp, được thiết kế đẹp mà vẫn hoàn toàn có thể truy cập nếu bạn gắn thẻ đúng cấu trúc. Trình bày trực quan và cấu trúc ngữ nghĩa là các lớp riêng biệt. Hãy nghĩ về nó như một tòa nhà. Thiết kế trực quan là bên ngoài—mặt tiền, cửa sổ, các chi tiết kiến trúc. Cấu trúc khả năng truy cập là bố cục nội thất—các hành lang, nhãn phòng, cách chỉ đường. Bạn có thể có một mặt ngoài trang trí, phức tạp với một nội thất rõ ràng, dễ điều hướng. Chúng không xung đột với nhau. Thách thức thực sự không phải là làm cho các PDF có thể truy cập trông đẹp—mà là thuyết phục các tổ chức đầu tư thời gian vào cấu trúc đúng cách trong quá trình tạo ra thay vì coi khả năng truy cập như một sửa chữa sau sản xuất. Khi bạn xây dựng khả năng truy cập ngay từ đầu, nó là vô hình. Khi bạn cố gắng thêm vào sau đó, đó là lúc bạn gặp phải các thỏa hiệp và hạn chế.
Các tiêu chí WCAG thực sự quan trọng đối với các PDF
WCAG 2.1 có 78 tiêu chí thành công trong ba cấp độ tuân thủ. Hầu hết người tạo PDF đều hoảng loạn khi họ thấy danh sách này. Tin tốt là: chỉ khoảng 25 trong số các tiêu chí này thường áp dụng cho PDF, và chỉ 12 tiêu chí chiếm 90% các thất bại mà tôi thấy trong các cuộc kiểm tra. Dưới đây là những gì thực sự quan trọng, được phân loại theo tần suất thất bại trong 2,147 cuộc kiểm tra của tôi: 1. Cấu trúc tiêu đề (tỷ lệ thất bại 78%) - WCAG 1.3.1, 2.4.6: Các tài liệu sử dụng kiểu dáng trực quan thay vì thẻ tiêu đề ngữ nghĩa, hoặc bỏ qua các cấp tiêu đề (H1 đến H3 mà không có H2). 2. Văn bản thay thế cho hình ảnh (tỷ lệ thất bại 71%) - WCAG 1.1.1: Hình ảnh thiếu văn bản thay thế, hoặc có các mô tả chung như "hình ảnh" hoặc tên tệp. 3. Ngôn ngữ tài liệu (tỷ lệ thất bại 68%) - WCAG 3.1.1: PDF không chỉ định ngôn ngữ của nó, làm cho phát âm của trình đọc màn hình bị lỗi. 4. Trình tự đọc (tỷ lệ thất bại 64%) - WCAG 1.3.2: Nội dung được gắn thẻ theo thứ tự trực quan thay vì thứ tự đọc logic, đặc biệt trong các bố cục nhiều cột. 5. Sự tương phản màu sắc (tỷ lệ thất bại 52%) - WCAG 1.4.3: Văn bản không đáp ứng tỷ lệ tương phản 4.5:1, đặc biệt trong các tiêu đề và hộp gọi. 6. Cấu trúc bảng (tỷ lệ thất bại 49%) - WCAG 1.3.1: Các bảng thiếu các ô tiêu đề đúng cách, hoặc các bảng phức tạp không có thuộc tính scope. 7. Văn bản liên kết (tỷ lệ thất bại 43%) - WCAG 2.4.4: Các liên kết nói "nhấp vào đây" hoặc "đọc thêm" thay vì mô tả điểm đến. 8. Các trường biểu mẫu (tỷ lệ thất bại 41%) - WCAG 1.3.1, 4.1.2: Các trường biểu mẫu thiếu nhãn, hoặc các nhãn không được liên kết đúng với các trường. 9. Cấu trúc danh sách (tỷ lệ thất bại 38%) - WCAG 1.3.1: Các danh sách sử dụng số/gạch tay thay vì thẻ danh sách ngữ nghĩa. 10. Tiêu đề tài liệu (tỷ lệ thất bại 35%) - WCAG 2.4.2: Tiêu đề PDF bị thiếu hoặc hiển thị tên tệp thay vì tiêu đề mô tả. 11. Thứ tự tab (tỷ lệ thất bại 31%) - WCAG 2.4.3: Thứ tự tab không theo thứ tự đọc logic, hoặc không được đặt thành "Sử dụng cấu trúc tài liệu." 12. Đánh dấu trang (tỷ lệ thất bại 28%) - WCAG 2.4.5: Tài liệu dài thiếu đánh dấu trang cho điều hướng, hoặc đánh dấu trang không phù hợp với cấu trúc tiêu đề. Hãy chú ý đến những gì không có trong danh sách này: hầu hết các tiêu chí WCAG về chức năng tương tác, phương tiện dựa trên thời gian, hoặc các tương tác web phức tạp. PDF chủ yếu là các tài liệu tĩnh, vì vậy các tiêu chí về phụ đề video, bẫy bàn phím, hoặc thời gian phiên hiếm khi áp dụng."Chúng tôi đã dành ba tháng cố gắng khiến các PDF của mình tuân thủ WCAG mà vẫn cứ thất bại trong các kiểm tra tự động. Sau đó, chúng tôi nhận ra rằng chúng tôi đang cố gắng sửa chữa các tiêu chí mà thậm chí không áp dụng cho PDF. Chúng tôi đã lãng phí thời gian vào yêu cầu phụ đề video khi tài liệu của chúng tôi không có video."Câu trích dẫn này từ một điều phối viên khả năng truy cập của một cơ quan bang minh họa một vấn đề phổ biến: các tổ chức coi WCAG như một danh sách kiểm tra khối duy nhất thay vì hiểu các tiêu chí nào áp dụng cho loại nội dung cụ thể của họ. Điều này gây lãng phí một lượng lớn thời gian và tạo ra sự lo âu không cần thiết.