PDF協會吐槽穆勒的“通俄門”報告看著很糟糕
昨日,特別顧問羅伯特·穆勒(Robert Mueller)發布了有關“俄羅斯干預2016美總統大選”的報告,引發了無數人的下載圍觀。然而他們很快就沮喪地發現,你根本無法搜索頁面上的任何文字,且整個文件的體積相當龐大。在普通人發表吐槽的同時,PDF協會(PDFA)也實在是坐不住了。其給出了一份長篇幅的解釋,說明“為何穆勒的PDF報告文件做得如此糟糕”。
該協會指出,穆勒的這份報告,既是司法部的一個回應,也是對PDF 這種便攜式文件格式的認同。
PDF 協會指出了一些基本的事實,比如448 頁的文檔質量’勉強可以接受’,但不符合嚴格的檔案標準。
PDFA 猜測,這份4 月17 日出爐的報告,或許是在辦公室裡某台典型的網絡複印/ 打印機上製作的。尷尬的是,它沒有採用文本格式,而是選擇了更適合照片的有損壓縮方式。
司法部應該是從穆勒那裡拿到了高品質的PDF,然後打印出來又重新掃描。或者穆勒只提供了紙質的報告,因此司法部只能掃描後再發布。
對於此類文檔,PDF 是唯一符合“文化與技術要求”的格式。正如帖子中指出的那樣,重新掃描可以確保文件中不包含不適當的文本數據,但也限制了人們可以看到的文字和編輯框。
然而經過來回倒騰,不僅文件體積特別膨脹,還造成了信息檢索上的大麻煩—— 除非你願意重新運行以便OCR 識別糾錯(而且這個過程不如掃描原始源文件那麼準確)。
(PDAF 同時希望大家能關註今年6 月在西雅圖舉辦的電子文檔大會)
即便如此,對可搜索性造成嚴重破壞的PDF 文件,偶爾也會暴露一些令人尷尬的秘密。比如在Facebook 訴訟庭審文件中,就有一些匆忙繪製留下的黑條(隱藏了某些可選的文字)。
當然,專業的編輯軟件,可以避免發生這樣的事情。PDF 協會指出,未標記和無法檢索的PDF,可能違反了司法部對於殘疾人的無障礙規則。
那麼除了PDF,為何正式文件不採用WORD、TIFF 圖像、網站、XPS、EPUB、或者純文本的格式呢?該協會給出了簡短的回答:
PDF 保留了文檔的原始文本和格式,可以包含明確的編輯,並且受到多平台的支持,這是唯一能夠滿足現代重要通信文化和技術要求的文件格式。
最後,就司法部對於如此重要的文件格式的不尊重,PDF 協會表達的強烈的不滿。一位專家表示:這份報告文件讓人看了既羞愧又難過。