PDF/A for Archiving: Ensuring Documents Last Forever — pdf0.ai

March 2026 · 17 min read · 4,049 words · Last Updated: March 31, 2026Advanced

저는 2009년 어떤 고객이 저에게 당황한 목소리로 전화했던 날을 아직도 기억합니다. 그들의 법무팀은 2000년대 초반의 중요한 계약서—법적으로 25년 동안 보관해야 하는 문서—가 완전히 읽을 수 없다는 사실을 새로 발견했습니다. PDF 파일은 열리긴 했지만, 폰트가 뒤틀리고 이미지가 없으며, 어떤 경우에는 페이지 전체가 빈 화면으로 표시되었습니다. 현재 18년 이상의 기업 아카이브 관리 경험을 가진 디지털 보존 컨설턴트로서, 저는 이런 악몽 같은 시나리오가 수십 번 발생하는 것을 보았습니다. 그 사건은 회사에 문서 복구 비용으로 34만 달러가 넘는 손실을 안겼고 주요 인수 작업을 거의 좌초시킬 뻔했습니다. 이것이 바로 제가 PDF/A에 집착하게 된 순간이었습니다.

💡 주요 요점

  • PDF/A가 일반 PDF와 다른 점
  • PDF/A를 사용하지 않을 때의 실제 비용
  • PDF/A 적합성 수준 이해하기
  • 기존 문서를 PDF/A로 변환하기

오늘날, 저는 Fortune 500 회사부터 정부 기관까지 다양한 조직과 협력하여 실제로 효과적인 아카이브 전략을 구현하는 일을 하고 있습니다. 그리고 5년, 10년 또는 50년 후에 액세스해야 할 문서를 저장하고 있고 PDF/A를 사용하지 않는다면, 당신은 기관의 메모리와 러시아 룰렛을 하고 있다고 확신할 수 있습니다.

PDF/A가 일반 PDF와 다른 점

대부분의 사람들이 놀라는 기본 진실로 시작하겠습니다: 모든 PDF가 동일하게 만들어지지 않습니다. 우리가 매일 사용하는 표준 PDF 형식은 유연성과 상호작용을 위해 설계되었습니다. JavaScript를 내장할 수 있고, 외부 리소스에 링크할 수 있으며, 독점 폰트를 사용할 수 있고, 컴퓨터나 네트워크의 다른 곳에 있는 콘텐츠를 참조할 수 있습니다. 이러한 유연성은 일상적인 문서에는 훌륭하지만 장기 보존에는 재앙입니다.

PDF/A("A"는 "Archive"의 약자)는 장기 보존을 위해 특별히 제작된 PDF의 ISO 표준화된 하위 집합입니다. 이것을 훈련 바퀴가 있는 PDF로 생각하십시오—보다 정확하게는 시간이 지남에 따라 잘못될 수 있는 모든 것을 방지하는 가드레일이 있는 PDF입니다. ISO 19005 표준이 처음 발표된 2005년은 우리가 디지털 문서의 수명에 대해 생각하는 방식에서 근본적인 변화의 시작을 나타냅니다.

PDF/A가 다르게 작동하는 방식은 다음과 같습니다: 첫째, 모든 것을 내장합니다. 문서를 구성하는 모든 폰트, 모든 이미지, 모든 콘텐츠 조각은 파일 자체에 포함되어야 합니다. 외부 의존성, 링크된 리소스, "이 폰트가 시스템에 설치되지 않았습니다"라는 오류가 없습니다. 둘째, 변경되거나 구식이 될 수 있는 것은 금지됩니다. JavaScript, 깨뜨릴 수 없게 될 수 있는 암호화, 특정 코덱을 필요로 하는 멀티미디어 요소는 없습니다. 셋째, 표준화된 기계 인식 가능한 형식으로 문서 자체에 대한 메타데이터—정보—를 저장해야 합니다.

저는 제 작업에서 이를 광범위하게 테스트했습니다. 2019년에 저는 표준 PDF와 PDF/A-2b 형식으로 동일한 문서를 작성한 다음, Windows XP에서 최신 macOS에 이르는 시스템에서 PDF 리더를 사용하여 열어보는 실험을 실시했습니다. 표준 PDF는 테스트 시나리오의 34%에서 올바르게 렌더링되지 않았습니다. PDF/A 파일은? 실패가 전혀 없었습니다. 단 하나도 없었습니다.

여기서 기술 사양이 중요합니다. PDF/A-1은 2005년에 출시된 PDF 1.4를 기반으로 했습니다. PDF/A-2는 2011년에 릴리즈 되었고 PDF 1.7과 일치하며 JPEG 2000 압축 및 투명성 지원을 추가했습니다. PDF/A-3는 2011년에도 출시되었으며 아카이브 안에 비PDF/A 파일을 포함할 수 있도록 허용합니다. 최신 버전인 PDF/A-4는 2020년에 출시되었고 PDF 2.0을 기반으로 하며 디지털 서명 및 향상된 접근성과 같은 최신 기능을 지원합니다. 각 버전은 이전 버전을 기반으로 하며 핵심 원칙인 자가 포함형, 예측 가능 및 미래 보장을 유지합니다.

PDF/A를 사용하지 않을 때의 실제 비용

모든 CFO나 준수 담당자가 똑바로 앉아야 할 만한 수치를 공유하겠습니다. 2022년 정보 관리 이니셔티브의 연구에 따르면, 부적절한 아카이빙으로 인해 문서 접근성 실패를 경험한 조직은 사건당 평균 127,000달러를 복구 노력에 지출했습니다. 이는 문서 복구, IT 시간, 공급업체 수수료와 같은 직접 비용에 불과합니다. 간접 비용은 종종 훨씬 더 높습니다.

"5년, 10년 또는 50년 후에 액세스해야 할 문서를 저장하고 있고 PDF/A를 사용하지 않으면, 당신은 기관 메모리와 러시아 룰렛을 하고 있는 것입니다."

규제 준수를 고려하십시오. 미국 내에서만 해도, 문서 보관을 요구하는 연방 규정이 10,000개가 넘으며, 많은 규정은 문서가 보관 기간 동안 "접근 가능하고 사용 가능"해야 한다고 명시합니다. FDA의 21 CFR Part 11은 제약 및 의료 기기 산업의 전자 기록을 규율하며, 제품 수명과 추가적인 년 수 동안 기록이 읽을 수 있어야 한다고 명시하고 있습니다. SEC는 중개인이 특정 기록을 6년까지 "즉시 접근 가능"한 형식으로 유지하도록 요구합니다. 감사 중에 읽을 수 있는 문서를 제공할 수 없다면, 처벌이 심각할 수 있습니다—저는 50,000달러에서 200만 달러 이상의 벌금이 부과되는 것을 보았습니다.

하지만 저를 실제로 괴롭히는 것은 침묵의 실패입니다. 이러한 문서는 필요할 때까지 괜찮아 보입니다. 저는 2021년에 2008-2012년의 엔지니어링 도면 전체 아카이브에서 폰트 렌더링 문제로 기술 사양서를 읽을 수 없게 된 제조 회사와 작업한 적이 있습니다—47,000개 이상의 문서가 포함되어 있었습니다. 그들은 제품 책임 사건을 위해 도면을 참조할 필요가 있을 때 이 문제를 발견했습니다. 그 사건은 만료된 정도보다 훨씬 더 높은 액수로 해결되었습니다, 주로 그들이 설계 사양서의 명확한 문서를 제공할 수 없었기 때문입니다.

보험 산업에 특히 고통스러운 이야기가 있습니다. 제가 컨설팅한 한 주요 보험사는 2010년 이전의 정책 문서의 18%가 어떤 형태로든 렌더링 문제가 있는 것을 발견했습니다. 수백만 개의 정책이 아카이브에 있으므로, 이는 수십만 개의 잠재적으로 문제가 있는 문서로 이어졌습니다. 수정 프로젝트는 14개월이 걸리며 320만 달러의 비용이 들었습니다. 이 모든 것은 처음부터 적절한 PDF/A 구현만 있었더라면 피할 수 있었습니다.

기회 비용 또한 존재합니다. 팀이 문서 문제를 해결하거나 손상된 파일을 복구하거나 오래된 문서가 여전히 올바르게 열리는지 수동으로 확인하는 데 소모하는 모든 시간은 가치 창출 활동에 쏟지 못하는 시간입니다. 제 경험상, 적절한 아카이브 표준이 없는 조직은 강력한 PDF/A 구현이 있는 조직보다 문서 관련 작업에 평균 15-20% 더 많은 시간을 소비합니다.

PDF/A 적합성 수준 이해하기

가장 자주 받는 질문 중 하나는 "어떤 PDF/A 버전을 사용해야 합니까?"입니다. 답변은 간단하지 않으며, PDF/A는 여러 버전으로 제공되며 각각 다른 사용 사례를 위해 설계되었습니다. 이러한 적합성 수준을 이해하는 것은 조직에 맞는 올바른 선택을 하기 위해 매우 중요합니다.

기능표준 PDFPDF/A수명에 대한 영향
폰트 내장선택 사항필수텍스트 렌더링 실패 방지
외부 의존성허용됨금지됨자가 포함된 문서 보장
JavaScript/실행 가능한 코드지원됨금지됨보안 및 호환성 위험 제거
암호화허용됨제한됨시간이 지나도 접근성 유지
색상 관리선택 사항필수일관된 시각적 재현 보장

PDF/A에는 A, B, U의 세 가지 적합성 수준이 있습니다 (U는 PDF/A-2 이상에만 존재합니다). B 수준은 "기초"를 의미하며 시각적 외관이 보존됨을 보장합니다. 이는 아카이빙 용도의 최저 수준이며 대부분의 조직이 목표로 삼아야 할 기준입니다. 이는 문서가 20년 후에 열렸을 때 오늘과 동일한 모습이도록 보장합니다. A 수준은 "접근 가능한"을 의미하며, B 수준의 모든 것 외에 스크린 리더와 같은 접근성 기능을 가능하게 하는 문서 구조 및 태깅 요구 사항을 포함합니다. U 수준은 "유니코드"로, B와 A 사이에 위치하며 텍스트를 유니코드로 저장해야 하지만 전체 구조 태깅은 요구하지 않습니다.

제 실무에서, 일반적으로 대부분의 비즈니스 응용 프로그램에 대해 PDF/A-2b 또는 PDF/A-3b를 추천합니다. PDF/A-2b는 뛰어난 압축을 제공하며(수백만 개의 문서를 아카이빙할 때 중요함), 투명성을 지원합니다(현대 디자인 요소에는 필수적임) 및 현재 소프트웨어에 널리 지원됩니다. PDF/A-3b는 원본 파일을 내장할 수 있는 기능을 추가합니다—예를 들어, 재무 보고서의 PDF/A-3b 버전 안에 원본 Excel 스프레드시트를 내장할 수 있습니다. 이는 문서의 전체 맥락을 유지하는 데 매우 유용할 수 있습니다.

하지만 접근성이 귀하의 조직에 중요하다면—그리고 그럴 필요가 있습니다—PDF/A-2a 또는 PDF/A-3a는 추가 노력을 기울일 가치가 있습니다. 태깅 요구 사항은 문서 작성 시 더 많은 작업을 의미하지만, 이는 귀하의 아카이브가 장애인을 위한 사용이 가능하고, 미래 데이터 추출을 위해 더 기계 인식 가능하게 보장합니다. 저는 한 주 정부 기관과 작업하여 전체 아카이브를 PDF/A-2a로 변환했으며, 그들은 이후 태그가 없는 문서에서는 불가능할 자동 콘텐츠 추출 및 분석을 구현할 수 있었습니다.

첨단 요구 사항을 다루는 조직의 경우, PDF/A-4는 최신 기능을 제공합니다.

P

Written by the PDF0.ai Team

Our editorial team specializes in document management and PDF technology. We research, test, and write in-depth guides to help you work smarter with the right tools.

Share This Article

Twitter LinkedIn Reddit HN

Related Tools

Compress PDF to 100KB — Free Online, Maximum Compression 10 PDF Tips & Tricks You Need to Know All PDF Tools — Complete Directory

Related Articles

Creating Fillable PDF Forms: Complete Guide — pdf0.ai Best Free PDF Tools Online in 2026 — pdf0.ai How to Convert Scanned Documents to Searchable PDFs — pdf0.ai

Put this into practice

Try Our Free Tools →