본문 바로가기

IT/Office

Readable PDF vs Bitmap PDF

  • 학습목표 : PDF에도 여러 종류가 있는데 업무에서 주로 쓰는 두 PDF를 비교해 보자.
  Readable PDF Bitmap PDF
기본 구조 ● 텍스트 기반
텍스트 정보 포함 -> 단어 검색, 복사, 선택 O
 디지털 문서(Word, Excel, 웹 페이지 등)에서
PDF로 변환한 경우 주로 나타남
이미지 기반
 문서 전체가 비트맵 이미지 형태로 저장됨
주로 스캔된 종이 문서를 PDF로 저장했을 때 
모든 정보가 이미지로
-> 텍스트 단어 검색, 복사, 선택 X
파일 크기  상대적으로 작음
이미지가 포함되어 있어도
텍스트 압축 덕분에 효율적인 저장 O
이미지 해상도에 따라 파일 크기가 커질 수 있음
해상도 및 가독성 ● 확대해도 텍스트가 깨지지 않음
● 글자가 벡터 방식으로 저장되어 있음
● 해상도에 의존적
● 확대하면 텍스트가 흐려지거나 깨짐
OCR 인식 ● 필요 X ● 필요 O
활용 목적 ● 전자문서로 배포 / 텍스트 검색, 복사 및 수정이 필요한 경우 ● 스캔된 이미지 자료, 보안 목적(편집 방지)

 

  • OCR (Optical Chracter Recognition, 광학 문자 인식)
    • 이미지 / 스캔된 문서 -> 텍스트 인식 -> 디지털 텍스트로 변환하는 기술
    • 이미지를 분석 -> 그 안에 있는 문자를 찾아내고, 컴퓨터가 이해할 수 있는 텍스트로 변환 -> 편집, 검색, 저장할 수 있도록 함