- 학습목표 : PDF에도 여러 종류가 있는데 업무에서 주로 쓰는 두 PDF를 비교해 보자.
Readable PDF | Bitmap PDF | |
기본 구조 | ● 텍스트 기반 ● 텍스트 정보 포함 -> 단어 검색, 복사, 선택 O ● 디지털 문서(Word, Excel, 웹 페이지 등)에서 PDF로 변환한 경우 주로 나타남 |
● 이미지 기반 ● 문서 전체가 비트맵 이미지 형태로 저장됨 ● 주로 스캔된 종이 문서를 PDF로 저장했을 때 ● 모든 정보가 이미지로 -> 텍스트 단어 검색, 복사, 선택 X |
파일 크기 | ● 상대적으로 작음 ● 이미지가 포함되어 있어도 텍스트 압축 덕분에 효율적인 저장 O |
● 이미지 해상도에 따라 파일 크기가 커질 수 있음 |
해상도 및 가독성 | ● 확대해도 텍스트가 깨지지 않음 ● 글자가 벡터 방식으로 저장되어 있음 |
● 해상도에 의존적 ● 확대하면 텍스트가 흐려지거나 깨짐 |
OCR 인식 | ● 필요 X | ● 필요 O |
활용 목적 | ● 전자문서로 배포 / 텍스트 검색, 복사 및 수정이 필요한 경우 | ● 스캔된 이미지 자료, 보안 목적(편집 방지) |
- ※ OCR (Optical Chracter Recognition, 광학 문자 인식)
- 이미지 / 스캔된 문서 -> 텍스트 인식 -> 디지털 텍스트로 변환하는 기술
- 이미지를 분석 -> 그 안에 있는 문자를 찾아내고, 컴퓨터가 이해할 수 있는 텍스트로 변환 -> 편집, 검색, 저장할 수 있도록 함