[프로그램] 이미지 형태의 PD

오늘 포스팅은 이미지 형태의 PDF를1. 드래그 가능한 텍스트 형식의 영역으로 바꾸고2. 해당 영역을 TXT로 바꾸어주는 과정 을 해볼 겁니다.​

>

​글자는 한글, 워드, 파워포인트의 텍스트 상자와 같이 글자 형식으로 저장하여 PDF로 저장하면아래와 같이 드래그 가능한 형태로 저장이 됩니다.이러한 형태로 저장이 되어 있어야, txt 파일로도 추출이 가능합니다.​단순 캡쳐한 이미지 형태로 PPT 저장한 경우, 텍스트 형식의 개체가 아니므로 텍스트 검색이 안 되는 거죠.이를 위의 글자 형식의 개체로 바꾸어 PDF에 저장할 겁니다.​PDF의 경우 웹에서 작동하는 프로그램, 무료 설치형태의 프로그램과대부분 확장자와의 호환성 때문에, 프로그램은 많아서, 아무거나 써도 됩니다.​1. 알PDF 다운로드​원리는 OCR(Optical Character Recognition), 광학 문자 인식 방식이며,이미지에서 글자를 인식해주는 기능입니다. ​이 OCR 기능을 이용하여 글자가 인식 되면, 그 위치에 텍스트 상자로 인식된 글자를 얹어서검색 가능한 형태로 PDF를 다시 만드는 겁니다.​프로그램은 무료 프로그램인 아래의 알PDF를 다운받아서 할 수 있습니다.https://www.altools.co.kr/download/alpdf.aspx?utm_source=altoolsweb&utm_medium=product&utm_campaign=alpdf

​2. PDF 파일 내부 변환 후 저장

>

>

>

>

>

​3. TXT 파일 저장

>

>

​4. OCR.pdf와 txt 파일 저장 경로

>

바탕화면 위치입니다.C:UserssamsungDesktopALPDFConvert​5. 완료

>

​6. 주의할 점이렇게, 파일변환을 하여 대량의 자료를 관리, 편집하면서자료 처리를 해 두면 좋습니다. 위의 사진처럼 OCR 판독기 프로그램에 따라 글자 인식이 잘 안되는 경우도 있습니다.그리고, OCR로 변환한 파일은 파일 크기가 매우 크니 필요한 파일만 얻고 압축하거나 지우는 것 추천드립니다.