DocuFilter 는 다양한 문서 테스트를 거쳐 안정성과 기술력이 검증된 문서 텍스트 추출 SDK 솔루션입니다.
MS Office, 한컴오피스, Open Office, PDF, EML, MSG, 압축(10종) 등 대부분의 문서 포맷을 지원하며 문서 내 포함되어 있는 이미지 추출 기능까지 제공됩니다.
기존 상용 제품 대비 수 배 이상의 빠른 필터링 속도
다년간의 연구·분석 경험을 통한 안정적인 성능 제공
2GB 이상의 대용량 파일 필터링
Memory leak 제로화 및 예외처리로 안정성 제공
다양한 문서 포맷 유형에서 텍스트 추출
문서 내에 포함되어 있는 이미지 데이터 추출
암호화된 문서 파일 탐지
DRM 적용 파일에 대한 식별(10종)
다수의(Alz, Egg 등 10종) 압축 파일 필터링 제공
Windows, Linux 32Bit/64Bit 지원
모바일 환경(Android, iOS) 지원 가능
C/C++, Java, Python, C# 등 다양한 인터페이스 제공
사용자 환경에 적합한 라이브러리 및 실행 파일 제공
메모리 및 파일 인터페이스 지원
사내 개인정보 유출 방지, 검색, 메일 등 문서 내용 미리보기가 필요한 곳에 적용 가능합니다. 아래는 몇가지 예입니다.
문서편집기
MS Word(97, 2003, 2007, 2010, 2013, 2016)
OpenOffice Word Document(ODT)
Hancom HWP(2007,2010, 2014), 배포용 문서 포함
이치타로
스프레드시트
MS Excel(97, 2003, 2007, 2010, 2013, 2016) - xlsb, xlsm 지원
OpenOffice Excel Document(ODS)
Hancom CELL(2007,2010, 2014)
Presentation (프레젠테이션)
MS PowerPoint(97, 2003, 2007, 2010, 2013,2016)
OpenOffice Powerpoint Document(ODP)
Hancom SHOW(2007,2010, 2014)
압축
Zip, Egg, Alz, gzip, Tar, 7z, gz, rar, tbz, jar
뷰어
Portable Document Format(PDF)
Electronic PUBlication Format(EPUB)
Text
Portable Document Format(PDF)
Electronic PUBlication Format(EPUB)
기타
Open Office ODF 파일 지원
Embedding된 OLE 개체 문서에 대한 필터링 기능 추가
HTML 문서의 태그 필터링 기능 추가
EML, RTF, MSG, MP3, MIME, CHM
파일 포맷은 알 수 없지만 파일 내부의 문자열을 추출할 수 있는 형태의 파일들
이미지 추출 가능 포맷
HWP, DOC, DOCX, XLS, XLSX, PPT, PPTX, PDF
ODT, ODS, ODP, MP3