ドキュメントフィルタソリューション

DocuFilterは、さまざまな文書テストを経て信頼性と技術力が検証された文書テキスト抽出SDKソリューションです。
MS Office、ハンコムオフィス、Open Office、PDF、EML、MSG、圧縮(10種類)など、ほとんどの文書フォーマットをサポートし、文書内に含まれる画像抽出機能まで提供されます。

文書フィルタリングプロセス

문서 텍스트 추출 SDK 솔루션

主な特徴を見てみましょう。

高速で信頼性の高いパフォーマンスを提供

  • 既存の商用製品と比較して数倍以上の高速フィルタリング速度

  • 多年の研究・分析経験による安定したパフォーマンスの提供

  • 2GB以上の大容量ファイルのフィルタリング

  • メモリリークゼロ化と例外処理で安定性を提供

さまざまな文書フォーマットの識別と抽出

  • さまざまな文書フォーマットタイプからテキストを抽出

  • 文書内に含まれる画像データの抽出

  • 暗号化された文書ファイルの検出

  • DRM適用ファイルの識別(10種類)

  • 多数の(Alz、Eggなど10種類)圧縮ファイルフィルタリングを提供

さまざまなOSとプラットフォームのサポート

  • Windows、Linux 32Bit/64Bit サポート

  • モバイル環境(Android、iOS)サポート可能

簡単で便利なインターフェース

  • C / C ++、Java、Python、C#などのさまざまなインターフェースを提供する

  • ユーザー環境に適したライブラリと実行可能ファイルの提供

  • メモリとファイルインターフェイスのサポート

運営環境

Linuxサーバー
  • オペレーティングシステム
  • Ubuntu 16.04.3
  • CentOS 7.0
  • RHEL 7.0
  • カーネル2.6.18.xx以降
  • GCC Lib 2.x〜4.x
  • CPU
  • Intel Xeon 4Core以上
  • メモリ
  • 8GB以上
  • ハードディスク
  • 1TB以上の空きスペース
  • インターフェース
  • C / C ++、Java、Python、C#など
Windowsサーバー
  • オペレーティングシステム
  • Windows 2003 SP2以降
  • CPU
  • Intel Xeon 4Core以上
  • メモリ
  • 8GB以上
  • ハードディスク
  • 500GB以上の空きスペース
  • インターフェース
  • C / C ++、Java、Python、C#など
Windows PC
  • オペレーティングシステム
  • Windows 7 以降
  • CPU
  • Intel Core i3 2.9GHz以上
  • メモリ
  • 4GB以上
  • ハードディスク
  • 10GB以上の空きスペース

よくある質問と回答

ドキュメントフィルタをどこで使用する必要がありますか?

社内個人情報の漏洩防止、検索、メールなど、文書内容のプレビューが必要な場所に適用可能です。以下はいくつかの例です。

웹/그룹웨어/E-mail 등의 첨부파일 미리보기
내 외부망 분리에 따른 문서유출 방지
문서 중앙화/개인정보보호 솔루션 연동

サポートするファイル形式には何がありますか?

文書編集機

  • MS Word(97、2003、2007、2010、2013、2016)

  • OpenOffice Word Document(ODT)

  • Hancom HWP(2007、2010、2014)、配布用のドキュメントを含める

  • 一太郎

スプレッドシート

  • MS Excel(97、2003、2007、2010、2013、2016) - xlsb、xlsmのサポート

  • OpenOffice Excel Document(ODS)

  • Hancom CELL(2007,2010, 2014)

プレゼンテーション

  • MS PowerPoint(97、2003、2007、2010、2013、2016)

  • OpenOffice Powerpoint Document(ODP)

  • Hancom SHOW(2007、2010、2014)

圧縮

  • Zip、Egg、Alz、gzip、Tar、7z、gz、rar、tbz、jar

ビューア

  • Portable Document Format(PDF)

  • Electronic PUBlication Format(EPUB)

Text

  • Portable Document Format(PDF)

  • Electronic PUBlication Format(EPUB)

その他

  • Open Office ODFファイルのサポート

  • Embedding OLE オブジェクト文書のフィルタリング機能を追加

  • HTMLドキュメントのタグフィルタリング機能を追加

  • EML、RTF、MSG、MP3、MIME、CHM

  • ファイル形式は不明ですが、ファイル内の文字列を抽出できる形式のファイル

画像抽出可能フォーマット

  • HWP、DOC、DOCX、XLS、XLSX、PPT、PPTX、PDF

  • ODT、ODS、ODP、MP3