现在时间是:
现在时间是:
   
产品展示  PRODUCTS
产品展示  PRODUCTS

DMCTestFilter

0.00
0.00
  

如今我们已经进入了大数据处理时代,快速、简单的处理海量数据---DMCTextFiler产品,本产品可以从各种各样的文档格式的数据中(文件格式自动识别),快速抽出纯文本数据信息...



DMCTestFilter (纯文本抽出通用程序库)功能简介

 

1、可以对近百种文件格式进行文本抽取

 

2、对文件的操作不需要安装其他任何第三方软件

文件操作在数据转换过程中完全独立对文件格式进行分析转换,不需要安装生成文件的原软件。特别是不依赖于原软件的各种文档的Image化、PDF化技术,在网络服务器中的应用非常广泛。这是一项世界上比较流行、且需求量很大的技术。

 

3、可以支持多种操作系统环境、支持服务器并发操作

支持各种操作系统,如:Windows32位和64位各种版本以及Sun SPARCSolaris(32bit/64bit)x86Solaris10(64bit)Linux32bitLinux64bitIBM AIX 5LMacintosh等,并支持单线程或多线程操作,实现了多人共用机制。

 

4、无与伦比的运行速度

程序全部用C/C++语言开发,执行速度无与伦比,即使是单线程运行,平均每秒钟处理9个文件,当50个线程时,每秒钟16个文件,随着线程数的增加以及机器性能的提高。是目前世界上处理文档效率最高的软件。

 

5、多种语言文字代码的支持

抽出文本时,可以指定以下的字符集合作为文本文件的字符集:GBKGB18030Big5Shift_JISWINDOWS31JEUC-JPEUC-JP-FIXISO-2022-JPKS X 1001ISO-8859-1ISO-10646-UCS-2ISO-10646-UCS-4UTF-16UTF-8Shift_JIS-2004ISO-2022-JP-2004EUC-JIS-2004

 

6、广泛的应用领域

软件程序库广泛的应用于政府、企业等各个领域的信息资源开发利用、智能搜索引擎、情报分析和服务、信息安全、企业知识门户、数字图书馆、电子商务等领域。在世界各地得到了众多知名企业的青睐。产品在性能和质量上都得到了用户高度评价。

 

应用案例

拦截邮件后的内容信息抽取过滤

搜索引擎的数据前提格式统一

分词信息挖掘系统的数据转换

网络数据的过滤

舆情系统的信息挖掘

中文文本挖掘系统

数字图书馆解决方案

………………