Adsense

Donate


主页
Minidx文本抽取Com组件Extract-Text以及VB2005,VC2005 Demo(2008/02/10)

这一组件是专门为开发人员准备的,利用Minidx Extract-Text Com组件,您可以轻松的从Word,Xls,Pdf……等200多种文件格式中读取文本内容。该组件本身用C++编写,以Com组件的形式调用,您可以在一切可以调用Com组件的开发语言中调用这一组件,快速的抽取各种文本内容。VC2005工程Demo源代码从这里 下载,VB2005工程Demo源代码从这里 下载,该组件可以用于商业以及非商业的用途,下面是两篇VB,VC下调用的说明,有任何相关问题都可以在这里 提出,但本人不承担任何形式任何责任和义务。

 利用Minidx Extract-Text Com组件从Word,Xls,Pdf……等文件中读取文本内容VB下调用使用说明

 利用Minidx Extract-Text Com组件从Word,Xls,Pdf……等文件中读取文本内容VC下调用使用说明

leftleftleft

 
Minidx.RC1.1 released(2007/10/20)

     -- 修正了打开原始文件时格式错误的bug(10.20)

                 点击这里 下载最新版 

 
重写了Minidx的分词模块,实现了超高速分词(2007/09/08)

        Minidx原先采用的是单字分词,效率方面比较低,所以重写了Minidx的分词模块,实现了超高速分词以及相当的准确率效果,英文因为还没有对单词作处理,所以出来结果比较奇怪,中文和日文应该准确率还是挺高的。先来几张图片Show一下

中文分词日文分词英文分词

 
Minidx.RC1.0 released(2007/08/18)

        -- Data format is changed(08.12)
        -- realized the compression function(08.12)
        -- revised the error which double click file couldn't show the file content(08.01)
        -- revised the error which document item couldn't show normally(08.01)
        -- revised the error when deleted the files consecutively the program would down(07.31)
        -- revised the errow when use chinese setup path would wrong(07.29)
        -- added the confirmation whether remove the data folder
        -- Some bugs were fixed

                                                          >>>Download
 

 
Minidx是一个文件管理系统

 Minidx是一个文件管理系统。它具有
自带超高速全文搜索引擎,瞬间找到所需要的文件
具有自己的存储系统,安全的管理重要文档
可存储与管理TB级别的数据,数据量的大小对系统运行的效率影响甚微
采用IFilter抽取文本,无须安装例如Office的应用程序即可阅读内容
基于Unicode编码,可正常输入/显示多国语言
高亮语法显示,方便地阅读多种文档
检索结果高亮显示,方便查看
模糊查询,自动识别同义词 例如要查询where时,输入whe也能得到结果
自带Web服务器,可方便的在Internet/局域网共享所管理的文档
独立的P2P功能,可自由选择启动服务端/客户端,或者同时启动
可以根据创建时间,修改时间,访问时间,标题,存储路径,内容等各项属性分等级,分目录地实现精确查询
可方便设定过滤字段

搜索引擎特性:
整个引擎非常小,由2万多行C/C++代码实现
标准C/C++编写,几乎可以运行在所有的系统 
无需太多内存,在较低的硬件环境下也可以运行而不影响效率
方便的集成到各种系统,利用Minidx引擎,仅仅需要添加几行代码就可以让系统具有全文检索功能
超高速检索,百万条记录也能在毫秒内返回结果
字,词,句检索
条件"与","或"查询,以及他们的组合查询
采用UNICODE字符集,多国语言字符串混合查询
精确查询,甚至一个标点符号也可以精确定位

 
项目产生背景
 桌面搜索软件有很多,但是基本上都是针对电脑中的全部文件进行索引,用户最多只能精确到某一类文件,却无法按照自己的要求管理重要的文档。

        因工作的需要作者经常会更换电脑,因为没有有效的文档管理工具,经常会随着电脑的更换而丢失部分文档,到用的时候才发现。家里电脑中的资料也是如此。

        文档管理工具除了有效的管理文档外,还需要帮助使用者快速的找到相关的资料,使用者应该可以自己定义文档的属性描述,从而进行快速查询;作者的资料中有的 是中文简体的,有的是中文繁体的,有的是日文的,有的是英文的,并且操作系统也会有不同的语言切换,因此不希望文档的管理阅读受到OS的语言环境的影响, 为了解决这些问题,作者决定开发自己的搜索引擎集成到文档管理系统中,因此Minidx应运而生了。

        虽然是因个人需要而开发的软件,但是设计与开发都是按照海量数据处理进行的,因此Minidx具有管理海量数据的能力,能够轻松应付企业级的应用。  
 
© 2016 Minidx文件管理系统 | Minidx全文搜索引擎
Minidx! is a professional file management system.