BIS-Miner“雅典娜”数据挖掘软件结合了多种图形使用者接口的分析技术,包含等数据挖掘方法,该工具提供容易使用的可视化程序环境来执行这些分析功能。
软件应使用图形象征的方法,就是透过托拉鼠标和连接屏幕上的功能节点,这些节点提供了工具库、源数据库管理、数据读入和导出、数据清洗和转换、建模、模型评估、文本挖掘、网络爬虫、报告和可视化等功能,使用方法是从工具树中选取合适的节点,并放置在屏幕上再连接各节点。
软件应共包含超过500个的算子,以便专业数据分析,这些算子分为如下九大部分:
工具库:与“子进程”算子一起,也包含了重要的宏观算子以及日志记录的操作符;
源数据库管理:包含两种操作符,即从存储库中读取和写入访问;
数据读入和导出:包含许多操作符,以便从外部格式读取数据和对象,如文件、数据库等;以及将数据和对象写入进外部格式,如 文件、数据库等;
数据清洗和转换:提供一百多种方法,以便转换数据和元数据管理;
建模:包含两百多种数据挖掘算法,如分类方法、回归方法、聚类分析、权重、关联规则方法、相关性和相似性分析等。支持预测建模、模型交叉验证、文本分类、网页爬取、中文网页分类、中文网页聚类等。
文本挖掘:提供文本分类、文本处理和挖掘等相关功能;6.可提供变量配置功能:变量名、变量标签和缺失值等
网络爬虫:提供网络爬虫,从互联网络上攫取信息;
报告和可视化:提供报告导出和数据可视化方法。
软件应有强大的资料读取能力,包含flat file及关系型数据库,可连接到最多样的数据源,如Oracle、IBM DB2、微软SQL服务器、MySQL和PostgreSQL,访问Excel、Access和SPSS文件以及许多其他的数据格式。
软件应支持所有常用的Windows版本,支持麦金塔、Linux或Unix系统。
在软件应中,每一次分析,可以建立一个进程,这个进展可轻松扩展到上百个操作符,并分布在几个层次或子进程中,从而可以完成最为复杂的任务。
北京商智通信息技术有限公司致力于将先进信息技术和统计技术的最佳管理实践普及到客户的管 理与业务创新活动中;全面提供拥有自主知识产权的多渠道数据采集、数据分析、数理化管理/市场研究模型化软件和管理咨询解决方案,并一直保持创新的思维、领先的技术、专业的态度和周到的服务。