数据库异常检测算法有哪些,从大量数据集中找出异常数据一般用什么数据挖掘算法
来源:整理 编辑:黑码技术 2024-06-06 08:12:05
本文目录一览
1,从大量数据集中找出异常数据一般用什么数据挖掘算法
聚类吧,异常数据一般会聚集到一类。。聚类方法太多,要根据实际情况选择。。聚类可以。将正常的数据聚类在一起,离群点可以认为是异常数据。如果可以知道异常值的特征,尝试一下决策树或者svm一些分类的算法。
2,SQL 什么语句能得到异常值
sql都是靠人去写的,你要根据实际情况来写sql。若你的item不可能少于10KG,不可能大于50KG,你可以这样来捕获异常:select * fron table_name where weight<10 or weight>50;// catch捕获异常获取信息try sql执行语句} catch (sqlexception e) system.out.println(e.getmessage);}
3,从数据集中剔除异常数据一般用什么数据算法
常用的方法有:1、可以通过“分析”下“描述统计“下“频率”的”绘制“直方图”,看图发现频数出现最少的值,就可能是异常值,但还要看距离其它情况的程度。2、可通过“分析”下的“描述统计”下的“探索”下的“绘制”选项的“叶茎图”,看个案偏离箱体边缘(上端、下端)的距离是箱体的几倍,“○”代表在1.5-3倍之间(离群点),“*”代表超过3倍(极端离群点)。3、可以通过“分析”下“描述统计“下“描述”下的选项“将标准化存为变量Z”,选择相应的变量,“确定”。将生成新变量,如果值超过2,肯定是异常值。-聚类可以。将正常的数据聚类在一起,离群点可以认为是异常数据。如果可以知道异常值的特征,尝试一下决策树或者svm一些分类的算法。
4,怎样才能捕捉到SQL查询发生的异常
ON EXCEPTION IN ( - xxx ) SET SQL_ERROR_VAR IF SQL_ERROR_VAR = - xxx THEN END IFEND EXCEPTION大概是这样的 具体问题具体分析sql server中sql语句执行错误直接会抛出异常,在应用中捕获异常即可。实时监控sql错误:查看 sql server 错误日志可以确保进程(例如,备份和还原操作、批处理命令或其他脚本和进程)成功完成。此功能可用于帮助检测任何当前或潜在的问题领域,包括自动恢复消息(尤其是在 sql server 实例已停止并重新启动时)、内核消息或其他服务器级错误消息。使用 sql server management studio 或任何文本编辑器可以查看 sql server 错误日志。默认情况下,错误日志位于 program files\microsoft sql server\mssql.n\mssql\log\errorlog 和 errorlog.n 文件中。每当启动 sql server 实例时,将创建新的错误日志,虽然 sp_cycle_errorlog 系统存储过程可用于循环使用错误日志文件,而不必重新启动 sql server 实例。通常,sql server 保留前六个日志的备份,并指定最近日志备份的扩展名为 .1、下一个最近日志备份的扩展名为 .2,依次类推。当前的错误日志没有扩展名。
5,DBA经验如何进行MySQL数据库表的故障检测 1
本章将讲述如何检测MySQL数据库表的故障。 数据库表的故障检测和修正的一般过程如下:◆ 检查出错的表。如果该表检查通过,则完成任务,否则必须修复出错的数据库表。 ◆ 在开始修复之前对表文件进行拷贝,以保证数据的安全。 ◆ 开始修复数据库表。 ◆ 如果修复失败,从数据库的备份或更新日志中恢复数据。 在使用myisamchk或isamchk检查或修复表之前,应该首先注意:◆ 建立数据库备份和使用更新日志,以防修复失败,丢失数据。 ◆ 仔细阅读本章内容以后再进行操作,尤其是不应该在阅读“避免与MySQL服务器交互作用”之前进行操作。因为,在你没有足够的知识之前贸然操作,可能会引起严重的后果。 ◆ 如果你在Unix平台上对表进行维护时,应该首先注册到专用的帐户 mysql,以避免对表读写访问产生所有权的问题,以及破坏数据库目录的所有权限。 数据库表的维护工具MySQL的myisanchk和isamchk实用程序很类似,基本上它们具有同样的使用方法。它们之间的主要区别时所使用的表的类型。为了检查/修复MyISAM表(.MYI和.MYD),你应该使用myisamchk实用程序。为了检查/修复ISAM表(.ISM和.ISD),你应该使用isamchk实用程序。 ◆ 为了使用任一个使用程序,应指明你要检查或修复的表,myisamchk和isamchk的使用方法为: shell>myisamchk options tbl_name shell>isamchk options tbl_name 如果你愿意,你可以在命令行命名几个表。 ◆ 你也能指定一个名字作为一个索引文件(用“ .MYI”或“.ISM”后缀),它允许你通过使用模式“*.MYI”或“.ISM”指定在一个目录所有的表。例如,如果你在一个数据库目录,你可以这样在目录下检查所有的表: shell> myisamchk *.MYI shell>isamchk *.ISM ◆ 如果你不在数据库目录下,你可指定目录的路径: shell> myisamchk options /path/to/database_dir/*.MYI shell> isamchk options /path/to/database_dir/*.ISM ◆ 你甚至可以通过为MySQL数据目录的路径指定一个通配符来作用于所有的数据库中的所有表: shell> myisamchk options /path/to/datadir/*/*.MYIshell> isamchk options /path/to/database_dir/*/*.ISM 这个方法无法在windows平台下使用。 注意 不论是myisamchk还是isamchk都不对表所在的位置做任何判断,因此,应该或者在包含表文件的目录运行程序,或者指定表的路径名。这允许你将表文件拷贝到另一个目录中并用该拷贝进行操作。CHECK TABLE table_name [option];
option:
QUICK 不扫描行,不检查错误的链接。
FAST 只检查没有被正确关闭的表。
CHANGED 只检查上次检查后被更改的表,和没有被正确关闭的表。
MEDIUM 扫描行,以验证被删除的链接是有效的。也可以计算各行的关键字校验和,并使用计算 出的校验和验证这一点。
EXTENDED 对每行的所有关键字进行一个全面的关键字查找。这可以确保表是100%一致的,但是 花的时间较长。
文章TAG:
数据库异常检测算法有哪些 从大量数据集中找出异常数据一般用什么数据挖掘算法