1,数据格式的介绍

数据格式(data format)是数据保存在文件或记录中的编排格式。
Shapefile,Coverage,Geodatabase 举个例子,大家使用那么长时间的Txt和Doc文件格式,也没有去考究他们有什么区别和联系,对于学习ArcGIS中出现的这么多数据格式也不需要过多的考虑,只要对他们的一些基本应用有所了解就可以了:Shapefile:一种基于文件方式存储GIS数据的文件格式。至少由.shp,.dbf,.shx三个文件作成,分别存储空间,属性和前两者的关系。是GIS中比较通用的一种数据格式。Coverage:一种拓扑数据结构,一般的GIS原理书中都有它的原理论述。数据结构复杂,属性缺省存储在Info表中。目前ArcGIS中仍然有一些分析操作只能基于这种数据格式进行操作。Geodatabase:ArcInfo发展到ArcGIS时候推出的一种数据格式,一种基于RDBMS存储的数据格式,其有两大类:1.Personal Geodatabse 用来存储小数据量数据,存储在Access的mdb格式中。2.ArcSDE Geodatabse 存储大型数据,存储在大型数据库中Oracle,Sql Server,DB2等。可以实现并发操作,不过需要单独的用户许可。

数据格式的介绍

2,数据库有哪些类型

目前关系型数据库主要有MySQL、SQL Server、数蚕数据库、Oracle数据库。MySQL:免费产品,中小企业使用广泛。SQL Server:微软的商业化产品,微软SQL语句兼容性好,商业化成熟度高。数蚕数据库:数蚕科技针对中小型企业的数据库,c++接口特性良好,SQL特性较弱。Oracle 数据库:商业化程度最高的关系数据库, 优良的性能和企业扩展能力。非关系型数据库主要有FastDB、Memcached和Redis等主流内存数据库。一般应用于缓存等非关键数据存储,其优点是数据查询速度快,对下层编程接口良好。
数据库通常分为:层次式数据库;网络式数据库;关系式数据库三种类型。
根据存储模型划分,数据库类型主要可分为:网状数据库(Network Database)、关系数据库(Relational Database)、树状数据库(Hierarchical Database)、面向对象数据库(Object-oriented Database)等。商业应用中主要是关系数据库,比如Oracle、DB2、Sybase、MS SQL Server、Informax、MySQL等。
模糊数据库 指能够处理模糊数据的数据库。一般的数据库都是以二直逻辑和精确的数据工具为基础的,不能表示许多模糊不清的 事情。随着模糊数学理论体系的建立,人们可以用数量来描述模糊事件并能进行模糊运算。这样就可以把不完全性、不确定性、模糊性引入数据库系统中,从而形成模糊数据库。模糊数据库研究主要有两方面,首先是如何在数据库中存放模糊数据;其次是定义各种运算建立模糊数据上的函数。模糊数的表示主要有模糊区间数、模糊中心数、模糊集合数和隶属函数等。 统计数据库 管理统计数据的数据库系统。这类数据库包含有大量的数据记录,但其目的是向用户提供各种统计汇总信息,而不是提供单个记录的信息。 网状数据库 处理以记录类型为结点的网状数据模型的数据库。处理方法是将网状结构分解成若干棵二级树结构,称为系。系类型 是二个或二个以上的记录类型之间联系的一种描述。在一个系类型中,有一个记录类型处于主导地位,称为系主记录类 型,其它称为成员记录类型。系主和成员之间的联系是一对多的联系。网状数据库的代表是dbtg系统。1969年美国的 codasyl组织提出了一份“dbtg报告”,以后,根据dbtg报告实现的系统一般称 为dbtg系统。现有的网状数据库系统大都是采用dbtg方案的。dbtg系统是典型的三级结构体系:子模式、模式、存储模式。相应的数据定义语言分别称为子模式定义语言ssddl,模式定义语言sddl,设备介质控制语言dmcl。另外还有数据操纵语言dml。 演绎数据库 是指具有演绎推理能力的数据库。一般地,它用一个数据库管理系统和一个规则管理系统来实现。将推理用的事实数据存放在数据库中,称为外延数据库;用逻辑规则定义要导出的事实,称为内涵数据库。主要研究内容为,如何有效地计 算逻辑规则推理。具体为:递归查询的优化、规则的一致性维护等。

数据库有哪些类型

3,数据库中的十种数据类型都是什么

Character 数据类型 Character 数据类型用来存储字母数字型数据。当你在oracle 中定义一个character 数据时,通常需要制定字段的长度,它是该字段的最大长度。ORACLE提供以下几种character 数据类型: CHAR() CHAR数据类型是一种有固定长度和最大长度的字符串。存储在数据类型为CHAR字段中的数据将以空格的形式补到最大长度。长度定义在1——2000字节之间。 当你创建一个CHAR型字段,数据库将保证在这个字段中的所有数据是定义长度,如果某个数据比定义长度短,那么将用空格在数据的右边补到定义长度。如果长度大于定义长度将会触发错误信息。 VARCHAR() varchar型数据是varchar2型数据的快照。 VARCHAR2() varchar2数据类型是一种可变长度的、有最大长度的字母数字型数据。Varchar2类型的字段长度可以达到4000字节,Varchar2类型的变量长度可以达到32676字节。 一个空的varchar2(2000)字段和一个空的varchar2(2)字段所占用的空间是一样的。 NCHAR() 和 NVARCHAR2() NCHAR() 和 NVARCHAR2()数据类型分别与CHAR() 和 VARCHAR2()类型是相同的,只不过它们用来存储NLS(National Language Support)数据。 LONG LONG 数据类型是一个遗留下来的而且在将来不会被支持的数据类型。它将被LOB(Large Object)数据类型所代替。 比较规则 Varchar2和char数据类型根据尾部的空格有不同的比较规则。对Char型数据,尾部的空格将被忽略掉,对于Varchar2型数据尾部带空格的数据排序比没有空格的要大些。比如: Char 型数据: YO=YO Varchar2型数据: YO<YO Numberic 数据类型 Numberic 数据类型用来存储负的和正的整数、分数和浮点型数据,范围在-1*10-103 和9.999…99*10125之间,有38位的精确度。标识一个数据超出这个范围时就会出错。 Number( ,) Number数据类型存储一个有p位精确度的s位等级的数据。 DATE 数据类型 DATE 数据类型用来存储日期和时间格式的数据。这种格式可以转换为其他格式的数据去浏览,而且它有专门的函数和属性用来控制和计算。以下的几种信息都包含在DATE数据类型中: Century Year Month Day Hour Minute Second LOB 数据类型 LOB(Large Object) 数据类型存储非结构化数据,比如二进制文件,图形文件,或其他外部文件。LOB 可以存储到4G字节大小。数据可以存储到数据库中也可以存储到外部数据文件中。LOB数据的控制通过DBMS_LOB 包实现。BLOB, NCLOB, 和CLOB 数据可以存储到不同的表空间中,BFILE存储在服务器上的外部文件中。LOB数据类型有以下几种: BLOB: 二进制数据 CLOB: 字符型数据 BFILE: 二进制文件 其他数据类型 ROWID ROWID 数据类型是ORACLE数据表中的一个伪列,它是数据表中每行数据内在的唯一的标识。

数据库中的十种数据类型都是什么

4,数据库的类型

ASP数据库类型DBFDBCMDBExcelSQLServer数据库是在计算机存储设备上按一定方式,合理组织并存储的相互有关联的数据的集合,是计算机技术和信息检索技术相结合的产物,是电子信息资源的主体,是信息检索系统的核心部分之一。按所提供的信息内容,数据库主要可分为参考数据库和源数据库。1.参考数据库主要存储一系列描述性信息内容,指引用户到另一信息源以获得完整的原始信息的一类数据库,主要包括书目数据库和指南数据库。(1)书目数据库 存储描述如目录、题录、文摘等书目线索的数据库,又称二次文献信息数据库。如各种图书馆目录数据库、题录数据库和文摘数据库等属于此类,它的作用是为用户指出了获取原始信息的线索。图书馆目录数据库,又称机读目录,其数据内容详细,除描述标题、作者、出版项等书目信息外,还提供用户索取原始信息的馆藏信息。题录、文摘数据库描述的数据内容与印刷型的题录、文摘相似,它提供了论文信息或专利信息等确定的信息来源,供用户检索。(2)指南数据库 存储描述关于机构、人物、产品、活动等对象的数据库。与其它数据库相比,指南数据库为用户提供的不仅仅是有关信息,还包括各种类型的实体,多采用名称进行检索。如存储生产与经营活动信息的机构名录数据库、存储人物信息的人物传记数据库、存储产品或商品信息的产品指南数据库、存储基金信息的基金数据库等属于此类,它的作用指引用户从其它有关信息源获取更详细的信息。2.源数据库主要存储全文、数值、结构式等信息,能直接提供原始信息或具体数据,用户不必再转查其它信息源的数据库。它主要包括全文数据库和数值数据库。(1)全文数据库 存储原始信息全文或主要部分的一种源数据库。如期刊全文数据库、专利全文数据库、百科全书全文数据库,用户使用某一词汇或短语,便可直接检索出含有该词汇或短语的原始信息的全文。(2)数值数据库 存储以数值表示信息为主的一种源数据库,和它类似的有文本-数值数据库。与书目数据库比较,数值数据库是对信息进行深加工的产物,可以直接提供所需的数据信息。如各种统计数据库、科学技术数据库等。数值数据库除了一般的检索功能外,还具有准确数据运算功能、数据分析功能、图形处理功能及对检索输出的数据进行排序和重新组织等方面的功能。4.2.2 数据库结构1.书目数据库的结构书目数据库是以文档形式组织一系列数据,这些数据被称为记录,一个记录又包含若干字段。(1)记录与字段 记录是作为一个单位来处理有关数据的集合,是组成文档的基本数据单位。记录中所包含的若干字段,则是组成记录的基本数据单位。在书目数据库中,一个记录相当于一条题录或文摘,因此,一个记录通常由标题字段、作者字段、来源字段、文摘字段、主题词字段、分类号字段、语种字段等组成。在有些字段中,又包含多个子字段,子字段是字段的下级数据单位。如,主题词字段含有多个主题词。按照字段所代表记录的性质不同,字段通常分为基本字段和辅助字段两类。常见的字段名称及代码见表4-1。表4-1 字段名称及代码基本字段 辅助字段字段名称 字段代码 字段名称 字段代码标 题 TI 记录号 DN文 摘 AB 作 者 AU叙 词 DE 作者单位 CS标识词 ID 期刊名称 JN出版年 PY出版国 CO语 种 LA(2)文档 按一定结构组织的相关记录的集合。文档是书目数据库数据组织的基本形式,文档的组织方式与检索系统的硬件和软件功能密切相关。在书目数据库中,文档结构主要分为顺排文档和倒排文档。1)顺排文档 记录按顺序存放,记录之间的逻辑顺序与物理顺序是一致的,相当于印刷型工具中文摘的排列顺序,是一种线形文档。顺排文档是构成数据库的主体部分,但其主题词等特征的标识呈无序状态,直接检索时,必须以完整的记录作为检索单元,从头至尾查询,检索时间长,实用性较差。2)倒排文档 将顺排文档中各个记录中含有主题性质的字段(如主题词字段、标题字段、叙词字段等)和非主题性质字段(如作者字段、机构字段、来源字段等)分别提取出来,按某种顺序重新组织得到的一种文档。具有主题性质的倒排档,称基本索引档,非主题性质的倒排档,称辅助索引档。综上所述,顺排档和倒排档的主要区别是:顺排档以完整的记录为处理和检索单元,是主文档,倒排档以记录中的字段为处理和检索单元,是索引文档。计算机进行检索时,先进入倒排档查找有关信息的存取号,然后再进入顺排档按存取号查找记录。2.全文数据库的结构一般的全文数据库结构与书目数据库相似,全文数据库的一个记录就是一个全文文本,记录分成若干字段。其主文档是以顺排形式组织的文本文档,倒排档是对应于记录可检字段的索引文档。3.数值数据库的结构数值数据库的结构要综合考虑数据库的内容及检索目的,即,在内容上,数值数据库的主要内容是数值信息,但不排除含有必要的说明性的文本信息,在检索上,便于单项检索和综合检索,还能对数值进行准确数据运算、数据分析、图形处理及对检索输出的数据进行排序和重新组织。数值数据库的数据结构可以是单元式,也可以是表册形式。前者是对原始数据的模拟,后者则是对统计表格的机读模拟。数值数据库通常有多种文档,如顺排挡、倒排挡、索引文档等。顺排挡是由数值数据组成,为主文档,另有相应的索引文档,为便于存取,索引文档采用基本直接存取结构的组织形式。倒排挡也有相应的索引文档,索引文档采取分级组织形式。数值数据库的文档结构,使所有文档都可以用于检索,所有数据都可用来运算,构成了数值数据库的特点。4.指南数据库的结构指南数据库的结构兼有书目数据库、全文数据库和数值数据库的特点,有顺排档、倒排档、索引文档和数据字典。一般而言,对涉及主题领域较多,内容综合性较强的大型指南数据库,顺排挡(主文档)可采用多子文档的结构,对单一主题领域和内容较专的,则采用单一主文档和不定长、多字段的记录格式为宜。
模糊数据库 指能够处理模糊数据的数据库。一般的数据库都是以二直逻辑和精确的数据工具为基础的,不能表示许多模糊不清的 事情。随着模糊数学理论体系的建立,人们可以用数量来描述模糊事件并能进行模糊运算。这样就可以把不完全性、不确定性、模糊性引入数据库系统中,从而形成模糊数据库。模糊数据库研究主要有两方面,首先是如何在数据库中存放模糊数据;其次是定义各种运算建立模糊数据上的函数。模糊数的表示主要有模糊区间数、模糊中心数、模糊集合数和隶属函数等。 统计数据库 管理统计数据的数据库系统。这类数据库包含有大量的数据记录,但其目的是向用户提供各种统计汇总信息,而不是提供单个记录的信息。 网状数据库 处理以记录类型为结点的网状数据模型的数据库。处理方法是将网状结构分解成若干棵二级树结构,称为系。系类型 是二个或二个以上的记录类型之间联系的一种描述。在一个系类型中,有一个记录类型处于主导地位,称为系主记录类 型,其它称为成员记录类型。系主和成员之间的联系是一对多的联系。网状数据库的代表是dbtg系统。1969年美国的 codasyl组织提出了一份“dbtg报告”,以后,根据dbtg报告实现的系统一般称 为dbtg系统。现有的网状数据库系统大都是采用dbtg方案的。dbtg系统是典型的三级结构体系:子模式、模式、存储模式。相应的数据定义语言分别称为子模式定义语言ssddl,模式定义语言sddl,设备介质控制语言dmcl。另外还有数据操纵语言dml。 演绎数据库 是指具有演绎推理能力的数据库。一般地,它用一个数据库管理系统和一个规则管理系统来实现。将推理用的事实数据存放在数据库中,称为外延数据库;用逻辑规则定义要导出的事实,称为内涵数据库。主要研究内容为,如何有效地计 算逻辑规则推理。具体为:递归查询的优化、规则的一致性维护

5,ArcGIS几种数据格式

原发布者:mhwgo_008ArcGIS中几种数据格式的意义ArcInfo常用以下格式的数据:shp、Coverage、、RasterCAD和Geodatabase。各种数据的组织形式不一样,其中shp、Coverage、Raster、CAD为文件类型,Geodatabase为空间数据库。Workstaion常用Coverage数据格式。现在ESRI公司推荐使用Geodatabase,一个真正实现对象存储的空间数据库,Geodatabase分为PersonalGeodatabase和企业Geodatabase,前者使用Access数据库,后者支持MSSQLServer、DB2、InforMix、Oracle等企业数据库系统,企业Geodatabase必须使用ESRI公司的SDE访问。Shapefile:一种基于文件方式存储GIS数据的文件格式。至少由shp、dbf、shx三个文件作成,分别存储空间,属性和前两者的关系,是GIS中比较通用的一种数据格式。此外,还有prj、shp.xml、sbn和sbx四种文件:prj存储了坐标系统,shp.xml是对shapefile进行元数据浏览后生成的xml元数据文件,sbn和sbx存储的是shapefile的空间索引,它能加速空间数据的读取,这两个文件是在对数据进行操作、浏览或连接后才产生的,也可以通ArcToolbox>DataManagementTools>Indexes>AddspatialIndex工具生成。注意:每个文件的大小有2GB的限制。Coverage:一种拓扑数据结构,一般的GIS原理书中都有它的原理论述。数据结构复杂,属性缺省存储在Info表中。目前ArcGIS中仍然有一些分析操作只能基于这种数据格式进行操作。Geodatabase:ArcInfo发展到ArcGIS时候推出的一种数据格式,一种基于RDBMS存储的数据格式,其有两
各种数据的组织形式不一样,其中shp、Coverage、Raster、CAD为文件类型,Geodatabase为空间数据库。Workstaion常用Coverage数据格式。现在ESRI公司推荐使用Geodatabase,一个真正实现对象存储的空间数据库,Geodatabase分为PersonalGeodatabase和企业Geodatabase,前者使用Access数据库,后者支持MSSQLServer、DB2、InforMix、Oracle等企业数据库系统,企业Geodatabase必须使用ESRI公司的SDE访问。Shapefile:一种基于文件方式存储GIS数据的文件格式。至少由shp、dbf、shx三个文件作成,分别存储空间,属性和前两者的关系,是GIS中比较通用的一种数据格式。此外,还有prj、shp.xml、sbn和sbx四种文件:prj存储了坐标系统,shp.xml是对shapefile进行元数据浏览后生成的xml元数据文件,sbn和sbx存储的是shapefile的空间索引,它能加速空间数据的读取,这两个文件是在对数据进行操作、浏览或连接后才产生的,也可以通ArcToolboxDataManagementToolsIndexesAddspatialIndex工具生成。注意:每个文件的大小有2GB的限制。Coverage:一种拓扑数据结构,一般的GIS原理书中都有它的原理论述。数据结构复杂,属性缺省存储在Info表中。目前ArcGIS中仍然有一些分析操作只能基于这种数据格式进行操作。Geodatabase:ArcInfo发展到ArcGIS时候推出的一种数据格式,一种基于RDBMS存储的数据格式,其有两大类:1、PersonalGeodatabse用来存储小数据量数据,存储在Access的mdb格式中,文件不能大于4GB。2、FileGeodatabse同上,不过存储于文件中,文件大小没有限制。3、ArcSDEGeodatabse存储大型数据,存储在大型数据库中Oracle,SqlServer,DB2等,可以实现并发操作,不过需要单独的用户许可。其他:mxd为地图文档文件,mxt为地图模板文件,lyr为层文件。注意:1、我们保存的并不是地图数据,数据存储在GIS数据库中,当显示时,地图会以此数据为基础进行显示。
e00:后缀为e00的文件是esri的一种通用交换格式文件。这种文件通过明码的方式表达了arc/info中几乎所有的矢量格式以及属性信息,广泛应用于与其他软件之间进行数据交换。但是esri没有提供有关的格式说明。可以用于通过e00格式文件建立与esri系列软件之间的数据交换。coverage:一种拓扑数据结构,一般的gis原理书中都有它的原理论述。数据结构复杂,属性缺省存储在info表中。目前arcgis中仍然有一些分析操作只能基于这种数据格式进行操作。coverage 是arcinfo workstation 的原生数据格式。之所以称之为“基于文件夹的存储”,是因为在windows资源管理器下,它的空间信息和属性信息是分别存放在两个文件夹里。例如,在我的电脑e:\mytest\example 文件夹中,有 3 个coverage,它们在 windows 资源管理器下的状态所有信息都以文件夹的形式来存储。空间信息以二进制文件的形式存储在独立的文件夹中,文件夹名称即为该 coverage 名称,属性信息和拓扑数据则以 info表的形式存储。coverage将空间信息与属性信息结合起来,并存储要素间的拓扑关系。 然而,通过 arccatalog,我们能将存储空间信息的文件夹中的 coverage二进制文件与存储属性信息的 info 文件夹中的 info表联合表达为 coverage,当使用 arccatalog 对 coverage 进行创建、移动、删除或重命名等操作时,arccatalog 将自动维护他们的完整性,将 coverage和 info文件夹中的内容同步改变。所以对 coverage进行操作,一定要在 arccatalog 中进行。 coverage 是一个非常成功的早期地理数据模型,二十多年来深受用户欢迎,很多早期的数据都是 coverage 格式的。esri 不公开 coverage 的数据格式,但是提供了 coverage 格式转换的一个交换文件(interchange file,即 e00),并公开数据格式,这样就方便了 coverage 数据与其他格式的数据之间的转换。 coverage 是一个集合,它可以包含一个或多个要素类。shp:一个esri的shape文件包括一个主文件,一个索引文件,和一个dbase表。主文件是一个直接存取,变量记录长度文件,其中每个记录描述一个有它自己的vertices列表的shape。在索引文件中,每个记录包含对应主文件记录离主文件头开始的偏移,dbase表包含一feature一个记录的feature的特征。几何和属性间的一一对应关系是基于记录数目的。在dbase文件中的属性记录必须和主文件中的记录是相同顺序的。命名习惯所有文件名都符合8.3命名习惯。主文件,索引文件和dbase文件有相同的前缀。前缀必须是由字符或数字(a-z,0-9)开始,后跟0到7个字符(a-z,0-9,_,)主文件的后缀是.shp,索引文件的后缀是.shx,dbase表的后缀是.dbf。文件名中的所有字母在对文件名敏感的操作系统中都是小写的。geodatabase:geodatabase是一个存储数据集的容器,同时将空间数据和属性绑定起来。拓扑数据也能够存储在geodatabase中并对特性进行建模,比如说在表示道路交叉时可以对道路之间的相关性进行设定。在使用geodatabase时,很重要的一点就是要理解要素类(feature classes)就是就是一系列要素,它以点、线或多边形的形式呈现。在使用shapefile格式时每个文件只能存储一类要素然而geodatabase却能够在一个文件中存储多个要素或者是多种类型的要素。

文章TAG:数据库格式性质有哪些  数据格式的介绍  
下一篇