2023年6月21日发(作者:)

SQL数据库简介

SQL全称是“结构化查询语言(Structured Query Language)”

SQL(Structured Query Language)是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。

SQL同时也是数据库脚本文件的扩展名。

SQL是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统可以使用相同的SQL语言作为数据输入与管理的接口。它以记录集合作为操作对象,所有SQL语句接受集合作为输入,返回集合作为输出,这种集合特性允许一条SQL语句的输出作为另一条SQL语句的输入,所以SQL语句可以嵌套,这使他具有极大的灵活性和强大的功能,在多数情况下,在其他语言中需要一大段程序实现的功能只需要一个SQL语句就可以达到目的,这也意味着用SQL语言可以写出非常复杂的语句。

结构化查询语言(Structured Query Language)最早是IBM的圣约瑟研究实验室为其关系数据库管理系统SYSTEM R开发的一种查询语言,它的前身是SQUARE语言。SQL语言结构简洁,功能强大,简单易学,所以自从IBM公司1981年推出以来,SQL语言得到了广泛的应用。如今无论是像Oracle、Sybase、Informix、SQL

Server这些大型的数据库管理系统,还是像Visual Foxporo、PowerBuilder这些PC上常用的数据库开发系统,都支持SQL语言作为查询语言。

美国国家标准局(ANSI)与国际标准化组织(ISO)已经制定了SQL标准。ANSI是一个美国工业和商业集团组织,负责开发美国的商务和通讯标准。ANSI同时也是ISO和International Electrotechnical Commission(IEC)的成员之一。ANSI 发布与国际标准组织相应的美国标准。1992年,ISO和IEC发布了SQL国际标准,称为SQL-92。ANSI随之发布的相应标准是ANSI SQL-92。ANSI SQL-92有时被称为ANSI SQL。尽管不同的关系数据库使用的SQL版本有一些差异,但大多数都遵循 ANSI SQL 标准。SQL Server使用ANSI SQL-92的扩展集,称为T-SQL,其遵循ANSI制定的 SQL-92标准。

SQL语言包含4个部分:

※ 数据定义语言(DDL),例如:CREATE、DROP、ALTER等语句。

※ 数据操作语言(DML),例如:INSERT、UPDATE、DELETE语句。

※ 数据查询语言(DQL),例如:SELECT语句。

※ 数据控制语言(DCL),例如:GRANT、REVOKE、COMMIT、ROLLBACK等语句。

SQL语言包括三种主要程序设计语言类别的陈述式:数据定义语言(DDL),数据操作语言(DML)及数据控制语言(DCL)。

SQL发展历史

1970: E.J. Codd 发表了关系数据库理论(relational database theory); 1974-79: IBM 以Codd的理论为基础开发了“Sequel”,并重命名为"SQL";

1979: Oracle 发布了商业版SQL

1981-84: 出现了其他商业版本,分别来自 IBM(DB2),Data General(DG/SQL),Relational Technology(INGRES);

SQL/86:ANSI 跟 ISO的第一个标准;

SQL/89:增加了引用完整性(referential integrity);

SQL/92(aka SQL2):被数据库管理系统(DBMS)生产商广发接受;

1997+:成为动态网站(Dynamic web content)的后台支持;

SQL/99:Core level跟其他8种相应的level,包括递归查询,程序跟流程控制,基本的对象(object)支持包括oids;

SQL/2003:包含了XML相关内容,自动生成列值(column values);

2005-09-30:“Data is the next SQL is the new HTML”! Tim O'eilly提出了Web 2.0理念,称数据将是核心,SQL将成为“新的

HTML";

SQL/2006:定义了SQL与XML(包含XQuery)的关联应用;

2006:Sun公司将以SQL基础的数据库管理系统嵌入Java V6

DDL

DDL 用于定义和管理物件,例如资料库、资料表以及检视表( 第18章 将会解释何谓检视表)。DDL 陈述式通常包括每个物件的CREATE、ALTER 以及 DROP 命令。举例来说,CREATE TABLE、ALTER TABLE 以及 DROP TABLE 这些陈述式便可以用来建立新资料表、修改其属性(如新增或删除资料行)、删除资料表等,下面我们会一一介绍。

CREATE TABLE 陈述式

使用 DDL 在 MyDB 资料库建立一个名为 Customer_Data 的范例资料表,本章后面的例子我们会使用到这个资料表。如前所述,CREATE TABLE 陈述式可以用来建立资料表。这个范例资料表被定义成四个资料行,如下所示:

Use MyDB

CREATE TABLE Customer_Data

(customer_id smallint,

first_name char(20),

last_name char(20),

phone char(10))

GO

这个陈述式能产生 Customer_Data 资料表,这个资料表会一直是空的直到资料被填入资料表内。

ALTER TABLE 陈述式 ALTER TABLE 陈述式用来变更资料表的定义与属性。在下面的例子中,我们利用 ALTER TABLE 在已经存在的 Customer_Data 资料表中新增 middle_initial 资料行。

ALTER TABLE Customer_Data

ADD middle_initial char(1)

GO

DROP TABLE 陈述式

DROP TABLE 陈述式用来删除资料表定义以及所有的资料、索引、触发程序、条件约束以及资料表的权限。要删除我们的 Customer_Data 资料表,可利用下列命令:

DROP TABLE Customer_Data

GO

DML

DML 利用 INSERT、SELECT、UPDATE 及 DELETE 等陈述式来操作资料库物件所包含的资料。

INSERT 陈述式

INSERT 陈述式用来在资料表或检视表中插入一列资料。例如,如果要在Customer_Data 资料表中新增一个客户,可使用类似以下的 INSERT 陈述式:

INSERT INTO Customer_Data

(customer_id, first_name, last_name, phone)

VALUES (777, 'Frankie', 'Stein', '4895873900')

请注意 SQL 陈述式中第二行的资料行名称清单,清单上资料行名称的次序决定了资料数值将被放在哪个资料行。举例来说,第一个资料数值将被放在清单列出的第一个资料行 customer_id、第二个资料数值放在第二个资料行,依此类推。由于我们在建立资料表时,定义资料资料行填入数值的次序与现在相同,因此我们不必特意指定栏位名称。我们可以用以下的 INSERT 陈述式代替:

INSERT INTO Customer_Data

VALUES (777, 'Frankie', 'Stein', '4895873900')

注意

如果使用这种形式的 INSERT 陈述式,但被插入的数值次序上与建立资料表时不同,数值将被放入错误的资料行。如果资料的型别与定义不符,则会收到一个错误讯息。

UPDATE 陈述式

UPDATE 陈述式用来更新或改变一列或多列中的值。例如,一位名称为 Frankie Stein 的客户想要在记录中改变他的姓氏为 Franklin,可使用以下 UPDATE 陈述式:

UPDATE Customer_Data SET first_name = "Franklin"

WHERE last_name = "Stein" and customer_id= 777

我们在 WHERE 子句中加入 customer_id 的项目来确定其他名称为 Stein 的客户不会被影响-只有customer_id为777的客户,姓氏会有所改变。

--------------------------------------------------------------------------------

说明

当您使用 UPDATE 陈述式时,要确定在 WHERE 子句提供充分的筛选条件,如此才不会不经意地改变了一些不该改变的资料。

--------------------------------------------------------------------------------

DELETE 陈述式

DELETE 陈述式用来删除资料表中一列或多列的资料,您也可以删除资料表中的所有资料列。要从 Customer_Data 资料表中删除所有的列,您可以利用下列陈述式:

DELETE FROM Customer_Data

DELETE Customer_Data

资料表名称前的 FROM 关键字在 DELETE 陈述式中是选择性的。除此之外,这两个陈述式完全相同。

要从 Customer_Data 资料表中删除 customer_id 资料行的值小於100的列,可利用下列陈述式:

DELETE FROM Customer_Data

WHERE customer_id < 100

现在我们已经快速浏览了 SQL 提供的 DDL 与 DML 陈述式,接著,下面将介绍 T-SQL。

DCL

DCL是用来管理数据库的语言。包含管理权限及数据更改。

--------------------------------------------------------------------------------

SELECT 陈述式

SELECT 陈述式用来检索资料表中的资料,而哪些资料被检索由列出的资料行与陈述式中的 WHERE 子句决定。例如,要从之前建立的 Customer_Data 资料表中检索 customer_id 以及 first_name 资料行的资料,并且只想取出每列中 first_name 资料行值为 Frankie 的资料,那麼可以利用以下的 SELECT 陈述式:

SELECT customer_id, first_name FROM Customer_Data

WHERE first_name = "Frankie"

如果有一列符合 SELECT 陈述式中的标准,则结果将显示如下:

customer_id first_name

------------- ------------ 777 Frankie

SQL中的五种数据类型

简要描述一下SQL中的五种数据类型:字符型,文本型,数值型,逻辑型和日期型

字符型

VARCHAR VS CHAR

VARCHAR型和CHAR型数据的这个差别是细微的,但是非常重要。他们都是用来储存字符串长度小于255的字符。

假如你向一个长度为四十个字符的VARCHAR型字段中输入数据BIll GAtES。当你以后从这个字段中取出此数据时,你取出的数据其长度为十个字符——字符串Bill Gates的长度。 现在假如你把字符串输入一个长度为四十个字符的CHAR型字段中,那么当你取出数据时,所取出的数据长度将是四十个字符。字符串的后面会被附加多余的空格。

当你建立自己的站点时,你会发现使用VARCHAR型字段要比CHAR型字段方便的多。使用VARCHAR型字段时,你不需要为剪掉你数据中多余的空格而操心。

VARCHAR型字段的另一个突出的好处是它可以比CHAR型字段占用更少的内存和硬盘空间。当你的数据库很大时,这种内存和磁盘空间的节省会变得非常重要

文本型

TEXT

使用文本型数据,你可以存放超过二十亿个字符的字符串。当你需要存储大串的字符时,应该使用文本型数据。

注意文本型数据没有长度,而上一节中所讲的字符型数据是有长度的。一个文本型字段中的数据通常要么为空,要么很大。

当你从HTML fORM的多行文本编辑框(TEXTAREA)中收集数据时,你应该把收集的信息存储于文本型字段中。但是,无论何时,只要你能避免使用文本型字段,你就应该不适用它。文本型字段既大且慢,滥用文本型字段会使服务器速度变慢。文本型字段还会吃掉大量的磁盘空间。

一旦你向文本型字段中输入了任何数据(甚至是空值),就会有2K的空间被自动分配给该数据。除非删除该记录,否则你无法收回这部分存储空间。

数值型

SQL支持许多种不同的数值型数据。你可以存储整数 INT 、小数 NUMERIC、和钱数 MONEY。

INT VS SMALLINT VS TINYINT

他们的区别只是字符长度:

INT型数据的表数范围是从-2,147,483,647到2,147,483,647的整数

SMALLINT 型数据可以存储从-32768到32768的整数 TINYINT 型的字段只能存储从0到255的整数,不能用来储存负数

通常,为了节省空间,应该尽可能的使用最小的整型数据。一个TINYINT型数据只占用一个字节;一个INT型数据占用四个字节。这看起来似乎差别不大,但是在比较大的表中,字节数的增长是很快的。另一方面,一旦你已经创建了一个字段,要修改它是很困难的。因此,为安全起见,你应该预测以下,一个字段所需要存储的数值最大有可能是多大,然后选择适当的数据类型。

NUMERIC

为了能对字段所存放的数据有更多的控制,你可以使用NUMERIC型数据来同时表示一个数的整数部分和小数部分。NUMERIC型数据使你能表示非常大的数——比INT型数据要大得多。一个NUMERIC型字段可以存储从-1038到1038范围内的数。NUMERIC型数据还使你能表示有小数部分的数。例如,你可以在NUMERIC型字段中存储小数3.14。

当定义一个NUMERIC型字段时,你需要同时指定整数部分的大小和小数部分的大小。如:MUNERIC(23,0)

一个 NUMERIC型数据的整数部分最大只能有28位,小数部分的位数必须小于或等于整数部分的位数,小数部分可以是零。

MONEY VS SMALLMONEY

你可以使用 INT型或NUMERIC型数据来存储钱数。但是,专门有另外两种数据类型用于此目的。如果你希望你的网点能挣很多钱,你可以使用MONEY型数据。如果你的野心不大,你可以使用SMALLMONEY型数据。MONEY型数据可以存储从-922,337,203,685,477.5808到922,337,203,685,477.5807的钱数。如果你需要存储比这还大的金额,你可以使用NUMERIC型数据。

SMALLMONEY型数据只能存储从-214,748.3648到214,748.3647 的钱数。同样,如果可以的话,你应该用SMALLMONEY型来代替MONEY型数据,以节省空间。

逻辑型

BIT

如果你使用复选框( CHECKBOX)从网页中搜集信息,你可以把此信息存储在BIT型字段中。BIT型字段只能取两个值:0或1。

当心,在你创建好一个表之后,你不能向表中添加 BIT型字段。如果你打算在一个表中包含BIT型字段,你必须在创建表时完成。

日期型

DATETIME VS SMALLDATETIME

一个 DATETIME型的字段可以存储的日期范围是从1753年1月1日第一毫秒到9999年12月31日最后一毫秒。

如果你不需要覆盖这么大范围的日期和时间,你可以使用SMALLDATETIME型数据。它与DATETIME型数据同样使用,只不过它能表示的日期和时间范围比DATETIME型数据小,而且不如DATETIME型数据精确。一个SMALLDATETIME型的字段能够存储从1900年1月1日到2079年6月6日的日期,它只能精确到秒。

DATETIME型字段在你输入日期和时间之前并不包含实际的数据,认识这一点是重要的。

安全问题

由于 SQL 指令在部份进阶使用时,语法会依照特定条件来变换,而且若是表格中的字段过多时,许多开发人员都会习惯以字串组立的方式建立 SQL 指令,而且又使用系统管理员级的帐户连到数据库,因此让黑客有机会利用 SQL 的组立方式进行攻击,像是在指令中添加部份刺探性或破坏性的指令 (例如 DROP TABLE、DROP

DATABASE 或是 DELETE * FROM myTable 等具破坏性的指令),让数据库的资料或实体服务器被破坏,导致服务中断或是系统瘫痪等后果,此种攻击手法称为SQL Injection。目前实务上较有效的防御方法,就是全面改用参数化查询,或是检查输入资料,过滤掉可能的危险指令或资料来防范。

SQL查询语句精华使用简要

简单的Transact-SQL查询只包括选择列表、FROM子句和WHERE子句。它们分别说明所查询列、查询的表或视图、以及搜索条件等。

例如,下面的语句查询testtable表中姓名为“张三”的nickname字段和email字段。

SELECT nickname,email

FROM testtable

WHERE name='张三'

(一) 选择列表

选择列表(select_list)指出所查询列,它可以是一组列名列表、星号、表达式、变量(包括局部变量和全局变量)等构成。

1、选择所有列

例如,下面语句显示testtable表中所有列的数据:

SELECT *

FROM testtable

2、选择部分列并指定它们的显示次序

查询结果集合中数据的排列顺序与选择列表中所指定的列名排列顺序相同。

例如:

SELECT nickname,email

FROM testtable

3、更改列标题

在选择列表中,可重新指定列标题。定义格式为:

列标题=列名

列名 列标题 如果指定的列标题不是标准的标识符格式时,应使用引号定界符,例如,下列语句使用汉字显示列标题:

SELECT 昵称=nickname,电子邮件=email

FROM testtable

4、删除重复行

SELECT语句中使用ALL或DISTINCT选项来显示表中符合条件的所有行或删除其中重复的数据行,默认为ALL。使用DISTINCT选项时,对于所有重复的数据行在SELECT返回的结果集合中只保留一行。

5、限制返回的行数

使用TOP n [PERCENT]选项限制返回的数据行数,TOP n说明返回n行,而TOP n PERCENT时,说明n是表示一百分数,指定返回的行数等于总行数的百分之几。

例如:

SELECT TOP 2 *

FROM testtable

SELECT TOP 20 PERCENT *

FROM testtable

(二) FROM子句

FROM子句指定SELECT语句查询及与查询相关的表或视图。在FROM子句中最多可指定256个表或视图,它们之间用逗号分隔。

在FROM子句同时指定多个表或视图时,如果选择列表中存在同名列,这时应使用对象名限定这些列所属的表或视图。例如在usertable和citytable表中同时存在cityid列,在查询两个表中的cityid时应使用下面语句格式加以限定:

FROM usertable,citytable

在FROM子句中可用以下两种格式为表或视图指定别名:

表名 as 别名

表名 别名

例如上面语句可用表的别名格式表示为:

FROM usertable a,citytable b

SELECT不仅能从表或视图中检索数据,它还能够从其它查询语句所返回的结果集合中查询数据。

例如:

FROM authors a,titleauthor ta (SELECT title_id,title

FROM titles

WHERE ytd_sales>10000

) AS t

此例中,将SELECT返回的结果集合给予一别名t,然后再从中检索数据。

(三) 使用WHERE子句设置查询条件

WHERE子句设置查询条件,过滤掉不需要的数据行。例如下面语句查询年龄大于20的数据:

SELECT *

FROM usertable

WHERE age>20

WHERE子句可包括各种条件运算符:

比较运算符(大小比较):>、>=、=、<、<=、<>、!>、!<

范围运算符(表达式值是否在指定的范围):BETWEEN…AND…

NOT BETWEEN…AND…

列表运算符(判断表达式是否为列表中的指定项):IN (项1,项2……)

NOT IN (项1,项2……)

模式匹配符(判断值是否与指定的字符通配格式相符):LIKE、NOT LIKE

空值判断符(判断表达式是否为空):IS NULL、NOT IS NULL

逻辑运算符(用于多条件的逻辑连接):NOT、AND、OR

1、范围运算符例:age BETWEEN 10 AND 30相当于age>=10 AND age<=30

2、列表运算符例:country IN ('Germany','China')

3、模式匹配符例:常用于模糊查找,它判断列值是否与指定的字符串格式相匹配。可用于char、varchar、text、ntext、datetime和smalldatetime等类型查询。

可使用以下通配字符:

百分号%:可匹配任意类型和长度的字符,如果是中文,请使用两个百分号即%%。

下划线_:匹配单个任意字符,它常用来限制表达式的字符长度。

方括号[]:指定一个字符、字符串或范围,要求所匹配对象为它们中的任一个。[^]:其取值也[] 相同,但它要求所匹配对象为指定字符以外的任一个字符。

例如:

限制以Publishing结尾,使用LIKE '%Publishing'

限制以A开头:LIKE '[A]%'

限制以A开头外:LIKE '[^A]%'

4、空值判断符例WHERE age IS NULL

5、逻辑运算符:优先级为NOT、AND、OR (四)查询结果排序

使用ORDER BY子句对查询返回的结果按一列或多列排序。ORDER BY子句的语法格式为:

ORDER BY {column_name [ASC|DESC]} [,…n]

其中ASC表示升序,为默认值,DESC为降序。ORDER BY不能按ntext、text和image数据类型进行排序。

例如:

SELECT *

FROM usertable

ORDER BY age desc,userid ASC

另外,可以根据表达式进行排序。

二、 联合查询

UNION运算符可以将两个或两个以上上SELECT语句的查询结果集合合并成一个结果集合显示,即执行联合查询。UNION的语法格式为:

select_statement

UNION [ALL] selectstatement

[UNION [ALL] selectstatement][…n]

其中selectstatement为待联合的SELECT查询语句。

ALL选项表示将所有行合并到结果集合中。不指定该项时,被联合查询结果集合中的重复行将只保留一行。

联合查询时,查询结果的列标题为第一个查询语句的列标题。因此,要定义列标题必须在第一个查询语句中定义。要对联合查询结果排序时,也必须使用第一查询语句中的列名、列标题或者列序号。

在使用UNION 运算符时,应保证每个联合查询语句的选择列表中有相同数量的表达式,并且每个查询选择表达式应具有相同的数据类型,或是可以自动将它们转换为相同的数据类型。在自动转换时,对于数值类型,系统将低精度的数据类型转换为高精度的数据类型。

在包括多个查询的UNION语句中,其执行顺序是自左至右,使用括号可以改变这一执行顺序。例如:

查询1 UNION (查询2 UNION 查询3)

三、连接查询

通过连接运算符可以实现多个表查询。连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志。

在关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中。当检索数据时,通过连接操作查询出存放在多个表中的不同实体的信息。连接操作给用户带来很大的灵活性,他们可以在任何时候增加新的数据类型。为不同实体创建新的表,尔后通过连接进行查询。 连接可以在SELECT 语句的FROM子句或WHERE子句中建立,似是而非在FROM子句中指出连接时有助于将连接操作与WHERE子句中的搜索条件区分开来。所以,在Transact-SQL中推荐使用这种方法。

SQL-92标准所定义的FROM子句的连接语法格式为:

FROM join_table join_type join_table

[ON (join_condition)]

其中join_table指出参与连接操作的表名,连接可以对同一个表操作,也可以对多表操作,对同一个表操作的连接又称做自连接。

join_type 指出连接类型,可分为三种:内连接、外连接和交叉连接。内连接(INNER JOIN)使用比较运算符进行表间某(些)列数据的比较操作,并列出这些表中与连接条件相匹配的数据行。根据所使用的比较方式不同,内连接又分为等值连接、自然连接和不等连接三种。外连接分为左外连接(LEFT OUTER JOIN或LEFT JOIN)、右外连接(RIGHT OUTER JOIN或RIGHT JOIN)和全外连接(FULL OUTER JOIN或FULL JOIN)三种。与内连接不同的是,外连接不只列出与连接条件相匹配的行,而是列出左表(左外连接时)、右表(右外连接时)或两个表(全外连接时)中所有符合搜索条件的数据行。

交叉连接(CROSS JOIN)没有WHERE 子句,它返回连接表中所有数据行的笛卡尔积,其结果集合中的数据行数等于第一个表中符合查询条件的数据行数乘以第二个表中符合查询条件的数据行数。

连接操作中的ON (join_condition) 子句指出连接条件,它由被连接表中的列和比较运算符、逻辑运算符等构成。

无论哪种连接都不能对text、ntext和image数据类型列进行直接连接,但可以对这三种列进行间接连接。例如:

FROM pub_info AS p1 INNER JOIN pub_info AS p2

ON DATALENGTH(_info)=DATALENGTH(_info)

(一)内连接

内连接查询操作列出与连接条件匹配的数据行,它使用比较运算符比较被连接列的列值。内连接分三种:

1、等值连接:在连接条件中使用等于号(=)运算符比较被连接列的列值,其查询结果中列出被连接表中的所有列,包括其中的重复列。

2、不等连接: 在连接条件使用除等于运算符以外的其它比较运算符比较被连接的列的列值。这些运算符包括>、>=、<=、<、!>、!<和<>。

3、自然连接:在连接条件中使用等于(=)运算符比较被连接列的列值,但它使用选择列表指出查询结果集合中所包括的列,并删除连接表中的重复列。

例,下面使用等值连接列出authors和publishers表中位于同一城市的作者和出版社:

SELECT * FROM authors AS a INNER JOIN publishers AS p

又如使用自然连接,在选择列表中删除authors 和publishers 表中重复列(city和state):

FROM authors AS a INNER JOIN publishers AS p

(二)外连接

内连接时,返回查询结果集合中的仅是符合查询条件( WHERE 搜索条件或 HAVING 条件)和连接条件的行。而采用外连接时,它返回到查询结果集合中的不仅包含符合连接条件的行,而且还包括左表(左外连接时)、右表(右外连接时)或两个边接表(全外连接)中的所有数据行。如下面使用左外连接将论坛内容和作者信息连接起来:

SELECT a.*,b.* FROM luntan LEFT JOIN usertable as b

下面使用全外连接将city表中的所有作者以及user表中的所有作者,以及他们所在的城市:

SELECT a.*,b.*

FROM city as a FULL OUTER JOIN user as b

(三)交叉连接

交叉连接不带WHERE 子句,它返回被连接的两个表所有数据行的笛卡尔积,返回到结果集合中的数据行数等于第一个表中符合查询条件的数据行数乘以第二个表中符合查询条件的数据行数。例,titles表中有6类图书,而publishers表中有8家出版社,则下列交叉连接检索到的记录数将等于6*8=48行。

SELECT type,pub_name

FROM titles CROSS JOIN publishers

ORDER BY type

[Post=0][/Post]

优化SQL十个重要步骤

1.确保TIMED_STATISTICS在实例级设置为TRUE。

2.确保MAX_DUMP_FILE_SIZE设置为足够大的值。

3.确定指向USER_DUMP_DEST的位置,并确保有足够大的值。

4.为正在被讨论的会话开启SQL_TRACE。

5.运行应用程序。

6.确定跟踪文件的位置。

7.在步骤6所确定的跟踪文件上运行tkprof以产生跟踪输出文件。

8.研究跟踪输出文件。

9.优化最昂贵的SQL语句。 10.反复运行步骤4到步骤9,直到所需的性能目标达到为止。

SQL Server 2008 的10个新特性

空间数据类型和函数

最终,一些地理信息系统(Geographic Information System,GIS)功能被合并到了SQL Server中。随着SQL Server 2008的推出有两个空间数据类型和一些空间函数。这两个新的数据类型是geometry和geography。geometry数据类型是一个平面数据类型,它表示了欧几里德的坐标系统,或更加通俗地称为平面地球模型。geography数据类型表示椭圆体的数据和表示了椭圆地球模型。有了这些新的数据类型,你可以识别地球上一个指定的点,或其它地理名词比如道路、湖泊、城市、乡村等等。

有了对geometry和geography数据类型的支持,Microsoft提供了一些不同的Open Geospatial Consortium(OGC)方法类型。这些方法使得你可以定义点、线、多边形、距离、交点等等。这些GIS改进使得你可以轻松地合并匹配的函数到你的应用程序中去。

资源监控器

当你在你的SQL Server机器上运行许多不同种类的处理器时,你需要一个可以控制资源竞争处理器的方法,以便它们不会消耗你机器的所有资源。资源监控器是一个控制这些大量消耗资源的处理器的方法。有了资源监控器,你就可以限制那些确认使用了过多资源的会话使用CPU和内存资源。资源监控器使用分类函数来确认某个特定会话应该使用哪个工作负载。会话的分类按顺序将它们与资源池关联起来。通过限制资源池所关联的CPU和内存的数量,你就可以控制所分类的会话可以消耗的资源数量。通过使用SQL Server 2008中推出的资源监控器,数据库管理员可以更好地控制资源使用,从而使得所有会话达到一个均衡使用的状态。资源监控器只在SQL Server 2008的Enterprise和Developer版本中可用。

基于策略的管理

有了基于策略的管理,你就可以通过一组规则——即策略——来管理你的实例。你可以编写策略来控制事情,比如命名标准、服务器配置、导入/导出要求等等。通过在你所有的SQL Server实例中使用一组标准的策略,你就可以始终管理你的服务器并使得你的管理成本最小化从而加强这些策略。

一个策略包含一个条件,这个条件是对与某一分面所关联的适当目标SQL Server组件进行检查而定义的。分面是一个包含属性的单独SQL Server组件。这是一些可用的分面列表:Credential、 Data File、Database、Index、 Login, Name、Schema、Server、Table、User和View。条件是一个逻辑表达式,它验证这个分面的属性是否满足你的策略要求。通过使用策略中定义的条件,你就可以控制对于一个给定分面来说什么是合适的,什么是不合适的。

SQL Server 2008的所有版本中都提供了策略管理。

表压缩

为了帮助节省表和它的索引所消耗的磁盘空间,在SQL Server 2008中推出了表压缩。这个特性只在SQL Server 2008的Enterprise和Developer版本中可用。

表压缩有两种不同的压缩类型可用:Row和 Page。Row压缩是压缩固定字段来节省记录中的额外空间。Page压缩比记录压缩更进一步。它首先进行记录压缩,然后执行前缀压缩和字典压缩。Prefix Compression(前缀压缩)是将重复发生的字段前缀值存储在页面头中存储的Compression Information(CI)结构中的过程,然后使用一个指向存储在这个CI结构中值的索引来替代实际值。Dictionary Compression(字典压缩)是将页面中重复发生的值用存储在CI结构中值的索引来替代的过程。

因为Table 压缩是在数据库引擎中完成的,所以它对于应用程序来说是完全透明的。从对压缩的测试结果来看,使用Table压缩可以节省40-60%的空间。你的压缩节省多少可能很大程度上取决于你使用的数据类型和存储在你数据库表中的数据。

有了表压缩就有可能改进你的一些进程的消耗时间。性能的提升是因为读取数据所需要的I/O少了。记住,压缩和解压所造成的额外成本也是与Table压缩相关的成本。因此,要改进你的TSQL语句所消耗的时间,与执行更少I/O相关的成本节省需要比执行表压缩引起的更多CPU成本要大。

备份压缩

SQL Server 2008 Enterprise 和Developer 版本中新推出了数据库备份压缩。有了备份压缩,数据库备份在写备份文件时被压缩。如果磁盘设备是你的备份所在,那么通过使用压缩的备份,你就可以节省昂贵的磁盘空间。压缩备份将帮助将备份所需的空间数量降低到最小。如果你没有很多空间的磁盘空间,那么这能帮助你。

因为更少的I/O需要将压缩的数据库备份写到一个文件里,你可能会看到你的备份进程运行得更快了。记住,压缩备份是一个消耗CPU的进程。所以如果你在运行压缩备份语句,而同时其它消耗CPU的进程也在运行,如果你机器的CPU能力达到最大,那么这个备份和这些进程都将被影响。

数据采集/管理数据仓库

有一个新的统计采集和报告机制叫做数据采集。通过使用数据采集,数据库管理员可以很轻松地采集、存储和管理关于他们的SQL Server实例的统计。这些统计存储在一个大家熟知的管理数据仓库的数据库中。数据采集机制不只能采集数据,而且它还能清除旧的数据。当你定义数据采集时,你指定你想保留这个数据多久。使用这个保持时间SQL Server有一个内置的进程来自动地从管理数据仓库中清除你的数据采集数据。

在产品中,Microsoft 提供了三个不同的系统数据采集。一个采集收集关于正在运行的查询的统计。另一个收集磁盘空间信息。最后一个数据采集收集关于系统性能的信息。你还可以定义你自己的数据采集。

还提供了一些扫描报表,这些报表是报告系统数据采集的数据收集。这些报表使得你可以查看这些系统数据采集所收集的数据所表达的趋势信息。报表特性丰富,有超链接,它使得你可以从一个上层报表向下钻研得到更详尽的报表。使用这些扫描的报表,你就可以很好地了解你的服务器中正在进行什么。

FILESTREAM

我们使用的很多数据是非结构化的数据,比如图片、Word 文档等等。这类数据通常被称作二进制大型对象(BLOB)。现在有了SQL Server 2008你就可以使用数据库引擎用FILESTREAM来管理和存储BLOB作为一个NTFS文件。有了FILESTREAM,你可以存储超过2GB空间的BLOB。默认情况下,SQL Server 2008关闭了FILESTREAM存储。你需要将它打开来利用这种存储。存储你的图片、Word文档或其它BLOB作为一个FILESTREAM对象,这使得这些对象受数据库引擎控制。这使得数据库引用可以将这些对象作为数据库备份/恢复过程的一部分来备份和恢复。而且这些对象被数据库控制也使得数据库引擎还可以控制与这些对象相关的安全。因此,除非被授予权限,不然用户没有对FILESTREAM对象访问的权限。SQL

Server 2008的所有版本都支持FILESTREAM。

新的日期和时间数据类型

最后,Microsoft 认识到应用程序不总是需要一个含有日期的时间值,或一个含有时间的日期值。SQL Server 2008中有两个新的数据类型可用,DATE和TIME。现在你可以使用这些新的数据类型来存储你需要的某一时间点的内容,一个DATE或一个TIME。还提供了一个新的日期/时间数据类型,就是众所周之的DATETIME2。DATETIME2提高了你的日期/时间值的时间部分的精确度。有了DATETIME2数据类型,你的精确度就可以达到7位数字,准确率达到千万分之一秒。DATETIME2还是一个可变长度的字段,这意味着你可以定义你想存储的时间部分的精确度的数字数目。你可以指定精确度使得你可以为你的DATETIME2字段保留磁盘空间。最后,推出了一个新的DATETIMEOFFSET数据类型。这个新的数据类型使得你可以存储含有时区的日期和时间值。这个数据类型还使得你可以定义你对DATETIMEOFFSET值所要求的时间精确度的数字数目。

透明数据加密

透明数据加密就像它的名字一样。透明数据加密是对应用程序完全透明地加密你的数据库的过程。这个加密是在块写到磁盘时完成的,然后当它们从磁盘读取时被解压。所以在缓冲池中,数据库引擎的工作还是一样,因为在缓冲池中数据是未加密的。执行透明数据加密会增加一些成本。如同这里提到的其它一些新特性一样,这个特性也是只在SQL Server 2008的Enterprise和Developer版本中提供。当你使用透明数据加密时,你的数据库数据是静态加密的。所以如果你要分离一个加密的数据库,那么它不能被移到另一个服务器上,除非加密密钥也被移到那台服务器上。数据库备份也被加密了,所以如果你还备份和恢复加密密钥,那么你只能恢复它们到其它服务器上。

变更数据捕获

SQL Server 2008现在使用一个新的特性叫做“变更数据捕获”可以跟踪你的数据库的变更。这个新变更跟踪特性只在Enterprise和Developer版本中提供。如果数据库中的一个表激活了变更数据捕获,那么通过存储变更到一个变更表中,这个表的所有变更都会被跟踪。变更表将为每一个INSERT保留一条记录,这可以用来确认所插入记录的字段值。每次执行DELETE时,变更表将为每一个DELETE保留一条记录,这将显示在DELETE之前每个字段中的值。当执行UPDATE时,对一个激活了变更数据捕获的表,变更表中将创建两条记录,一条是保存更新的字段值,一条是保存原来的值。使用变更数据捕获,你就可以跟踪过去你的表所发生的改变。这种功能对于应用程序是很有用的,比如一个数据仓库加载进程它需要确认变更以便他们可以正确地实施更新来跟踪历史变更。

2023年6月21日发(作者:)

SQL数据库简介

SQL全称是“结构化查询语言(Structured Query Language)”

SQL(Structured Query Language)是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。

SQL同时也是数据库脚本文件的扩展名。

SQL是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统可以使用相同的SQL语言作为数据输入与管理的接口。它以记录集合作为操作对象,所有SQL语句接受集合作为输入,返回集合作为输出,这种集合特性允许一条SQL语句的输出作为另一条SQL语句的输入,所以SQL语句可以嵌套,这使他具有极大的灵活性和强大的功能,在多数情况下,在其他语言中需要一大段程序实现的功能只需要一个SQL语句就可以达到目的,这也意味着用SQL语言可以写出非常复杂的语句。

结构化查询语言(Structured Query Language)最早是IBM的圣约瑟研究实验室为其关系数据库管理系统SYSTEM R开发的一种查询语言,它的前身是SQUARE语言。SQL语言结构简洁,功能强大,简单易学,所以自从IBM公司1981年推出以来,SQL语言得到了广泛的应用。如今无论是像Oracle、Sybase、Informix、SQL

Server这些大型的数据库管理系统,还是像Visual Foxporo、PowerBuilder这些PC上常用的数据库开发系统,都支持SQL语言作为查询语言。

美国国家标准局(ANSI)与国际标准化组织(ISO)已经制定了SQL标准。ANSI是一个美国工业和商业集团组织,负责开发美国的商务和通讯标准。ANSI同时也是ISO和International Electrotechnical Commission(IEC)的成员之一。ANSI 发布与国际标准组织相应的美国标准。1992年,ISO和IEC发布了SQL国际标准,称为SQL-92。ANSI随之发布的相应标准是ANSI SQL-92。ANSI SQL-92有时被称为ANSI SQL。尽管不同的关系数据库使用的SQL版本有一些差异,但大多数都遵循 ANSI SQL 标准。SQL Server使用ANSI SQL-92的扩展集,称为T-SQL,其遵循ANSI制定的 SQL-92标准。

SQL语言包含4个部分:

※ 数据定义语言(DDL),例如:CREATE、DROP、ALTER等语句。

※ 数据操作语言(DML),例如:INSERT、UPDATE、DELETE语句。

※ 数据查询语言(DQL),例如:SELECT语句。

※ 数据控制语言(DCL),例如:GRANT、REVOKE、COMMIT、ROLLBACK等语句。

SQL语言包括三种主要程序设计语言类别的陈述式:数据定义语言(DDL),数据操作语言(DML)及数据控制语言(DCL)。

SQL发展历史

1970: E.J. Codd 发表了关系数据库理论(relational database theory); 1974-79: IBM 以Codd的理论为基础开发了“Sequel”,并重命名为"SQL";

1979: Oracle 发布了商业版SQL

1981-84: 出现了其他商业版本,分别来自 IBM(DB2),Data General(DG/SQL),Relational Technology(INGRES);

SQL/86:ANSI 跟 ISO的第一个标准;

SQL/89:增加了引用完整性(referential integrity);

SQL/92(aka SQL2):被数据库管理系统(DBMS)生产商广发接受;

1997+:成为动态网站(Dynamic web content)的后台支持;

SQL/99:Core level跟其他8种相应的level,包括递归查询,程序跟流程控制,基本的对象(object)支持包括oids;

SQL/2003:包含了XML相关内容,自动生成列值(column values);

2005-09-30:“Data is the next SQL is the new HTML”! Tim O'eilly提出了Web 2.0理念,称数据将是核心,SQL将成为“新的

HTML";

SQL/2006:定义了SQL与XML(包含XQuery)的关联应用;

2006:Sun公司将以SQL基础的数据库管理系统嵌入Java V6

DDL

DDL 用于定义和管理物件,例如资料库、资料表以及检视表( 第18章 将会解释何谓检视表)。DDL 陈述式通常包括每个物件的CREATE、ALTER 以及 DROP 命令。举例来说,CREATE TABLE、ALTER TABLE 以及 DROP TABLE 这些陈述式便可以用来建立新资料表、修改其属性(如新增或删除资料行)、删除资料表等,下面我们会一一介绍。

CREATE TABLE 陈述式

使用 DDL 在 MyDB 资料库建立一个名为 Customer_Data 的范例资料表,本章后面的例子我们会使用到这个资料表。如前所述,CREATE TABLE 陈述式可以用来建立资料表。这个范例资料表被定义成四个资料行,如下所示:

Use MyDB

CREATE TABLE Customer_Data

(customer_id smallint,

first_name char(20),

last_name char(20),

phone char(10))

GO

这个陈述式能产生 Customer_Data 资料表,这个资料表会一直是空的直到资料被填入资料表内。

ALTER TABLE 陈述式 ALTER TABLE 陈述式用来变更资料表的定义与属性。在下面的例子中,我们利用 ALTER TABLE 在已经存在的 Customer_Data 资料表中新增 middle_initial 资料行。

ALTER TABLE Customer_Data

ADD middle_initial char(1)

GO

DROP TABLE 陈述式

DROP TABLE 陈述式用来删除资料表定义以及所有的资料、索引、触发程序、条件约束以及资料表的权限。要删除我们的 Customer_Data 资料表,可利用下列命令:

DROP TABLE Customer_Data

GO

DML

DML 利用 INSERT、SELECT、UPDATE 及 DELETE 等陈述式来操作资料库物件所包含的资料。

INSERT 陈述式

INSERT 陈述式用来在资料表或检视表中插入一列资料。例如,如果要在Customer_Data 资料表中新增一个客户,可使用类似以下的 INSERT 陈述式:

INSERT INTO Customer_Data

(customer_id, first_name, last_name, phone)

VALUES (777, 'Frankie', 'Stein', '4895873900')

请注意 SQL 陈述式中第二行的资料行名称清单,清单上资料行名称的次序决定了资料数值将被放在哪个资料行。举例来说,第一个资料数值将被放在清单列出的第一个资料行 customer_id、第二个资料数值放在第二个资料行,依此类推。由于我们在建立资料表时,定义资料资料行填入数值的次序与现在相同,因此我们不必特意指定栏位名称。我们可以用以下的 INSERT 陈述式代替:

INSERT INTO Customer_Data

VALUES (777, 'Frankie', 'Stein', '4895873900')

注意

如果使用这种形式的 INSERT 陈述式,但被插入的数值次序上与建立资料表时不同,数值将被放入错误的资料行。如果资料的型别与定义不符,则会收到一个错误讯息。

UPDATE 陈述式

UPDATE 陈述式用来更新或改变一列或多列中的值。例如,一位名称为 Frankie Stein 的客户想要在记录中改变他的姓氏为 Franklin,可使用以下 UPDATE 陈述式:

UPDATE Customer_Data SET first_name = "Franklin"

WHERE last_name = "Stein" and customer_id= 777

我们在 WHERE 子句中加入 customer_id 的项目来确定其他名称为 Stein 的客户不会被影响-只有customer_id为777的客户,姓氏会有所改变。

--------------------------------------------------------------------------------

说明

当您使用 UPDATE 陈述式时,要确定在 WHERE 子句提供充分的筛选条件,如此才不会不经意地改变了一些不该改变的资料。

--------------------------------------------------------------------------------

DELETE 陈述式

DELETE 陈述式用来删除资料表中一列或多列的资料,您也可以删除资料表中的所有资料列。要从 Customer_Data 资料表中删除所有的列,您可以利用下列陈述式:

DELETE FROM Customer_Data

DELETE Customer_Data

资料表名称前的 FROM 关键字在 DELETE 陈述式中是选择性的。除此之外,这两个陈述式完全相同。

要从 Customer_Data 资料表中删除 customer_id 资料行的值小於100的列,可利用下列陈述式:

DELETE FROM Customer_Data

WHERE customer_id < 100

现在我们已经快速浏览了 SQL 提供的 DDL 与 DML 陈述式,接著,下面将介绍 T-SQL。

DCL

DCL是用来管理数据库的语言。包含管理权限及数据更改。

--------------------------------------------------------------------------------

SELECT 陈述式

SELECT 陈述式用来检索资料表中的资料,而哪些资料被检索由列出的资料行与陈述式中的 WHERE 子句决定。例如,要从之前建立的 Customer_Data 资料表中检索 customer_id 以及 first_name 资料行的资料,并且只想取出每列中 first_name 资料行值为 Frankie 的资料,那麼可以利用以下的 SELECT 陈述式:

SELECT customer_id, first_name FROM Customer_Data

WHERE first_name = "Frankie"

如果有一列符合 SELECT 陈述式中的标准,则结果将显示如下:

customer_id first_name

------------- ------------ 777 Frankie

SQL中的五种数据类型

简要描述一下SQL中的五种数据类型:字符型,文本型,数值型,逻辑型和日期型

字符型

VARCHAR VS CHAR

VARCHAR型和CHAR型数据的这个差别是细微的,但是非常重要。他们都是用来储存字符串长度小于255的字符。

假如你向一个长度为四十个字符的VARCHAR型字段中输入数据BIll GAtES。当你以后从这个字段中取出此数据时,你取出的数据其长度为十个字符——字符串Bill Gates的长度。 现在假如你把字符串输入一个长度为四十个字符的CHAR型字段中,那么当你取出数据时,所取出的数据长度将是四十个字符。字符串的后面会被附加多余的空格。

当你建立自己的站点时,你会发现使用VARCHAR型字段要比CHAR型字段方便的多。使用VARCHAR型字段时,你不需要为剪掉你数据中多余的空格而操心。

VARCHAR型字段的另一个突出的好处是它可以比CHAR型字段占用更少的内存和硬盘空间。当你的数据库很大时,这种内存和磁盘空间的节省会变得非常重要

文本型

TEXT

使用文本型数据,你可以存放超过二十亿个字符的字符串。当你需要存储大串的字符时,应该使用文本型数据。

注意文本型数据没有长度,而上一节中所讲的字符型数据是有长度的。一个文本型字段中的数据通常要么为空,要么很大。

当你从HTML fORM的多行文本编辑框(TEXTAREA)中收集数据时,你应该把收集的信息存储于文本型字段中。但是,无论何时,只要你能避免使用文本型字段,你就应该不适用它。文本型字段既大且慢,滥用文本型字段会使服务器速度变慢。文本型字段还会吃掉大量的磁盘空间。

一旦你向文本型字段中输入了任何数据(甚至是空值),就会有2K的空间被自动分配给该数据。除非删除该记录,否则你无法收回这部分存储空间。

数值型

SQL支持许多种不同的数值型数据。你可以存储整数 INT 、小数 NUMERIC、和钱数 MONEY。

INT VS SMALLINT VS TINYINT

他们的区别只是字符长度:

INT型数据的表数范围是从-2,147,483,647到2,147,483,647的整数

SMALLINT 型数据可以存储从-32768到32768的整数 TINYINT 型的字段只能存储从0到255的整数,不能用来储存负数

通常,为了节省空间,应该尽可能的使用最小的整型数据。一个TINYINT型数据只占用一个字节;一个INT型数据占用四个字节。这看起来似乎差别不大,但是在比较大的表中,字节数的增长是很快的。另一方面,一旦你已经创建了一个字段,要修改它是很困难的。因此,为安全起见,你应该预测以下,一个字段所需要存储的数值最大有可能是多大,然后选择适当的数据类型。

NUMERIC

为了能对字段所存放的数据有更多的控制,你可以使用NUMERIC型数据来同时表示一个数的整数部分和小数部分。NUMERIC型数据使你能表示非常大的数——比INT型数据要大得多。一个NUMERIC型字段可以存储从-1038到1038范围内的数。NUMERIC型数据还使你能表示有小数部分的数。例如,你可以在NUMERIC型字段中存储小数3.14。

当定义一个NUMERIC型字段时,你需要同时指定整数部分的大小和小数部分的大小。如:MUNERIC(23,0)

一个 NUMERIC型数据的整数部分最大只能有28位,小数部分的位数必须小于或等于整数部分的位数,小数部分可以是零。

MONEY VS SMALLMONEY

你可以使用 INT型或NUMERIC型数据来存储钱数。但是,专门有另外两种数据类型用于此目的。如果你希望你的网点能挣很多钱,你可以使用MONEY型数据。如果你的野心不大,你可以使用SMALLMONEY型数据。MONEY型数据可以存储从-922,337,203,685,477.5808到922,337,203,685,477.5807的钱数。如果你需要存储比这还大的金额,你可以使用NUMERIC型数据。

SMALLMONEY型数据只能存储从-214,748.3648到214,748.3647 的钱数。同样,如果可以的话,你应该用SMALLMONEY型来代替MONEY型数据,以节省空间。

逻辑型

BIT

如果你使用复选框( CHECKBOX)从网页中搜集信息,你可以把此信息存储在BIT型字段中。BIT型字段只能取两个值:0或1。

当心,在你创建好一个表之后,你不能向表中添加 BIT型字段。如果你打算在一个表中包含BIT型字段,你必须在创建表时完成。

日期型

DATETIME VS SMALLDATETIME

一个 DATETIME型的字段可以存储的日期范围是从1753年1月1日第一毫秒到9999年12月31日最后一毫秒。

如果你不需要覆盖这么大范围的日期和时间,你可以使用SMALLDATETIME型数据。它与DATETIME型数据同样使用,只不过它能表示的日期和时间范围比DATETIME型数据小,而且不如DATETIME型数据精确。一个SMALLDATETIME型的字段能够存储从1900年1月1日到2079年6月6日的日期,它只能精确到秒。

DATETIME型字段在你输入日期和时间之前并不包含实际的数据,认识这一点是重要的。

安全问题

由于 SQL 指令在部份进阶使用时,语法会依照特定条件来变换,而且若是表格中的字段过多时,许多开发人员都会习惯以字串组立的方式建立 SQL 指令,而且又使用系统管理员级的帐户连到数据库,因此让黑客有机会利用 SQL 的组立方式进行攻击,像是在指令中添加部份刺探性或破坏性的指令 (例如 DROP TABLE、DROP

DATABASE 或是 DELETE * FROM myTable 等具破坏性的指令),让数据库的资料或实体服务器被破坏,导致服务中断或是系统瘫痪等后果,此种攻击手法称为SQL Injection。目前实务上较有效的防御方法,就是全面改用参数化查询,或是检查输入资料,过滤掉可能的危险指令或资料来防范。

SQL查询语句精华使用简要

简单的Transact-SQL查询只包括选择列表、FROM子句和WHERE子句。它们分别说明所查询列、查询的表或视图、以及搜索条件等。

例如,下面的语句查询testtable表中姓名为“张三”的nickname字段和email字段。

SELECT nickname,email

FROM testtable

WHERE name='张三'

(一) 选择列表

选择列表(select_list)指出所查询列,它可以是一组列名列表、星号、表达式、变量(包括局部变量和全局变量)等构成。

1、选择所有列

例如,下面语句显示testtable表中所有列的数据:

SELECT *

FROM testtable

2、选择部分列并指定它们的显示次序

查询结果集合中数据的排列顺序与选择列表中所指定的列名排列顺序相同。

例如:

SELECT nickname,email

FROM testtable

3、更改列标题

在选择列表中,可重新指定列标题。定义格式为:

列标题=列名

列名 列标题 如果指定的列标题不是标准的标识符格式时,应使用引号定界符,例如,下列语句使用汉字显示列标题:

SELECT 昵称=nickname,电子邮件=email

FROM testtable

4、删除重复行

SELECT语句中使用ALL或DISTINCT选项来显示表中符合条件的所有行或删除其中重复的数据行,默认为ALL。使用DISTINCT选项时,对于所有重复的数据行在SELECT返回的结果集合中只保留一行。

5、限制返回的行数

使用TOP n [PERCENT]选项限制返回的数据行数,TOP n说明返回n行,而TOP n PERCENT时,说明n是表示一百分数,指定返回的行数等于总行数的百分之几。

例如:

SELECT TOP 2 *

FROM testtable

SELECT TOP 20 PERCENT *

FROM testtable

(二) FROM子句

FROM子句指定SELECT语句查询及与查询相关的表或视图。在FROM子句中最多可指定256个表或视图,它们之间用逗号分隔。

在FROM子句同时指定多个表或视图时,如果选择列表中存在同名列,这时应使用对象名限定这些列所属的表或视图。例如在usertable和citytable表中同时存在cityid列,在查询两个表中的cityid时应使用下面语句格式加以限定:

FROM usertable,citytable

在FROM子句中可用以下两种格式为表或视图指定别名:

表名 as 别名

表名 别名

例如上面语句可用表的别名格式表示为:

FROM usertable a,citytable b

SELECT不仅能从表或视图中检索数据,它还能够从其它查询语句所返回的结果集合中查询数据。

例如:

FROM authors a,titleauthor ta (SELECT title_id,title

FROM titles

WHERE ytd_sales>10000

) AS t

此例中,将SELECT返回的结果集合给予一别名t,然后再从中检索数据。

(三) 使用WHERE子句设置查询条件

WHERE子句设置查询条件,过滤掉不需要的数据行。例如下面语句查询年龄大于20的数据:

SELECT *

FROM usertable

WHERE age>20

WHERE子句可包括各种条件运算符:

比较运算符(大小比较):>、>=、=、<、<=、<>、!>、!<

范围运算符(表达式值是否在指定的范围):BETWEEN…AND…

NOT BETWEEN…AND…

列表运算符(判断表达式是否为列表中的指定项):IN (项1,项2……)

NOT IN (项1,项2……)

模式匹配符(判断值是否与指定的字符通配格式相符):LIKE、NOT LIKE

空值判断符(判断表达式是否为空):IS NULL、NOT IS NULL

逻辑运算符(用于多条件的逻辑连接):NOT、AND、OR

1、范围运算符例:age BETWEEN 10 AND 30相当于age>=10 AND age<=30

2、列表运算符例:country IN ('Germany','China')

3、模式匹配符例:常用于模糊查找,它判断列值是否与指定的字符串格式相匹配。可用于char、varchar、text、ntext、datetime和smalldatetime等类型查询。

可使用以下通配字符:

百分号%:可匹配任意类型和长度的字符,如果是中文,请使用两个百分号即%%。

下划线_:匹配单个任意字符,它常用来限制表达式的字符长度。

方括号[]:指定一个字符、字符串或范围,要求所匹配对象为它们中的任一个。[^]:其取值也[] 相同,但它要求所匹配对象为指定字符以外的任一个字符。

例如:

限制以Publishing结尾,使用LIKE '%Publishing'

限制以A开头:LIKE '[A]%'

限制以A开头外:LIKE '[^A]%'

4、空值判断符例WHERE age IS NULL

5、逻辑运算符:优先级为NOT、AND、OR (四)查询结果排序

使用ORDER BY子句对查询返回的结果按一列或多列排序。ORDER BY子句的语法格式为:

ORDER BY {column_name [ASC|DESC]} [,…n]

其中ASC表示升序,为默认值,DESC为降序。ORDER BY不能按ntext、text和image数据类型进行排序。

例如:

SELECT *

FROM usertable

ORDER BY age desc,userid ASC

另外,可以根据表达式进行排序。

二、 联合查询

UNION运算符可以将两个或两个以上上SELECT语句的查询结果集合合并成一个结果集合显示,即执行联合查询。UNION的语法格式为:

select_statement

UNION [ALL] selectstatement

[UNION [ALL] selectstatement][…n]

其中selectstatement为待联合的SELECT查询语句。

ALL选项表示将所有行合并到结果集合中。不指定该项时,被联合查询结果集合中的重复行将只保留一行。

联合查询时,查询结果的列标题为第一个查询语句的列标题。因此,要定义列标题必须在第一个查询语句中定义。要对联合查询结果排序时,也必须使用第一查询语句中的列名、列标题或者列序号。

在使用UNION 运算符时,应保证每个联合查询语句的选择列表中有相同数量的表达式,并且每个查询选择表达式应具有相同的数据类型,或是可以自动将它们转换为相同的数据类型。在自动转换时,对于数值类型,系统将低精度的数据类型转换为高精度的数据类型。

在包括多个查询的UNION语句中,其执行顺序是自左至右,使用括号可以改变这一执行顺序。例如:

查询1 UNION (查询2 UNION 查询3)

三、连接查询

通过连接运算符可以实现多个表查询。连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志。

在关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中。当检索数据时,通过连接操作查询出存放在多个表中的不同实体的信息。连接操作给用户带来很大的灵活性,他们可以在任何时候增加新的数据类型。为不同实体创建新的表,尔后通过连接进行查询。 连接可以在SELECT 语句的FROM子句或WHERE子句中建立,似是而非在FROM子句中指出连接时有助于将连接操作与WHERE子句中的搜索条件区分开来。所以,在Transact-SQL中推荐使用这种方法。

SQL-92标准所定义的FROM子句的连接语法格式为:

FROM join_table join_type join_table

[ON (join_condition)]

其中join_table指出参与连接操作的表名,连接可以对同一个表操作,也可以对多表操作,对同一个表操作的连接又称做自连接。

join_type 指出连接类型,可分为三种:内连接、外连接和交叉连接。内连接(INNER JOIN)使用比较运算符进行表间某(些)列数据的比较操作,并列出这些表中与连接条件相匹配的数据行。根据所使用的比较方式不同,内连接又分为等值连接、自然连接和不等连接三种。外连接分为左外连接(LEFT OUTER JOIN或LEFT JOIN)、右外连接(RIGHT OUTER JOIN或RIGHT JOIN)和全外连接(FULL OUTER JOIN或FULL JOIN)三种。与内连接不同的是,外连接不只列出与连接条件相匹配的行,而是列出左表(左外连接时)、右表(右外连接时)或两个表(全外连接时)中所有符合搜索条件的数据行。

交叉连接(CROSS JOIN)没有WHERE 子句,它返回连接表中所有数据行的笛卡尔积,其结果集合中的数据行数等于第一个表中符合查询条件的数据行数乘以第二个表中符合查询条件的数据行数。

连接操作中的ON (join_condition) 子句指出连接条件,它由被连接表中的列和比较运算符、逻辑运算符等构成。

无论哪种连接都不能对text、ntext和image数据类型列进行直接连接,但可以对这三种列进行间接连接。例如:

FROM pub_info AS p1 INNER JOIN pub_info AS p2

ON DATALENGTH(_info)=DATALENGTH(_info)

(一)内连接

内连接查询操作列出与连接条件匹配的数据行,它使用比较运算符比较被连接列的列值。内连接分三种:

1、等值连接:在连接条件中使用等于号(=)运算符比较被连接列的列值,其查询结果中列出被连接表中的所有列,包括其中的重复列。

2、不等连接: 在连接条件使用除等于运算符以外的其它比较运算符比较被连接的列的列值。这些运算符包括>、>=、<=、<、!>、!<和<>。

3、自然连接:在连接条件中使用等于(=)运算符比较被连接列的列值,但它使用选择列表指出查询结果集合中所包括的列,并删除连接表中的重复列。

例,下面使用等值连接列出authors和publishers表中位于同一城市的作者和出版社:

SELECT * FROM authors AS a INNER JOIN publishers AS p

又如使用自然连接,在选择列表中删除authors 和publishers 表中重复列(city和state):

FROM authors AS a INNER JOIN publishers AS p

(二)外连接

内连接时,返回查询结果集合中的仅是符合查询条件( WHERE 搜索条件或 HAVING 条件)和连接条件的行。而采用外连接时,它返回到查询结果集合中的不仅包含符合连接条件的行,而且还包括左表(左外连接时)、右表(右外连接时)或两个边接表(全外连接)中的所有数据行。如下面使用左外连接将论坛内容和作者信息连接起来:

SELECT a.*,b.* FROM luntan LEFT JOIN usertable as b

下面使用全外连接将city表中的所有作者以及user表中的所有作者,以及他们所在的城市:

SELECT a.*,b.*

FROM city as a FULL OUTER JOIN user as b

(三)交叉连接

交叉连接不带WHERE 子句,它返回被连接的两个表所有数据行的笛卡尔积,返回到结果集合中的数据行数等于第一个表中符合查询条件的数据行数乘以第二个表中符合查询条件的数据行数。例,titles表中有6类图书,而publishers表中有8家出版社,则下列交叉连接检索到的记录数将等于6*8=48行。

SELECT type,pub_name

FROM titles CROSS JOIN publishers

ORDER BY type

[Post=0][/Post]

优化SQL十个重要步骤

1.确保TIMED_STATISTICS在实例级设置为TRUE。

2.确保MAX_DUMP_FILE_SIZE设置为足够大的值。

3.确定指向USER_DUMP_DEST的位置,并确保有足够大的值。

4.为正在被讨论的会话开启SQL_TRACE。

5.运行应用程序。

6.确定跟踪文件的位置。

7.在步骤6所确定的跟踪文件上运行tkprof以产生跟踪输出文件。

8.研究跟踪输出文件。

9.优化最昂贵的SQL语句。 10.反复运行步骤4到步骤9,直到所需的性能目标达到为止。

SQL Server 2008 的10个新特性

空间数据类型和函数

最终,一些地理信息系统(Geographic Information System,GIS)功能被合并到了SQL Server中。随着SQL Server 2008的推出有两个空间数据类型和一些空间函数。这两个新的数据类型是geometry和geography。geometry数据类型是一个平面数据类型,它表示了欧几里德的坐标系统,或更加通俗地称为平面地球模型。geography数据类型表示椭圆体的数据和表示了椭圆地球模型。有了这些新的数据类型,你可以识别地球上一个指定的点,或其它地理名词比如道路、湖泊、城市、乡村等等。

有了对geometry和geography数据类型的支持,Microsoft提供了一些不同的Open Geospatial Consortium(OGC)方法类型。这些方法使得你可以定义点、线、多边形、距离、交点等等。这些GIS改进使得你可以轻松地合并匹配的函数到你的应用程序中去。

资源监控器

当你在你的SQL Server机器上运行许多不同种类的处理器时,你需要一个可以控制资源竞争处理器的方法,以便它们不会消耗你机器的所有资源。资源监控器是一个控制这些大量消耗资源的处理器的方法。有了资源监控器,你就可以限制那些确认使用了过多资源的会话使用CPU和内存资源。资源监控器使用分类函数来确认某个特定会话应该使用哪个工作负载。会话的分类按顺序将它们与资源池关联起来。通过限制资源池所关联的CPU和内存的数量,你就可以控制所分类的会话可以消耗的资源数量。通过使用SQL Server 2008中推出的资源监控器,数据库管理员可以更好地控制资源使用,从而使得所有会话达到一个均衡使用的状态。资源监控器只在SQL Server 2008的Enterprise和Developer版本中可用。

基于策略的管理

有了基于策略的管理,你就可以通过一组规则——即策略——来管理你的实例。你可以编写策略来控制事情,比如命名标准、服务器配置、导入/导出要求等等。通过在你所有的SQL Server实例中使用一组标准的策略,你就可以始终管理你的服务器并使得你的管理成本最小化从而加强这些策略。

一个策略包含一个条件,这个条件是对与某一分面所关联的适当目标SQL Server组件进行检查而定义的。分面是一个包含属性的单独SQL Server组件。这是一些可用的分面列表:Credential、 Data File、Database、Index、 Login, Name、Schema、Server、Table、User和View。条件是一个逻辑表达式,它验证这个分面的属性是否满足你的策略要求。通过使用策略中定义的条件,你就可以控制对于一个给定分面来说什么是合适的,什么是不合适的。

SQL Server 2008的所有版本中都提供了策略管理。

表压缩

为了帮助节省表和它的索引所消耗的磁盘空间,在SQL Server 2008中推出了表压缩。这个特性只在SQL Server 2008的Enterprise和Developer版本中可用。

表压缩有两种不同的压缩类型可用:Row和 Page。Row压缩是压缩固定字段来节省记录中的额外空间。Page压缩比记录压缩更进一步。它首先进行记录压缩,然后执行前缀压缩和字典压缩。Prefix Compression(前缀压缩)是将重复发生的字段前缀值存储在页面头中存储的Compression Information(CI)结构中的过程,然后使用一个指向存储在这个CI结构中值的索引来替代实际值。Dictionary Compression(字典压缩)是将页面中重复发生的值用存储在CI结构中值的索引来替代的过程。

因为Table 压缩是在数据库引擎中完成的,所以它对于应用程序来说是完全透明的。从对压缩的测试结果来看,使用Table压缩可以节省40-60%的空间。你的压缩节省多少可能很大程度上取决于你使用的数据类型和存储在你数据库表中的数据。

有了表压缩就有可能改进你的一些进程的消耗时间。性能的提升是因为读取数据所需要的I/O少了。记住,压缩和解压所造成的额外成本也是与Table压缩相关的成本。因此,要改进你的TSQL语句所消耗的时间,与执行更少I/O相关的成本节省需要比执行表压缩引起的更多CPU成本要大。

备份压缩

SQL Server 2008 Enterprise 和Developer 版本中新推出了数据库备份压缩。有了备份压缩,数据库备份在写备份文件时被压缩。如果磁盘设备是你的备份所在,那么通过使用压缩的备份,你就可以节省昂贵的磁盘空间。压缩备份将帮助将备份所需的空间数量降低到最小。如果你没有很多空间的磁盘空间,那么这能帮助你。

因为更少的I/O需要将压缩的数据库备份写到一个文件里,你可能会看到你的备份进程运行得更快了。记住,压缩备份是一个消耗CPU的进程。所以如果你在运行压缩备份语句,而同时其它消耗CPU的进程也在运行,如果你机器的CPU能力达到最大,那么这个备份和这些进程都将被影响。

数据采集/管理数据仓库

有一个新的统计采集和报告机制叫做数据采集。通过使用数据采集,数据库管理员可以很轻松地采集、存储和管理关于他们的SQL Server实例的统计。这些统计存储在一个大家熟知的管理数据仓库的数据库中。数据采集机制不只能采集数据,而且它还能清除旧的数据。当你定义数据采集时,你指定你想保留这个数据多久。使用这个保持时间SQL Server有一个内置的进程来自动地从管理数据仓库中清除你的数据采集数据。

在产品中,Microsoft 提供了三个不同的系统数据采集。一个采集收集关于正在运行的查询的统计。另一个收集磁盘空间信息。最后一个数据采集收集关于系统性能的信息。你还可以定义你自己的数据采集。

还提供了一些扫描报表,这些报表是报告系统数据采集的数据收集。这些报表使得你可以查看这些系统数据采集所收集的数据所表达的趋势信息。报表特性丰富,有超链接,它使得你可以从一个上层报表向下钻研得到更详尽的报表。使用这些扫描的报表,你就可以很好地了解你的服务器中正在进行什么。

FILESTREAM

我们使用的很多数据是非结构化的数据,比如图片、Word 文档等等。这类数据通常被称作二进制大型对象(BLOB)。现在有了SQL Server 2008你就可以使用数据库引擎用FILESTREAM来管理和存储BLOB作为一个NTFS文件。有了FILESTREAM,你可以存储超过2GB空间的BLOB。默认情况下,SQL Server 2008关闭了FILESTREAM存储。你需要将它打开来利用这种存储。存储你的图片、Word文档或其它BLOB作为一个FILESTREAM对象,这使得这些对象受数据库引擎控制。这使得数据库引用可以将这些对象作为数据库备份/恢复过程的一部分来备份和恢复。而且这些对象被数据库控制也使得数据库引擎还可以控制与这些对象相关的安全。因此,除非被授予权限,不然用户没有对FILESTREAM对象访问的权限。SQL

Server 2008的所有版本都支持FILESTREAM。

新的日期和时间数据类型

最后,Microsoft 认识到应用程序不总是需要一个含有日期的时间值,或一个含有时间的日期值。SQL Server 2008中有两个新的数据类型可用,DATE和TIME。现在你可以使用这些新的数据类型来存储你需要的某一时间点的内容,一个DATE或一个TIME。还提供了一个新的日期/时间数据类型,就是众所周之的DATETIME2。DATETIME2提高了你的日期/时间值的时间部分的精确度。有了DATETIME2数据类型,你的精确度就可以达到7位数字,准确率达到千万分之一秒。DATETIME2还是一个可变长度的字段,这意味着你可以定义你想存储的时间部分的精确度的数字数目。你可以指定精确度使得你可以为你的DATETIME2字段保留磁盘空间。最后,推出了一个新的DATETIMEOFFSET数据类型。这个新的数据类型使得你可以存储含有时区的日期和时间值。这个数据类型还使得你可以定义你对DATETIMEOFFSET值所要求的时间精确度的数字数目。

透明数据加密

透明数据加密就像它的名字一样。透明数据加密是对应用程序完全透明地加密你的数据库的过程。这个加密是在块写到磁盘时完成的,然后当它们从磁盘读取时被解压。所以在缓冲池中,数据库引擎的工作还是一样,因为在缓冲池中数据是未加密的。执行透明数据加密会增加一些成本。如同这里提到的其它一些新特性一样,这个特性也是只在SQL Server 2008的Enterprise和Developer版本中提供。当你使用透明数据加密时,你的数据库数据是静态加密的。所以如果你要分离一个加密的数据库,那么它不能被移到另一个服务器上,除非加密密钥也被移到那台服务器上。数据库备份也被加密了,所以如果你还备份和恢复加密密钥,那么你只能恢复它们到其它服务器上。

变更数据捕获

SQL Server 2008现在使用一个新的特性叫做“变更数据捕获”可以跟踪你的数据库的变更。这个新变更跟踪特性只在Enterprise和Developer版本中提供。如果数据库中的一个表激活了变更数据捕获,那么通过存储变更到一个变更表中,这个表的所有变更都会被跟踪。变更表将为每一个INSERT保留一条记录,这可以用来确认所插入记录的字段值。每次执行DELETE时,变更表将为每一个DELETE保留一条记录,这将显示在DELETE之前每个字段中的值。当执行UPDATE时,对一个激活了变更数据捕获的表,变更表中将创建两条记录,一条是保存更新的字段值,一条是保存原来的值。使用变更数据捕获,你就可以跟踪过去你的表所发生的改变。这种功能对于应用程序是很有用的,比如一个数据仓库加载进程它需要确认变更以便他们可以正确地实施更新来跟踪历史变更。