|
Chapter 3. 数据类型PostgreSQL 有着丰富的数据类型可用. 用户可以使用 CREATE TYPE 命令为 PostgreSQL 增加新的数据类型. Table 3-1 显示了所有包含在标准版本里的 普通数据类型.在 "别名" 列里列出的大多数可选名字 都是因历史原因 PostgreSQL 在内部使用的 名字.另外,还有一些内部使用的或者废弃的类型也可以用, 但没有在这里列出.
Table 3-1. 数据类型
每种数据类型都有一个由其输入和输出函数决定的外部表现形式. 许多内建的类型有明显的格式.不过,许多类型要么是 PostgreSQL 所特有的,比如开放和 闭合路径,要么是有几种不同的格式可能,比如日期和时间类型. 绝大多数与基本类型(如:整数和浮点数)对应的输入输出函数都会做错误检查. 出于改善执行性能的考虑, 有些输入和输出函数是不可逆的.也就是说,输出函数的输出结果和 原始的输入比较的时候可能丢失精度. 一些操作符和函数(如加法和乘法)并不做运行时的错误检查. 因而在一些系统上的对某些数据类型的数字操 作会导致轻微的数值溢出或下溢。 3.1. 数值类型数值类型由2 ,4或8字节的整数以及4或8字节的浮点数和固定精度小数组成。
Table 3-2. 数值类型
数值类型常量的语法在 Section 1.1.2 里描述. 数值类型对应有一套完整的数学操作符和函数.相关信息请参考 Chapter 4 。 下面的几节详细描述这些类型. 3.1.1. 整数类型类型 smallint , integer , bigint 存储各种范围的全部是数字的数,也就是没有小数部分的数字. 试图存储超出范围以外的数值将导致一个错误. 常用的类型是 integer ,因为它提供了在范围,存储空间, 和性能之间的最佳平衡.一般只有在磁盘空间紧张的时候才使用 smallint .而只有在 integer 的范围不够的时候 才使用 bigint ,因为前者绝对快得多. bigint 类型可能不是在所有平台上都运转正确, 因为它依赖编译器对八字节整数的支持.在那些没有这样支持的机器上, bigint 的作用和 integer 一样(但是仍然占据 八字节存储).不过,我们还不知道任何有这样的情况的平台. SQL 只声明了整数类型 integer (或 int )和 smallint .类型 bigint ,和类型名 int2 , int4 ,和 int8 都是扩展, 也在许多其它 RDBMS 产品中使用.
3.1.2. 任意精度数据类型 numeric 可以存储那些实际上没有大小和精度限制 的数值,同时还可以存储所有数字并且进行准确的计算.我们特别建议将它 用于货币金额和其它要求准确的数量.不过, numeric 类型和我们下一节描述的浮点数类型比较起来要慢很多. 在随后的内容里,我们使用了下述术语∶ 一个 numeric 的 比例 是 到小数点右边为止小数部分的位数, numeric 的 精度 是整个数字里 全部数据位的数目,也就是小数点两边的数据数目. 因此数字 23.5141 的精度为6而比例为4. 你可以认为整数的比例为零. numeric 类型的精度和比例都是可以配置的.要声明一个类型为 numeric 的字段,你可以用下面的语法 NUMERIC( precision , scale ) 精度必须为正数,比例可以为零或者正数. 另外, NUMERIC( precision ) 选择了 0 为比例.不带任何精度或者比例声明 NUMERIC 则创建一个可以存储一个直到实现精度上限的任意精度和比例的数值, 一个这样类型的字段将不会把输入数值转化成任何特定的比例, 而带有比例声明的 numeric 字段将把输入值转化为该比例. (SQL 标准要求缺省的比例是 0.也就是转化成整数精度. 我们觉得这样做有点没用. 如果你关心移植性,那你最好总是明确声明精度和比例.) 如果一个数值的精度或者比例比字段声明的精度或者比例高, 那么系统将尝试园整该数值.如果该数值无法做这样的园整以满足 声明的限制,那么抛出一个错误. 类型 decimal 和 numeric 是等效的. 两种类型都是 SQL 标准. 3.1.3. 浮点数类型数据类型 real 和 double precision 是不准确的,变精度的数字类型. 实际上,这些类型是 IEEE 754 二进制浮点数 (分别对应单和双精度)的一般实现,加上下层处理器,操作系统和 编译器对它的支持. 不准确意味着一些数值不能准确地转换成内部格式并且是以近似的形式 存储的,因此存储然后把数据再打印出来可能显示一些缺失. 处理这些错误以及这些错误是如何在计算中传播的属于数学和计算机 科学的一个完整的分支,我们不会在这里进一步讨论它,这里的讨论仅限 于如下几点∶
通常, real 类型的范围是至少 -1E+37 到 +1E+37, 精度至少是 6 位小数. double precision 类型通常有 -1E+308 到 +1E+308 的范围,精度是至少 15 位数字.太大或者太小的 数值都会导致错误.如果输入数据太高,那么可能发生园整.太接近 零的数字,如果无法与零值的表现形式相区分就会产生下溢错. 3.1.4. Serial(序列)类型serial 类型不是真正的类型, 只是为在表中设置唯一标识做的概念上的便利. 在目前的实现中,下面一句话: CREATE TABLE tablename ( colname SERIAL ); 等价于声明下面几句话: CREATE SEQUENCE tablename _ colname _seq; CREATE TABLE tablename ( colname integer DEFAULT nextval(' tablename _ colname _seq') UNIQUE NOT NULL ); 因此,我们就创建了一个整数字段并且把它的缺省数值安排为从一个 序列发生器取值.还应用了 UNIQUE 和 NOT NULL 约束以确保明确地插入的 数值也不会重复. 类型名 serial 和 serial4 是等效的∶ 两个都创建 integer 字段.类型名 bigserial 和 serial8 也一样,只不过它创建一个 bigint 字段.如果你预计在表的生存期中使用的标识数目 超过 2 31 个,那么你应该使用 bigserial . 在删除包含一个序列类型的表的时候, 支持 serial 类型的序列是不会被自动删除的. 因此,按照下面顺序执行的命令很可能失败∶ CREATE TABLE tablename ( colname SERIAL); DROP TABLE tablename ; CREATE TABLE tablename ( colname SERIAL); 除非明确地使用 DROP SEQUENCE 命令, 序列号不会被删掉而是一直在数据库里面。 (这个不便可能在将来的版本中修改.) |