Chapter 3. 数据类型

Table of Contents

3.5.1. 日期/时间输入
3.5.2. 日期/时间输出
3.5.3. 时区
3.5.4. 内部

3.6. 布尔类型

3.7. 几何类型

3.7.1. Point（点）
3.7.2. 线段
3.7.3. Box（方）
3.7.4. Path（路径）
3.7.5. Polygon（多边形）
3.7.6. Circle（圆）

3.8. 网络地址数据类型

3.8.1. inet
3.8.2. cidr
3.8.3. inet 与 cidr 对比
3.8.4. macaddr

3.9. 位串类型

PostgreSQL 有着丰富的数据类型可用．用户可以使用 CREATE TYPE 命令为 PostgreSQL 增加新的数据类型．

Table 3-1 显示了所有包含在标准版本里的普通数据类型．在 "别名" 列里列出的大多数可选名字都是因历史原因 PostgreSQL 在内部使用的名字．另外，还有一些内部使用的或者废弃的类型也可以用，但没有在这里列出．

Table 3-1. 数据类型

类型名字	别名	描述
`bigint`	`int8`	有符号 8 字节整数
`bigserial`	`serial8`	自增八字节整数
`bit`		定长位串
`bit varying( n )`	`varbit( n )`	变长位串
`boolean`	`bool`	逻辑布尔量（真/假）
`box`		二维平面中的长方形
`bytea`		二进制数据
`character( n )`	`char( n )`	定长字符串
`character varying( n )`	`varchar( n )`	变长字符串
`cidr`		IP 网络地址
`circle`		二维平面中的圆
`date`		日历日期（年，月，日）
`double precision`	`float8`	双精度浮点数字
`inet`		IP 网络或主机地址
`integer`	`int` ，`int4`	四字节长有符号整数
`interval( p )`		通用的时间间隔
`line`		二维平面中的无限长直线
`lseg`		二维平面中的线段
`macaddr`		MAC 地址
`money`		美国风格的货币类型
`numeric [ ( p , s ) ]`	`decimal [ ( p , s ) ]`	可选精度的准确数字
`oid`		对象标识符
`path`		二维平面的开放的或封闭的几何路径
`point`		二维平面中的点
`polygon`		二维平面中的封闭几何路径
`real`	`float4`	单精度浮点数
`smallint`	`int2`	有符号两字节整数
`serial`	`serial4`	自增四字节整数
`text`		变长字符串
`time [ ( p ) ] [ without time zone ]`		一天里的时间
`time [ ( p ) ] with time zone`	timetz	一天里的时间，包括时区
`timestamp [ ( p ) ] without time zone`	timestamp	日期和时间
`timestamp [ ( p ) ] [ with time zone ]`	timestamptz	日期和时间

兼容性: 下列类型（或者那样拼写的）是 SQL 声明的： bit ，bit varying ，boolean ， char ，character ，character varying ，varchar ，date ， double precision ，integer ， interval ，numeric ，decimal ， real ，smallint ，time ， timestamp （包括有时区和无时区的）．

每种数据类型都有一个由其输入和输出函数决定的外部表现形式．许多内建的类型有明显的格式．不过，许多类型要么是 PostgreSQL 所特有的，比如开放和闭合路径，要么是有几种不同的格式可能，比如日期和时间类型．绝大多数与基本类型（如：整数和浮点数）对应的输入输出函数都会做错误检查．出于改善执行性能的考虑，有些输入和输出函数是不可逆的．也就是说，输出函数的输出结果和原始的输入比较的时候可能丢失精度．

一些操作符和函数（如加法和乘法）并不做运行时的错误检查．因而在一些系统上的对某些数据类型的数字操作会导致轻微的数值溢出或下溢。

3.1. 数值类型

数值类型由2 ，4或8字节的整数以及4或8字节的浮点数和固定精度小数组成。

Table 3-2. 数值类型

数值类型	存储空间	描述	范围
`smallint`	2 字节	固定精度	-32768 到 +32767
`integer`	4 字节	常用的固定精度数	-2147483648 到 +2147483647
`bigint`	8 字节	极大范围的固定精度数字	-9223372036854775808 到 9223372036854775807
`decimal`	变长	用户声明精度，精确	无限制
`numeric`	变长	用户声明精度，精确	无限制
`real`	4 字节	变精度，不精确	6 位十进制数字精度
`double precision`	8 字节	变精度，不精度	15 位十进制数字精度
`serial`	4 字节	自增整数	1 到 +2147483647
`bigserial`	8 字节	自增整数	1 到 9223372036854775807

数值类型常量的语法在 Section 1.1.2 里描述．数值类型对应有一套完整的数学操作符和函数．相关信息请参考 Chapter 4 。下面的几节详细描述这些类型．

3.1.1. 整数类型

类型 smallint ，integer ，bigint 存储各种范围的全部是数字的数，也就是没有小数部分的数字．试图存储超出范围以外的数值将导致一个错误．

常用的类型是 integer ，因为它提供了在范围，存储空间，和性能之间的最佳平衡．一般只有在磁盘空间紧张的时候才使用 smallint ．而只有在 integer 的范围不够的时候才使用 bigint ，因为前者绝对快得多．

bigint 类型可能不是在所有平台上都运转正确，因为它依赖编译器对八字节整数的支持．在那些没有这样支持的机器上， bigint 的作用和 integer 一样(但是仍然占据八字节存储)．不过，我们还不知道任何有这样的情况的平台．

SQL 只声明了整数类型 integer (或int )和 smallint ．类型 bigint ，和类型名 int2 ，int4 ，和 int8 都是扩展，也在许多其它 RDBMS 产品中使用．

注意: 如果你有一个有索引的 smallint 或者 bigint 字段，那么你可能在让系统使用这些索引的时候碰到麻烦．比如，象下面这样形式的子句
... WHERE smallint_column = 42
将不会使用索引，因为系统给常量 42 赋予了 integer 类型，而目前 PostgreSQL 在涉及两种数据类型的时候不能使用索引．一个绕开的方法是使用单引号包围常量，因此∶
... WHERE smallint_column = '42'
这样将导致系统推迟类型解析并将给常量赋予正确的类型．

3.1.2. 任意精度数据

类型 numeric 可以存储那些实际上没有大小和精度限制的数值，同时还可以存储所有数字并且进行准确的计算．我们特别建议将它用于货币金额和其它要求准确的数量．不过，numeric 类型和我们下一节描述的浮点数类型比较起来要慢很多．

在随后的内容里，我们使用了下述术语∶ 一个 numeric 的比例是到小数点右边为止小数部分的位数， numeric 的精度是整个数字里全部数据位的数目，也就是小数点两边的数据数目．因此数字 23.5141 的精度为6而比例为4．你可以认为整数的比例为零．

numeric 类型的精度和比例都是可以配置的．要声明一个类型为 numeric 的字段，你可以用下面的语法

NUMERIC(

precision

, 

scale

)

精度必须为正数，比例可以为零或者正数．另外，

NUMERIC(

precision

)

选择了 0 为比例．不带任何精度或者比例声明

NUMERIC

则创建一个可以存储一个直到实现精度上限的任意精度和比例的数值，一个这样类型的字段将不会把输入数值转化成任何特定的比例，而带有比例声明的 numeric 字段将把输入值转化为该比例． (SQL 标准要求缺省的比例是 0．也就是转化成整数精度．我们觉得这样做有点没用．如果你关心移植性，那你最好总是明确声明精度和比例．)

如果一个数值的精度或者比例比字段声明的精度或者比例高，那么系统将尝试园整该数值．如果该数值无法做这样的园整以满足声明的限制，那么抛出一个错误．

类型 decimal 和 numeric 是等效的．两种类型都是 SQL 标准．

3.1.3. 浮点数类型

数据类型 real 和 double precision 是不准确的，变精度的数字类型．实际上，这些类型是 IEEE 754 二进制浮点数 (分别对应单和双精度)的一般实现，加上下层处理器，操作系统和编译器对它的支持．

不准确意味着一些数值不能准确地转换成内部格式并且是以近似的形式存储的，因此存储然后把数据再打印出来可能显示一些缺失．处理这些错误以及这些错误是如何在计算中传播的属于数学和计算机科学的一个完整的分支，我们不会在这里进一步讨论它，这里的讨论仅限于如下几点∶

如果你要求准确的计算(比如计算货币金额)，应使用 numeric 类型．
如果你想用这些类型类型做任何重要的复杂计算，尤其是那些你对范围情况(无穷，下溢)严重依赖的事情，那你应该仔细评诂你的实现．
拿两个浮点数值进行相等性比较可能象，也可能不象想像那样运转．

通常，real 类型的范围是至少 -1E+37 到 +1E+37，精度至少是 6 位小数．double precision 类型通常有 -1E+308 到 +1E+308 的范围，精度是至少 15 位数字．太大或者太小的数值都会导致错误．如果输入数据太高，那么可能发生园整．太接近零的数字，如果无法与零值的表现形式相区分就会产生下溢错．

3.1.4. Serial（序列）类型

serial 类型不是真正的类型，只是为在表中设置唯一标识做的概念上的便利．在目前的实现中，下面一句话：

CREATE TABLE 

tablename

 (
    

colname

 SERIAL
);

等价于声明下面几句话：

CREATE SEQUENCE 

tablename

_

colname

_seq;
CREATE TABLE 

tablename

(
    

colname

 integer DEFAULT nextval('

tablename

_

colname

_seq') UNIQUE NOT NULL
);

因此，我们就创建了一个整数字段并且把它的缺省数值安排为从一个序列发生器取值．还应用了 UNIQUE 和 NOT NULL 约束以确保明确地插入的数值也不会重复．

类型名 serial 和 serial4 是等效的∶ 两个都创建 integer 字段．类型名 bigserial 和 serial8 也一样，只不过它创建一个 bigint 字段．如果你预计在表的生存期中使用的标识数目超过 2³¹ 个，那么你应该使用 bigserial ．

在删除包含一个序列类型的表的时候，支持 serial 类型的序列是不会被自动删除的．因此，按照下面顺序执行的命令很可能失败∶

CREATE TABLE 

tablename

 (

colname

 SERIAL);
DROP TABLE 

tablename

;
CREATE TABLE 

tablename

 (

colname

 SERIAL);

除非明确地使用 DROP SEQUENCE 命令，序列号不会被删掉而是一直在数据库里面。 (这个不便可能在将来的版本中修改．)