|
Chapter 9. 备份和恢复和任何包含珍贵数据的东西一样, PostgreSQL 数据库也应该经常备份.尽管这个过程相当简单, 但是我们还是应该理解做这件事所 用的技巧和假设. 备份 PostgreSQL 数据有两个完全不同的方法:
9.1. SQL 转储SQL 转储的方法采用的主意是创建一个文本文件,这个文本里面都是 SQL 命令,当把这个文件回馈给服务器时,将重建与转储时状态一样 的数据库. PostgreSQL 为这个用途提供了应用工具 pg_dump .这条命令的基本用法是: pg_dump dbname > outfile 正如你所见, pg_dump 把结果输出到标准输出. 我们下面就可以看到这样做有什么好处. pg_dump 是一个普通的 PostgreSQL 客户端应用(尽管是个相当聪明的东西.)这就意味着你可以从 任何可以访问该数据库的远端主机上面进行备份工作.但是请记住 pg_dump 不会以任何特殊权限运行.具体说来,就是 你必须要有你想备份的表的读权限,因此,实际上你几乎总是要成为 数据库超级用户. 要声明 pg_dump 应该以哪个用户身份进行联接,使用命令行 选项 -h host 和 -p port .缺省 主机是本地主机或你的环境变量 PGHOST 声明的值. 类似,缺省端口是环境变量 PGPORT 或(如果它 不存在的话)编译好了的缺省值.(比较方便的是,服务器通常有相同 的缺省.) 和任何其他 PostgreSQL 客户端应用一样, pg_dump 缺省时用与当前 UNIX 用户名同名的数据库用户 名进行联接.要覆盖这个名字,要么声明 -U 选项, 要么设置环境变量 PGUSER . 请注意 pg_dump 的联接也和普通客户应用一样要 通过客户认证机制(在 Chapter 4 )里描述. 由 pg_dump 创建的备份在内部是一致的, 也就是说,在 pg_dump 运行的时候对数据库的更新 将不会被转储. pg_dump 工作的时候并不阻塞 其他的对数据库的操作.(但是会阻塞那些需要排它锁的操作,比如 VACUUM FULL .)
9.1.1. 从转储中恢复pg_dump 生成的文本文件可以由 psql 程序读取. 从转储中恢复的常用命令是 psql dbname < infile 这里的 infile 就是你 给 pg_dump 命令的 outfile 参数.这条命令不会创建数据库 dbname ,你必须在执行 psql 前自己创建(也就是说,用命令 createdb -T template0 dbname ). psql 支持类似 pg_dump 的选项用以控制数据库服务器位置 和用户名.参考它的手册获取更多信息. 如果在原先数据库里的对象属于不同的用户,那么转储的文件会指示 psql 以各个受影响的用户轮流联接然后再创建相关的对象. 这样就保留了原来的所有权属性.不过这样也意味着所有这些用户必须 已经存在,而且你还必须能够以每个用户的身份联接. 所以我们可能需要临时放松一下客户认证的设置. pg_dump 和 psql 可以通过管道 读写,这样我们就可能从一台主机上将数据库目录转储到另一台主机上, 比如
9.1.2. 使用 pg_dumpall上面的方法在备份整个数据库集群的时候比较麻烦而且不方便.因此我们 提供了 pg_dumpall 程序. pg_dumpall 备份一个给出的集群中的每个数据库,同时 还确保保留象用户和组这样的全局数据状态.调用 pg_dumpall 很简单 pg_dumpall > outfile 象上面描写的那样,转储出的文件可以用 psql 恢复. 不过这时候你绝对需要数据库超级用户权限,因为我们需要它来恢复 用户和组信息. 9.1.3. 大数据库
因为 PostgreSQL 允许表的大小大于你的系统允许的最大文件大小, 可能把表转储到一个文件会有问题,因为生成的文件很 可能比你的系统允许的最大文件大。 因为 pg_dump 输出到 stdout, 你可以用标准的 *nix 工具绕开这个问题: 使用压缩的转储. 使用你熟悉的压缩程序,比如说 gzip . pg_dump dbname | gzip > filename .gz 用下面命令恢复: createdb dbname gunzip -c filename .gz | psql dbname 或者 cat filename .gz | gunzip | psql dbname
使用 split .. 你可以用下面的方法把输出分解成操作系统可以接受的大小. 比如,让每个块大小为 1 兆字节: 用下面命令恢复:9.1.4. 注意pg_dump (以及建筑在其上的 pg_dumpall ))有几个限制,这些限制的来源是 我们很难从系统表中 重构某些信息. 具体说来, pg_dump 写对象的顺序并不复杂.这样可能 导致问题,比如说当把函数用做字段缺省值时.唯一的解决方法是 手工为转储重新排序.如果你在数据库设计里面创建了循环依赖 关系,那你就有更多事要做了. 出于向下兼容的考虑,缺省的时候 pg_dump 并不 转储大对象.要转储大对象,你必须使用客户化或者 TAR 输出格式, 并且在 pg_dump 中使用 -b 选项. 参阅相应手册获取详细信息.在 PostgreSQL 源码树的 contrib/pg_dumplo 路径里也包含一个可以转储大对象的 程序. 请熟悉一下 pg_dump 的手册页. |