目 前, 我 国 许 多 单 位MIS 系 统 建 立 在 微 机PC 或 基 于 Novell NetWare 局 域 网 环 境 中, 数 据 库 和 开 发 工 具 采 用 Foxpro 2.5 for DOS 或 Foxpro 2.5 for Windows, 以dbf 文 件 为 数 据 组 织 管 理 手 段, 随 着 系 统 的 不 断 扩 大 和 实 际 应 用 的 需 要, 不 少 单 位 已 开 始 采 用 大 型 数 据 库Oracle。 在MIS 从Foxpro 升 级 到 大 型 数 据 库Oracle 过 程 中, 将Foxpro 的dbf 文 件 通 过Oracle 工 具SQL*Loader 加 载 到Oracle 数 据 库 中 是 一 项 非 常 重 要 的 工 作。 一 般 用SQL*Loader 加 载 的 具 体 实 施 步 骤 是:
---- * 运 行Foxpro, 打 开 数 据 库, 将dbf 文 件 拷 贝 为SDF 格 式 的 文 本 文 件
---- * 根 据dbf 文 件 结 构, 产 生 建 立Oracle 表(CREATE TABLE) 的SQL 语 句
---- * 登 录Oracle, 运 行 产 生Oracle 表(CREATE TABLE) 的SQL 语 句
---- * 根 据dbf 文 件 结 构, 产 生SQL*Loader 的 控 制 文 件
---- * 运 行SQL*Loader , 加 载 数 据
---- 用 手 工 方 法 产 生CREATE TABLE 的SQL 语 句, 特 别 是 产 生SQL*Loader 控 制 文 件 时,POSITION 起 始、 结 束 位 置 经 常 弄 错, 当 需 要 加 载 大 量 的 数 据 时, 不 但 烦 琐, 而 且 效 率 比 较 低。 我 们 在 实 践 中 利 用Borland C++ 5.0 编 制 了 一 个C++ 实 用 程 序load.cpp, 自 动 产 生SQL*Loader 的 数 据 文 件、 控 制 文 件 和 产 生CREATE TABLE 的SQL 语 句。 运 用load, 我 们 只 需:
---- * load < 数 据 库 名 >
---- * 登 录Oracle, 运 行 产 生Oracle 表(CREATE TABLE) 的SQL 语 句
---- * 运 行SQL*Loader , 加 载 数 据
---- 在 实 践 中, 我 们 通 过 这 种 方 法, 在 实 现 从Foxpro 到Oracle for Digital UNIX + 中 文Windows 95 的client/server 平 台 的 数 据 加 载 过 程 中 提 高 了 效 率。
---- 2.Foxpro 中dbf 文 件 结 构
---- dbf 文 件 由 文 件 头 和 文 件 记 录 组 成, 其 中 文 件 头 又 由 数 据 库 说 明 和 字 段 说 明 组 成。 数 据 库 说 明 由32 个 字 节 组 成, 各 字 节 含 义 见 表 一:
字 节 含 义 0 数 据 库 文 件 标 志 有 无 备 注 型 字 段(03H 无) 1-3 最 后 一 次 修 改 日 期 4-7 文 件 记 录 数 8-9 文 件 头 长 度 10-11 记 录 长 度 12-31 未 用
---- 表 一
---- 字 段 说 明 由 若 干 个32 字 节 组 成, 每32 字 节 说 明 一 个 字 段, 各 字 节 含 义 见 表 二:
字 节 含 义 0-10 字 段 名 11 字 段 类 型 12-15 该 字 段 在 文 件 首 记 录 中 的 地 址 16 字 段 长 度 17 小 数 位 数 18-31 未 用
---- 表 二
---- 文 件 记 录 以ASCII 形 式 存 储, 每 条 记 录 以 空 格(20H) 开 头, 该 空 格 用 来 作 删 除 标 志 用。
---- 3. 建 立 对 应Foxpro 的Oracle 表 的SQL 语 句
---- Foxpro 和Oracle 对 应 的 数 据 类 型 的 描 述 见 表 三:
Foxpro Oracle Character(n) char(n) varchar2(n) Number(n,m) number(n-1,m) m< >0 number(n,m) m=0 Float(n,m)
Logical char(1) DATE DATE
---- 三
---- 【 注】:
---- * 不 考 虑 完 整 性 约 束, 同 时 对 于TABLESPACE 及STORAGE 存 储 参 数 取 缺 省 值。
---- * 对 于 数 字 型 字 段,n 表 示 数 字 的 宽 度, 在Foxpro 中 包 含 小 数 点 位 置, 而 在Oracle 中 不 包 含。
---- * 对 于Foxpro logical 型 字 段 类 型, 由 于Oracle 中 没 有 相 应 的 逻 辑 型 变 量, 故 将 其 转 换 为 字 符 类 型。
---- * 暂 且 不 考 虑memo、general、picture 字 段 的 转 换。
---- 4. SQL*Loader 控 制 文 件 的 建 立
---- 控 制 文 件 为SQL*Loader 的 核 心 文 件, 与Foxpro 字 段 对 应 关 系 为 表 四: Foxpro 数 据 类 型
---- 控 制 文 件 语 句 对 应 的 格 式
Character(n) CHAR Number(n,m) Float(n,m) DECIMAL EXTERNAL NULLIF < field > = BLANKS (m< >0)
INTEGER EXTERNAL NULLIF < field > = BLANKS ( m=0) Logical CHAR DATE DATE "YYYYMMDD" NULLIF < field > = BLANKS
---- 四
---- 以 下 是 用Borland C++ 5.0 在 中 文Windows 95 下 编 制 的 产 生CREATE TABLE SQL 语 句 和 产 生SQL*Loader 数 据 文 件、 控 制 文 件 的 源 程 序load.cpp。
#include < stdio.h > #include < stdlib.h > #include < iostream.h > #include < fstream.h > #include < string.h > #include < math.h > #define MAX_ROW_LENGTH 1200 #define MAX_FIELD_NUMBER 30 typedef struct head // dbf头文件结构 { unsigned char mask ; unsigned char date[3] ; unsigned long record_num; unsigned short int head_length; unsigned short int field_length ; } HEAD ;
typedef struct field // dbf字段结构 { unsigned char name[11]; unsigned char type ; unsigned long add; unsigned char length; unsigned char dec ; } FIELD ;
int main(int argc,char **argv) { char buf[MAX_ROW_LENGTH],dbf[40],*sqlload; unsigned int i,field_num; HEAD *dbfhead ; FIELD dbffield[MAX_FIELD_NUMBER]; FILE *fout, *fp;
if (argc!=2) { cout < < "Usage : load dbfile" < < endl ; return -1; }
sqlload = new char(40); dbfhead = new HEAD; strcpy(buf,"");
strcpy(dbf,argv[1]); strcat(dbf,".dbf"); if ((fp=fopen(dbf,"rb")) == NULL) { cout < < "Cannot open file " < < dbf < < endl; return -1 ; } fseek(fp,0,SEEK_SET); fread(dbfhead,sizeof(HEAD),1,fp); // 读dbf头文件信息
field_num = (dbfhead- >head_length-1)/32 -1 ; //字段个数
for( i=0; i< field_num; i++) { fseek(fp,32*(i+1),SEEK_SET); fread(&dbffield[i],sizeof(FIELD),1,fp); // 读dbf结构信息 } // 产 生SQL*Loader 控 制 文 件 strcpy(sqlload,argv[1]); strcat(sqlload,".ctl"); if ((fout=fopen(sqlload,"w")) == NULL) { cout < < "Cannot open file " < < sqlload < < endl; return -1 ; } fprintf(fout,"LOAD DATA\n"); fprintf(fout,"INFILE '%s.txt'\n", argv[1]); fprintf(fout,"INTO TABLE %s (\n", argv[1]);
for(i=0;i< field_num;++i) { fprintf(fout, "%11s POSITION(%d:%d)", dbffield[i].name, dbffield[i].add, dbffield[i].add + dbffield[i].length -1 ); switch (dbffield[i].type) { case 'C': case 'L': // 字符型/ 逻辑型 fprintf(fout, " CHAR"); break ; case 'N': if (dbffield[i].dec == 0 ) //整数型 fprintf(fout, "INTEGER EXTERNAL NULLIF %s = BLANKS", dbffield[i].name); else //实数型 fprintf(fout, " DECIMAL EXTERNAL NULLIF %s =BLANKS", dbffield[i].name ); break; case 'D': //日期型 fprintf(fout, " DATE 'YYYYMMDD' NULLIF %s = BLANKS", dbffield[i].name); break; default: break; } if(i< field_num -1) fprintf(fout, ",\n") ; } fprintf(fout, ")\n"); fclose(fout);
// 产 生CREATE TABEL. 的SQL 语 句 strcpy(sqlload,argv[1]); strcat(sqlload,".sql"); if ((fout=fopen(sqlload,"w")) == NULL) { cout < < "Cannot open file " < < sqlload < < endl; return -1 ; } fprintf(fout, "create table %s (\n", argv[1]); for(i=0;i< field_num;i++) { fprintf(fout,"%11s",dbffield[i].name); switch (dbffield[i].type) { case 'C': //字符型 fprintf(fout, " CHAR(%d)",dbffield[i].length); break; case 'L': //逻辑型 fprintf(fout, " CHAR(1)"); break; case 'N': //数字型 if (dbffield[i].dec==0) fprintf(fout," NUMBER(%d)", dbffield[i].length) ; else fprintf(fout, " NUMBER(%d,%d)", dbffield[i].length-1, dbffield[i].dec); break; case 'D': // 日 期 型 fprintf(fout, " DATE");; break; default: break; } if (i< field_num - 1) fprintf(fout, ",\n"); } fprintf(fout, ")\n"); fclose(fout);
// 产生SQL*Loader数据文件 strcpy(sqlload,argv[1]); strcat(sqlload,".txt"); if((fout=fopen(sqlload,"w")) == NULL) { cout < < "Cannot open file " < < sqlload < < endl; return -1 ; } fseek(fp,dbfhead- >head_length,SEEK_SET);
for(i=0;i< dbfhead- >record_num;i++) { fread(buf,dbfhead- >field_length,1,fp); buf[dbfhead- >field_length] ='\0'; fprintf(fout,"%s\n", buf+1); //skip记录首字节(删除标志) } fclose(fout); fclose(fp);
delete sqlload; return 0 ; } |