当前位置:首页 >> 脚本专栏

初步剖析C语言编程中的结构体

C语言结构体,可谓是C强大功能之一,也是C++语言之所以能衍生的有利条件,事实上,当结构体中成员中有函数指针了后,那么,结构体也即C++中的类了。

C语言中,结构体的声明、定义是用到关键字struct,就像联合体用到关键字union、枚举类型用到enum关键字一样,事实上,联合体、枚举类型的用法几乎是参照结构体来的。结构体的声明格式如下:

struct tag-name{

{

member 1;

…

member N;

};

因此,定义结构体变量的语句为:struct tag-name varible-name,如struct point pt;其中,point 为tag-name,pt是结构体struct point变量。当然,也可以一次性声明结构体类型和变量,即如下:struct tag-name {…} x,y,z;就类似于int x,y,z;语句一样。也可以在定义结构体变量时即赋初值,即变量初始化,struct point pt={320,200};

当然,也就可以有结构体指针、结构体数组了。访问结构体变量中的member的方法有:如果是由结构体变量名来访问,则是structure-variable-name.member;如果是由结构体变量指针来访问,则是structure-variable-pointer->member;

好了,上面的不是重点,也不难掌握,只是细节问题。结构体具有重要的应用,如下的:

如自引用的结构体,常用来作为二叉树等重要数据结构的实现:假设我们要实现一个普遍的问题的解决算法——统计某些输入的各单词出现的频数。由于输入的单词数是未知,内容未知,长度未知,我们不能对输入进行排序并采用二分查找。……那么,一种解决办法是:将已知的单词排序——通过将每个到达的单词排序到适当位置。当然,实现此功能不能通过线性排序,因为那样有可能很长,相应地,我们将使用二叉树来实现。该二叉树每一个单词为一个二叉树结点,每个结点包括:

  • a pointer to the text of the word
  • a count of the number of occurences
  • a pointer to the left child node
  • a pointer to the right child node

其写在程序中,即:

struct tnode{/*the tree node:*/

char *word;/*points to the next*/

int count;/*number of occurences*/

struct tnode *left;/*left child*/

struct tnode *right;/*right child*/

}

完成上述功能的完整程序如下:

#include<stdio.h> 
#include<ctype.h> 
#include<string.h> 
#include"tNode.h" 
 
#define MAXWORD 100 
struct tnode *addtree(struct tnode *,char *); 
void treeprint(struct tnode *); 
int getword(char *,int); 
 
 
struct tnode *talloc(void); 
char *strdup2(char *); 
 
 
/*word frequency count*/ 
main() 
{ 
  struct tnode *root; 
  char word[MAXWORD]; 
 
  root=NULL; 
  while(getword(word,MAXWORD)!=EOF) 
    if(isalpha(word[0])) 
      root=addtree(root,word); 
  treeprint(root); 
  return 0; 
} 
 
#define BUFSIZE 100 
char buf[BUFSIZE];/*buffer for ungetch*/ 
int bufp=0;/*next free position in buf*/ 
 
int getch(void)/*get a (possibly pushed back) character*/ 
{ 
  return (bufp>0)"ungetch:too many characters\n"); 
  else 
    buf[bufp++]=c; 
} 
 
/*getword:get next word or character from input*/ 
int getword(char *word,int lim) 
{ 
  int c,getch(void); 
  void ungetch(int); 
  char *w=word; 
 
  while(isspace(c=getch() )); 
 
  if(c!=EOF) 
    *w++=c; 
  if(!isalpha(c)){ 
    *w='\0'; 
    return c; 
  } 
  for(;--lim>0;w++) 
    if(!isalnum(*w=getch())){ 
      ungetch(*w); 
      break; 
    } 
  *w='\0'; 
  return word[0]; 
} 
 
 
/*addtree:add a node with w,at or below p*/ 
struct tnode *addtree(struct tnode *p,char *w) 
{ 
  int cond; 
 
  if(p==NULL){/*a new word has arrived*/ 
    p=talloc();/*make a new node*/ 
    p->word=strdup(w); 
    p->count=1; 
    p->left=p->right=NULL; 
  }else if((cond=strcmp(w,p->word))==0) 
    p->count++;/*repeated word*/ 
  else if(cond<0)/*less than into left subtree*/ 
    p->left=addtree(p->left,w); 
  else  /*greater than into right subtree*/ 
    p->right=addtree(p->right,w); 
  return p; 
} 
/*treeprint:in-order print of tree p*/ 
void treeprint(struct tnode *p) 
{ 
  if(p!=NULL){ 
    treeprint(p->left); 
    printf("%4d %s\n",p->count,p->word); 
    treeprint(p->right); 
  } 
} 
 
#include<stdlib.h> 
/*talloc:make a tnode*/ 
struct tnode *talloc(void) 
{ 
  return (struct tnode *)malloc(sizeof(struct tnode)); 
} 
 
 
char *strdup2(char *s)/*make a duplicate of s*/ 
{ 
  char *p; 
 
  p=(char *)malloc(strlen(s)+1);/*+1 for '\0'*/ 
  if(p!=NULL) 
    strcpy(p,s); 
  return p; 
} 

其中,其它的关于union、enum这里就不多说了,再说一个关于结构体的非常重要的应用——位操作:

当然,我们知道,对于位操作,我们可通过#define tables(即用宏和C中的位操作来实现)

如:

#define KEYWORD 01 /*0001*/

#define EXTERNAL 02 /*0010*/

#define STATIC 04   /*0100*/

enum{KEYWORD =01,EXTERNAL =02,STATIC =04};

那么,flags|=EXTERNAL|STATIC;将打开flags的EXTERNAL和STATIC位,而

flags&=~(EXTERNAL|STATIC);将关闭flags的EXTERNAL和STATIC位.

然而,上述定义的位模式可以用结构体如下写:

struct{

unsigned int is_keyword:1;

unsigned int is_extern:1;

unsigned int is_static:1;

}flags;/*This defines a variable called flags that contains three 1-bit fields*/

那么,上述打开相应位的操作为:

flags.is_extern=flags.is_static=1;

上述关闭相应位的操作为:

flags.is_extern=flags.is_static=0;