プログラミング序論　page14(update:2017/07/24)

14. 標準関数とプリプロセッサ

C言語自体には文字を書き出す機能さえも用意されていない。変数を定義し、四則演算を記述し、条件分岐や繰り返しの構文を用意し、関数を部品としてプログラムを記述し組み立てる仕組み,と，多数のデータを効率よく記憶し処理するための配列や構造体などを用意しただけである。

文字を書き出すといった，基本的な機能はC言語の標準関数として用意されている。標準関数はC言語やアセンブリ言語で記述され、それらを翻訳した機械語の関数をまとめてライブラリ・ファイルとして提供される。　ライブラリから必要な関数をプログラムにリンクすることで，これらの機能を利用する。

●標準関数

プログラミングで誰もが必要とするような機能を提供するために、標準で用意された関数。標準関数の呼び出しに必要な関数のプロトタイプ宣言は以下のようなヘッダーファイルの形で用意されている。標準関数を利用するプログラムでは，プロトタイプ宣言を追加するために前処理でヘッダーファイルをインクルードする。

stdio.hは標準の入出力関数用
math.hは標準の初等関数用（三角関数，指数関数，対数関数，...）
ctyep.h、string.hは文字と文字列の処理関数用
stdlib.hはメモリー管理と文字列と各種データ型などの変換関数用
そのほか多数あり

●プリプロセッサ

C言語ではコンパイルする前に、プリプロセッサによりプログラムのテキスト（ソースコード）を前処理する。主な機能は、

ヘッダーファイルの挿入
標準関数を呼ぶために必要な関数プロトタイプ宣言は分野ごとに分けたヘッダー・ファイルとして提供される。ヘッダー・ファイルをソースコードに取り込む処理はプリプロセッサの重要な機能である。分割コンパイルを行う場合は他者が作る関数を利用するためのヘッダー・ファイルのインクルードも行われる。
字句の置き換え
条件に応じたソースコードの書き換え

14-1.　標準関数 standard library function

プログラムを作るとき全ての機能を1から作るのは非現実的な労力を必要とする。現在のプログラミングは、過去のプログラム資産や他人の作った関数を有効活用することで初めて可能になっている。

Ｃ言語では、関数ライブラリー・ファイルから自分のプログラムに必要な関数を取り込んで結合し利用する仕組みが提供される。この取り込みと結合の処理をリンクと言う。

※標準関数で足りない場合、有用な関数のライブラリーを購入して利用することも多い。言語処理系を差別化するものとしてGUIを実現するための関数ライブラリーが用意されることも多い。

プログラムでは、標準関数を呼ぶ記述の前には関数プロトタイプ宣言が必要になる。そこで、標準関数のプロトタイプ宣言をまとめて記述したヘッダーファイルが用意されている。プリプロセッサにより、このへッダーファイルの中身を#include命令でソースコードに取り込んでから、コンパイルすることで，関数の呼び出し部分を機械語に変翻訳できる。

次の，リンク処理では，こうして作られたオブジェクトファイルに、呼ばれる側の標準関数などをライブラリから取り込んで結合し，実行可能ファイルを作る。

以下にstdio.h math.h　string.h　stdlib.h　の4個のヘッダーファイルを使う標準関数を紹介する。

stdio.h

　入出力の標準関数についてプロトタイプ宣言などを集めたヘッダーファイル

stdio.hの関数メモ

標準入出力

int printf(const char *format,...) 書式付き出力

int scanf(const char *format,...) 書式付き入力

int putchar(int c) 一文字出力

int getchar(void) 一文字入力

int puts(const char *s) 文字列出力

char* gets(char　*s) 文字列入力　sは文字列を入れる場所

ファイル操作

FILE *open(cost char*fname,const char *mode) ファイルのオープン

int fclose(FILE *stream) ファイルのクローズ

int fflush(FILE *stream) ファイルバッファのフラッシュ

int fprintf(FILE*stream, const char *format,...) ファイルへの書式付き出力

int fscanf(FILE*stream,const char *format,...) ファイルからの書式付き入力

int putc(int c,FILE *stream)
int fputc(int c,FILE*stream)int ファイルへの一文字出力

getc(FILE*stream)
int fgetc(FILE*stream) ファイルからの一文字入力

int fputs(const char*s,FILE *stream)

char* fgets(const char*s,int n,FILE *stream)

．．．．．．．．

math.h

　指数や対数関数、三角関数などの初等関数を使うためのヘッダーファイル
（注：リンク処理では数値計算用ライブラリーファイルの指定を必要とする処理系もある）

math.hの関数メモ

　三角関数

double acos(double x) arccos(x)　逆三角関数

double asin(double x) arcsin(x)

double atan(double t) arctan(t)

double atan2(double y,double x) arctan(y/x) 正負のx,yや x=0に対応

double cos(double x) cos(x)　三角関数

double sin(double x) sin(x) ={exp(ix)-exp(-ix)}/2i

double tan(double x) tan(x)

double cosh(double x) cosh(x)　双曲線関数

double sinh(double x) sinh(x) ={exp(x)-exp(-x)}/2

double tanh(double x) tanh(x)

　指数、対数

doublu exp(double x) exp(x)

doublu log(double x) 自然対数

doublu log10(double x) 常用対数

double pow(double x,double y) x^y

double ldexp(double x,int n) x*2ⁿ

double sqrt(double x) 平方根

　その他

double fabs(double x) 絶対値 ※

double ceil(double x) xより小さくない最少の整数値

double floor(double x) xより大きくない最大の整数値

．．．．．．．．

※名前の衝突
整数の絶対値を得る関数
int abs(int)
があるため実数に対しては同じ名前の関数を作れない。そこでfを付けてfabsと区別している。

ctype.h

文字の分類や変換に関する標準関数のヘッダーファイル。

処理系の文字コードに依存するような処理は、汎用性や移植性を考慮して用意された標準関数を用いることで依存性を回避する。

ctype.hの関数メモ

　文字の分類

int isalnum(int) 英数字かどうかの判別

int isalpha(int) 英字かどうかの判別

int isspace(int) 空白類文字かどうかの判別

........... この他にも色々ある

文字の変換

int tolower(int) 小文字に変換

int toupper(int) 大文字に変換

.......... この他にも色々ある

プログラム例。英文テキストからの単語切り出し

1文字づつ読み込んで、読み込んだ文字（入力）に応じて状態をかえながら、単語の終端を判定して連続したアルファベットを1つの単語として出力するプログラムを紹介します。

次の図は状態遷移図と呼ばれています。　単語外と単語内の2つの状態を入力結果に応じて矢印のように遷移します。遷移の条件となる入力と遷移における動作を「入力/動作」の型で示しました。

※このプログラムは大文字と小文字の区別はしないことにして、全てを小文字に変換すます。また、行末のハイフン等も単語の切れ目としてしまいます。2バイトの文字コードが含まれると正しく動きません。

#include<stdio.h>
#include<ctype.h>

/*
標準入力から文字列を読み込んで
連続するアルファベットを単語として切りだし
（大文字は小文字に全て変換する）
標準出力へ改行で区切って出力する
*/
int main(void)
{
    char buffer[256],index=0;
    int c,i;
    int mode=0;/*文字列の内外を示す状態変数*/
    while(1){
        c=getchar();
        if(mode==0){/*単語外の状態のとき*/
            if(c==EOF) break;
            if(isalpha(c)){/*アルファベットなら*/
                mode=1;/*単語内の状態に遷移*/
                index=0;
                c=tolower(c);/*全て小文字に変換*/
                buffer[index++]=(char)c;
            }
        }else{/*単語内の状態のとき*/
            if(c==EOF){
                for(i=0;i<index;i++)
                    putchar(buffer[i]);
                putchar('\n');
                break;
            }
            if(isalpha(c)){/*アルファベットかチェック*/
                c=tolower(c);/*全て小文字に変換*/
                buffer[index++]=(char)c;
                if(255<index){
                    printf("BUFFER OVERFLOW");
                    break;
                }
            }else{/*アルファベットでなければ*/
                for(i=0;i<index;i++)
                    putchar(buffer[i]);
                putchar('\n');
                mode=0;/*単語外の状態に遷移*/
            }
        }
    }
    return 0;
}

※('A'<=c && c<='Z')||('a'<=c && c<='z')　の様な条件判定では計算機システムの文字コードがASCIIコード以外の場合に正しくアルファベットを判定できない。たとえばEBCDIC（エビシディック）ではアルファベッドに対応する文字コードに隙間が有り、'A'から’Ｚ’の間には文字に対応しない値も含まれている。

string.h

文字列処理の標準関数のヘッダーファイル。

string.hの関数メモ

size_t strlen(char *s) 文字列の長さを戻す
ポインタsから始まる文字列の長さを戻す。文字列終端の\0を含まない
size_t型はsizeof（）演算子が戻すデータ型でunsigned intまたはunsigned longとなる。計算機の環境に対応する為にこのように別名が使われる。

char *strcpy(
char *s, const char *s2) 文字列のコピー
ポインタs2から始まる文字列をポインタsからのメモリーにコピーする。※sが示すメモリー領域が文字列を格納できる大きさであるか注意。戻り値はs

char *strcat(
　　　char *s, const char *s2) 文字列の結合
ポインタs2から始まる文字列をポインタsから始まる文字列のあとにコピーして書き加える。※sが示すメモリー領域が結合された文字列を格納できる大きさであるか注意。戻り値はs

int strcmp(
　　　const char*s, const char *s2) 文字列の比較
ｓとs2から始まる文字列を先頭から比較し、辞書順でs2<sなら正、s2>sなら負, s==s2でゼロの値を戻す。

........... この他にも色々ある

stdlib.h　

stdlib.hの関数メモ

文字列の数値への変換や逆変換

int atoi(cost char*s) ascii string to integeｒ

long atol(cost char*s) ascii string to long integer

double atof(const char*s) ascii string to floating-point number

........... この他にも色々ある

記憶域管理メモリの確保や解放、データのコピーなどの標準関数

void*malloc(size_t size) memory allocation
size バイトの連続したメモリを確保

void free(void *p) pから確保されたメモリを解放

.......... この他にも色々ある

プログラム例。単語のアルファベット順並べ替えと出現数のカウント

単語をアルファベット順に並べ替えるプログラム。アルファベット順で前の単語はprev側に追加、後の単語はnext側に追加する二分木と呼ばれるデータ構造を使い、単語を追加していくことで並べ替えを同時に行う。　同じ単語の場合は出現数をカウントアップしている。

#include<stdio.h>
#include<stdlib.h>
#include<string.h>

typedef struct WORD{
    char *text;
    int count;
    struct WORD *prev;
    struct WORD *next;
} word;

word* newWord(char*str)
{
    word* p;
    p=(word*)malloc(sizeof(word));/*wordのメモリ領域を取得*/
    p->text=(char*)malloc(strlen(str)+1);/*文字列を格納する領域を取得*/
    strcpy(p->text,str);/*文字列をコピー*/
    p->count=1;
    p->prev=NULL;
    p->next=NULL;
    return p;
}

/*二分木の根*/
word *root=NULL;

/*ソートしながら二分木へ文字列を追加する関数*/
void addWord(word**p,char*str)/*再帰呼び出しと2重ポインタが判り難いかも*/
{
    int r;
    if(*p==NULL){
        *p=newWord(str);
        return;
    }
    r=strcmp(str,(*p)->text);/*文字列の比較*/
    if(0<r){/*next側に追加*/
        addWord(&((*p)->next),str);
    }else if(r==0){/*見つけたので追加の必要なし*/
        (*p)->count++;
    }else{/*prev側に追加*/
        addWord(&((*p)->prev),str);
    }
    return;
}

/*リストの打ち出し、こちらも再帰を使っている*/
void printAll(word *p) {
    if(p==NULL)return;
    printAll(p->prev);
    printf("出現個数\t%d\t%s\n",p->count,p->text);
    printAll(p->next);
    return;
} 

int main(void)
{
    char buffer[256];
    while(scanf("%255s",buffer)==1){
        addWord(&root,buffer);
    }
    printAll(root);
    return 0;
}

[メモ]
短いプログラムだが単語切りだしプログラムと組み合わせれば、英文の単語出現率を調べることも可能。

例として、不思議の国のアリスから単語の使用頻度の高い順に10位までを示す.。

1818 the

940 and

809 to

690 a

631 of

610 it

553 she

545 i

481 you

462 said

※wonder.txt　

14-2.　プリプロセッサ preprocessor

Ｃ言語のソースプログラムは前処理を行ってから翻訳が行われる。

前処理ではプリプロセッサ命令文に従ってテキストの挿入や置き換えを行う。プリプロセッサ命令文は行の先頭から「#」で始まる。この部分はCプログラムの命令文ではない。

#include

この行を指定されたファイルのテキストで置き換える。

< >で囲んで指定する
　ヘッダーファイルが置かれる標準の場所からファイルを捜す

””で囲んで指定する
　ソースファイルが置かれる場所からファイルを捜す（捜す場所は処理系依存）

#define　マクロ定義。

文字列の置き換えを指示する。

#define　NUM 100
これは、これ以後のテキストで文字列NUMを100に置き換えることを指示

#define　MAX(a,b) (((a)>(b))?(a):(b))
これは　関数形式マクロと呼ばれるもので　このパターンの文字列を置き換える。あたかも関数の様に使えるマクロ

c=MAX(10+5,ｘ+a)；
は
　c=(((10+5)>(x+a))?（10+5）:(x+a));
に置き換えられる。

※関数形式マクロは関数ではないので注意して使う必要がある。
c=MAX(a++,20);
は
c=(((a++)>(20))?（a++）:(20));
と変換されa>20ではa++が2度実行される。

#undef　マクロ定義を削除

#if　値　～#endif

値が0（偽）ならendifまでを削除。

#if ～#else～#endif
の形でどちらかを選択する形にもできる
#ifdef～
でマクロの定義の有無で分岐することも可能

虫取り(プログラムのミスを取り除く)や開発中の動作確認用のプログラムをON/OFFする例

/*虫取り用　プログラム完成時にDEBUGを０にする*/
#define DEBUG　1
.....
for(i=0;i<10;i++){
#if DEBUG
  printf("a[%d]=%d",i,a[i]);/*計算に使うデータを全て書き出す*/
#endif
  sum+=a[i];
}

....

処理系が自動生成するマクロもある

__FILE__　処理しているソースファイルの名前値は　”文字列リテラル” です
__LINE__ 処理しているソースファイルの現在の行番号　値は　整数リテラル　です
__DATE__ 処理した日付　値は　”文字列リテラル” です

#include<stdio.h>
int main(void)
{
    printf("このプログラムは%s にコンパイルしました",__DATE__);
    printf("ソースファイルは%s ここは%d行目です\n",__FILE__,__LINE__);
    return 0;
}

プリプロセスだけを実行すると以下のように置き換わります。

.....stdio.hの中身が沢山あった後に...
int main(void)
{
    printf("このプログラムは%s にコンパイルしました","Jul 17 2008");
    printf("ソースファイルは%s ここは%d行目です\n","test.c",5);
    return 0;
}

コンパイルを行った日付や元のソースファイル名や行番号を実行可能プログラムに組み込むことが可能になります。

[ index | prev | next ]

stdio.hの関数	メモ
標準入出力
int printf(const char *format,...)	書式付き出力
int scanf(const char *format,...)	書式付き入力
int putchar(int c)	一文字出力
int getchar(void)	一文字入力
int puts(const char *s)	文字列出力
char* gets(char　*s)	文字列入力　sは文字列を入れる場所
ファイル操作
FILE open(cost charfname,const char *mode)	ファイルのオープン
int fclose(FILE *stream)	ファイルのクローズ
int fflush(FILE *stream)	ファイルバッファのフラッシュ
int fprintf(FILEstream, const char format,...)	ファイルへの書式付き出力
int fscanf(FILEstream,const char format,...)	ファイルからの書式付き入力
int putc(int c,FILE stream) int fputc(int c,FILEstream)int	ファイルへの一文字出力
getc(FILEstream) int fgetc(FILEstream)	ファイルからの一文字入力
int fputs(const chars,FILE stream)
char* fgets(const chars,int n,FILE stream)
．．．．．．．．

math.hの関数	メモ
三角関数
double acos(double x)	arccos(x)　逆三角関数
double asin(double x)	arcsin(x)
double atan(double t)	arctan(t)
double atan2(double y,double x)	arctan(y/x) 正負のx,yや x=0に対応
double cos(double x)	cos(x)　三角関数
double sin(double x)	sin(x) ={exp(ix)-exp(-ix)}/2i
double tan(double x)	tan(x)
double cosh(double x)	cosh(x)　双曲線関数
double sinh(double x)	sinh(x) ={exp(x)-exp(-x)}/2
double tanh(double x)	tanh(x)
指数、対数
doublu exp(double x)	exp(x)
doublu log(double x)	自然対数
doublu log10(double x)	常用対数
double pow(double x,double y)	x^y
double ldexp(double x,int n)	x*2ⁿ
double sqrt(double x)	平方根
その他
double fabs(double x)	絶対値 ※
double ceil(double x)	xより小さくない最少の整数値
double floor(double x)	xより大きくない最大の整数値
．．．．．．．．

ctype.hの関数	メモ
文字の分類
int isalnum(int)	英数字かどうかの判別
int isalpha(int)	英字かどうかの判別
int isspace(int)	空白類文字かどうかの判別
...........	この他にも色々ある
文字の変換
int tolower(int)	小文字に変換
int toupper(int)	大文字に変換
..........	この他にも色々ある

string.hの関数	メモ
size_t strlen(char *s)	文字列の長さを戻すポインタsから始まる文字列の長さを戻す。文字列終端の\0を含まない size_t型はsizeof（）演算子が戻すデータ型でunsigned intまたはunsigned longとなる。計算機の環境に対応する為にこのように別名が使われる。
char strcpy( char s, const char *s2)	文字列のコピーポインタs2から始まる文字列をポインタsからのメモリーにコピーする。※sが示すメモリー領域が文字列を格納できる大きさであるか注意。戻り値はs
char strcat( 　　　char s, const char *s2)	文字列の結合ポインタs2から始まる文字列をポインタsから始まる文字列のあとにコピーして書き加える。※sが示すメモリー領域が結合された文字列を格納できる大きさであるか注意。戻り値はs
int strcmp( 　　　const chars, const char s2)	文字列の比較ｓとs2から始まる文字列を先頭から比較し、辞書順でs2<sなら正、s2>sなら負, s==s2でゼロの値を戻す。
...........	この他にも色々ある

stdlib.hの関数	メモ
文字列の数値への変換や逆変換
int atoi(cost char*s)	ascii string to integeｒ
long atol(cost char*s)	ascii string to long integer
double atof(const char*s)	ascii string to floating-point number
...........	この他にも色々ある
記憶域管理	メモリの確保や解放、データのコピーなどの標準関数
void*malloc(size_t size)	memory allocation size バイトの連続したメモリを確保
void free(void *p)	pから確保されたメモリを解放
..........	この他にも色々ある

14. 標準関数とプリプロセッサ

14-1. 標準関数 standard library function

stdio.h

math.h

ctype.h

プログラム例。英文テキストからの単語切り出し

string.h

stdlib.h

プログラム例。単語のアルファベット順並べ替えと出現数のカウント

14-2. プリプロセッサ preprocessor

#include

#define マクロ定義。

#undef マクロ定義を削除

#if 値 ～#endif

処理系が自動生成するマクロもある

14-1.　標準関数 standard library function

stdlib.h　

14-2.　プリプロセッサ preprocessor

#define　マクロ定義。

#undef　マクロ定義を削除

#if　値　～#endif