Manual de Programare C++
Manual de Programare C++
Roger Bacon
__________________________________________________________________________
3
1. Generalităţi asupra limbajului C
1.1. Introducere
Limbajul C este un limbaj de programare universal, caracterizat
printr-o exprimare concisă, un control modern al fluxului execuţiei,
structuri de date, şi un bogat set de operatori.
Limbajul C nu este un limbaj de „nivel foarte înalt” şi nu este
specializat pentru un anumit domeniu de aplicaţii. Absenţa
restricţiilor şi generalitatea sa îl fac un limbaj mai convenabil şi mai
eficient decît multe alte limbaje mai puternice.
Limbajul C permite scrierea de programe bine structurate,
datorită construcţiilor sale de control al fluxului: grupări de
instrucţiuni, luări de decizii (if), cicluri cu testul de terminare
înaintea ciclului (while, for) sau după ciclu (do) şi selecţia unui
caz dintr-o mulţime de cazuri (switch).
Limbajul C permite lucrul cu pointeri şi are o aritmetică de
adrese puternică.
Limbajul C nu are operaţii care prelucrează direct obiectele
compuse cum sînt şirurile de caractere, mulţimile, listele sau
masivele, considerate fiecare ca o entitate. Limbajul C nu prezintă
facilităţi de alocare a memoriei altele decît definiţia statică sau
disciplina de stivă relativă la variabilele locale ale funcţiilor. În
sfîrşit, limbajul C nu are facilităţi de intrare-ieşire şi nici metode
directe de acces la fişiere. Toate aceste mecanisme de nivel înalt sînt
realizate prin funcţii explicite.
Deşi limbajul C este, aşadar, un limbaj de nivel relativ scăzut, el
este un limbaj agreabil, expresiv şi elastic, care se pretează la o gamă
largă de programe. C este un limbaj restrîns şi se învaţă relativ uşor,
iar subtilităţile se reţin pe măsură ce experienţa în programare creşte.
__________________________________________________________________________
4
1.2. Primele programe
În această secţiune sînt prezentate şi explicate patru programe cu
scopul de a asigura un suport de bază pentru prezentările din
capitolele următoare.
Prin tradiţie primul program C este un mic exemplu din lucrarea
devenită clasică – „The C programming language”, de Brian W
Kernigham şi Dennis M Ritchie.
#include <stdio.h>
main() {
printf("Hello, world\n");
return 0;
}
__________________________________________________________________________
9
2. Unităţile lexicale ale limbajului C
2.1. Identificatori
Un identificator este o succesiune de litere şi cifre dintre care
primul caracter este în mod obligatoriu o literă. Se admit şi litere
mari şi litere mici dar ele se consideră caractere distincte. Liniuţa de
subliniere _ este considerată ca fiind literă. Deci alfabetul peste care
sînt definiţi identificatorii este următorul:
A = <a,...,z,A,...,Z,0,...,9,_>
__________________________________________________________________________
10
2.3. Constante
În limbajul C există următoarele tipuri de constante: întreg
(zecimal, octal, hexazecimal), întreg lung explicit, flotant, caracter,
simbolic.
Constante întregi
O constantă întreagă constă dintr-o succesiune de cifre.
O constantă octală este o constantă întreagă care începe cu 0
(cifra zero), şi este formată cu cifre de la 0 la 7.
O constantă hexazecimală este o constantă întreagă precedată de
0x sau 0X (cifra 0 şi litera x). Cifrele hexazecimale includ literele de
la A la F şi de la a la f cu valori de la 10 la 15.
În orice alt caz, constanta întreagă este o constantă zecimală.
Exemplu: constanta zecimală 31 poate fi scrisă ca 037 în octal şi
0x1f sau 0X1F în hexazecimal.
O constantă întreagă este generată pe un cuvînt (doi sau patru
octeţi, dacă sistemul de calcul este pe 16 sau 32 de biţi).
O constantă zecimală a cărei valoare depăşeşte pe cel mai mare
întreg cu semn reprezentabil pe un cuvînt scurt (16 biţi) se consideră
de tip long şi este generată pe 4 octeţi.
O constantă octală sau hexazecimală care depăşeşte pe cel mai
mare întreg fără semn reprezentabil pe un cuvînt scurt se consideră
de asemenea de tip long.
O constantă întreagă devine negativă dacă i se aplică operatorul
unar de negativare ’-’.
__________________________________________________________________________
11
O constantă întreagă zecimală urmată imediat de litera u sau U
este o constantă de tip întreg fără semn. Litera u sau U poate fi
precedată de litera l sau L.
Exemplu: 123lu.
Constante flotante
O constantă flotantă constă dintr-o parte întreagă, un punct
zecimal, o parte fracţionară, litera e sau E şi opţional, un exponent
care este un întreg cu semn. Partea întreagă şi partea fracţionară sînt
constituite din cîte o succesiune de cifre. Într-o constantă flotantă, atît
partea întreagă cît şi partea fracţionară pot lipsi dar nu ambele; de
asemenea poate lipsi punctul zecimal sau litera e şi exponentul, dar
nu deodată (şi punctul şi litera e şi exponentul).
Exemplu: 123.456e−7 sau 0.12e−3
Orice constantă flotantă se consideră a fi în precizie extinsă.
Constante caracter
O constantă caracter constă dintr-un singur caracter scris între
apostrofuri, de exemplu 'x'. Valoarea unei constante caracter este
valoarea numerică a caracterului, în setul de caractere al
calculatorului. De exemplu în setul de caractere ASCII caracterul
zero sau '0' are valoarea 48 în zecimal, total diferită de valoarea
numerică zero.
Constantele caracter participă la operaţiile aritmetice ca şi oricare
alte numere. De exemplu, dacă variabila c conţine valoarea ASCII a
unei cifre, atunci prin instrucţiunea:
c = c - '0' ;
această valoare se transformă în valoarea efectivă a cifrei.
Anumite caractere negrafice şi caractere grafice ' (apostrof) şi \
(backslash) pot fi reprezentate ca şi constante caracter cu ajutorul aşa
numitor secvenţe de evitare. Secvenţele de evitare oferă de altfel şi
un mecanism general pentru reprezentarea caracterelor mai greu de
introdus în calculator şi a oricăror configuraţii de biţi. Aceste
secvenţe de evitare sînt:
__________________________________________________________________________
12
\n new-line \r carriage return \\ backslash
\t tab orizontal \f form feed \' apostrof
\b backspace \a semnal sonor \" ghilimele
\ddd configuraţie de biţi (ddd)
Aceste secvenţe, deşi sînt formate din mai multe caractere, ele
reprezintă în realitate un singur caracter. Secvenţa '\ddd' unde ddd
este un şir de 1 pînă la 3 cifre octale, generează pe un octet valoarea
caracterului dorit sau a configuraţiei de biţi dorite, date de şirul ddd.
Exemplu: secvenţa '\040' va genera caracterul spaţiu.
Un caz special al acestei construcţii este secvenţa '\0' care
indică caracterul NULL, care este caracterul cu valoarea zero. '\0'
este scris deseori în locul lui 0 pentru a sublinia natura de caracter a
unei anumite expresii.
Cînd caracterul care urmează după un backslash nu este unul
dintre cele specificate, backslash-ul este ignorat. Atragem atenţia că
toate caracterele setului ASCII sînt pozitive, dar o constantă caracter
specificată printr-o secvenţă de evitare poate fi şi negativă, de
exemplu '\377' are valoarea -1.
Constante simbolice
O constantă simbolică este un identificator cu valoare de
constantă. Valoarea constantei poate fi orice şir de caractere introdus
prin construcţia #define (vezi capitolul 8).
Exemplu: #define MAX 1000
După întîlnirea acestei construcţii compilatorul va înlocui toate
apariţiile constantei simbolice MAX cu valoarea 1000.
Numele constantelor simbolice se scriu de obicei cu litere mari
(fără a fi obligatoriu).
__________________________________________________________________________
13
2.4. Şiruri
Un şir este o succesiune de caractere scrise între ghilimele, de
exemplu "ABCD".
Ghilimelele nu fac parte din şir; ele servesc numai pentru
delimitarea şirului. Caracterul " (ghilimele) poate apărea într-un şir
dacă se utilizează secvenţa de evitare \". În interiorul unui şir pot fi
folosite şi alte secvenţe de evitare pentru constante caracter, de
asemenea poate fi folosit caracterul \ (backslash) la sfîrşitul unui
rînd pentru a da posibilitatea continuării unui şir pe mai multe linii,
situaţie în care caracterul \ însuşi va fi ignorat.
Pentru şirul de caractere se mai foloseşte denumirea constantă şir
sau constantă de tip şir.
Cînd un şir apare într-un program C, compilatorul creează un
masiv de caractere care conţine caracterele şirului şi plasează automat
caracterul NULL ('\0') la sfîrşitul şirului, astfel ca programele care
operează asupra şirurilor să poată detecta sfîrşitul acestora. Această
reprezentare înseamnă că, teoretic, nu există o limită a lungimii unui
şir, iar programele trebuie să parcurgă şirul, analizîndu-l pentru a-i
determina lungimea. Se admit şi şiruri de lungime zero.
Tehnic, un şir este un masiv ale cărui elemente sînt caractere. El
are tipul masiv de caractere şi clasa de memorie static (vezi
secţiunea 3.1). Un şir este iniţializat cu caracterele date (vezi
secţiunea 5.4).
La alocare, memoria fizică cerută este cu un octet mai mare decît
numărul de caractere scrise între ghilimele, datorită adăugării
automate a caracterului null la sfîrşitul fiecărui şir.
Exemplu. Funcţia strlen(s) returnează lungimea şirului de
caractere s, excluzînd caracterul terminal null.
int strlen(char s[]) {
/* returnează lungimea şirului */
int i;
i=0;
while (s[i]!='\0')
++i;
__________________________________________________________________________
14
return i;
}
Atragem atenţia asupra diferenţei dintre o constantă caracter şi un
şir care conţine un singur caracter. "x" nu este acelaşi lucru cu 'x'.
'x' este un singur caracter, folosit pentru a genera pe un octet
valoarea numerică a literei x, din setul de caractere al calculatorului.
"x" este un şir de caractere, care în calculator se reprezintă pe doi
octeţi, dintre care primul conţine un caracter (litera x), iar al doilea
caracterul NULL care indică sfîrşitul de şir.
2.5. Operatori
Limbajul C prezintă un număr mare de operatori care pot fi
clasificaţi după diverse criterii. Există operatori unari, binari şi
ternari, operatori aritmetici, logici, operatori pe biţi etc.
Într-un capitol separat vom prezenta clasele de operatori care
corespund la diferite nivele de prioritate.
2.6. Separatori
Un separator este un caracter sau un şir de caractere care separă
unităţile lexicale într-un program scris în C.
Separatorul cel mai frecvent este aşa numitul spaţiu alb (blanc)
care conţine unul sau mai multe spaţii, tab-uri, new-line-uri sau
comentarii.
Aceste construcţii sînt eliminate în faza de analiza lexicală a
compilării.
Dăm mai jos lista separatorilor admişi în limbajul C.
( ) Parantezele mici − încadrează lista de argumente ale unei
funcţii sau delimitează anumite părţi în cadrul expresiilor
aritmetice etc
{ } Acoladele − încadrează instrucţiunile compuse, care
constituie corpul unor instrucţiuni sau corpul funcţiilor
[ ] Parantezele mari − încadrează dimensiunile de masiv sau
__________________________________________________________________________
15
indicii elementelor de masiv
" " Ghilimelele − încadrează un şir de caractere
' ' Apostrofurile − încadrează un singur caracter sau o secvenţă
de evitare
; Punct şi virgula − termină o instrucţiune
/* Slash asterisc − început de comentariu
*/ Asterisc slash − sfîrşit de comentariu
Un comentariu este un şir de caractere care începe cu caracterele
/* şi se termină cu caracterele */.
Un comentariu poate să apară oriunde într-un program, unde
poate apărea un blanc şi are rol de separator; el nu influenţează cu
nimic semnificaţia programului, scopul lui fiind doar o documentare
a programului.
Nu se admit comentarii imbricate.
__________________________________________________________________________
16
3. Variabile
Variabile automatice
Variabilele automatice sînt variabile locale fiecărui bloc
(secţiunea 6.2) sau funcţii (capitolul 7). Ele se declară prin
specificatorul de clasă de memorie auto sau implicit prin context. O
variabilă care apare în corpul unei funcţii sau al unui bloc pentru care
nu s-a făcut nici o declaraţie de clasă de memorie se consideră
implicit de clasă auto.
O variabilă auto este actualizată la fiecare intrare în bloc şi se
distruge în momentul cînd controlul a părăsit blocul. Ele nu îşi reţin
valorile de la un apel la altul al funcţiei sau blocului şi trebuie
iniţializate la fiecare intrare. Dacă nu sînt iniţializate, conţin valori
__________________________________________________________________________
17
reziduale. Nici o funcţie nu are acces la variabilele auto din altă
funcţie. În funcţii diferite pot exista variabile locale cu aceleaşi nume,
fără ca variabilele să aibă vreo legătură între ele.
Variabile externe
Variabilele externe sînt variabile cu caracter global. Ele se
definesc în afara oricărei funcţii şi pot fi apelate prin nume din
oricare funcţie care intră în alcătuirea programului.
În declaraţia de definiţie aceste variabile nu necesită specificarea
nici unei clase de memorie.
La întîlnirea unei definiţii de variabilă externă compilatorul alocă
şi memorie pentru această variabilă.
Într-un fişier sursă domeniul de definiţie şi acţiune al unei
variabile externe este de la locul de declaraţie pînă la sfîrşitul
fişierului.
Aceste variabile există şi îşi păstrează valorile de-a lungul
execuţiei întregului program.
Pentru ca o funcţie să poată utiliza o variabilă externă, numele
variabilei trebuie făcut cunoscut funcţiei printr-o declaraţie.
Declaraţia poate fi făcută fie explicit prin utilizarea specificatorului
extern, fie implicit prin context.
Dacă definiţia unei variabile externe apare în fişierul sursă
înaintea folosirii ei într-o funcţie particulară, atunci nici o declaraţie
ulterioară nu este necesară, dar poate fi făcută.
Dacă o variabilă externă este referită într-o funcţie înainte ca ea
să fie definită, sau dacă este definită într-un fişier sursă diferit de
fişierul în care este folosită, atunci este obligatorie o declaraţie extern
pentru a lega apariţiile variabilelor respective.
Dacă o variabilă externă este definită într-un fişier sursă diferit de
cel în care ea este referită, atunci o singură declaraţie extern dată în
afara oricărei funcţii este suficientă pentru toate funcţiile care
urmează declaraţiei.
Funcţiile sînt considerate în general variabile externe afară de
cazul cînd se specifică altfel.
__________________________________________________________________________
18
Variabilele externe se folosesc adeseori în locul listelor de
argumente pentru a comunica date între funcţii, chiar dacă funcţiile
sînt compilate separat.
Variabile statice
Variabilele statice se declară prin specificatorul de clasă de
memorie static. Aceste variabile sînt la rîndul lor de două feluri:
interne şi externe.
Variabilele statice interne sînt locale unei funcţii şi se definesc în
interiorul unei funcţii, dar spre deosebire de variabilele auto, ele îşi
păstrează valorile tot timpul execuţiei programului. Variabilele statice
interne nu sînt create şi distruse de fiecare dată cînd funcţia este
activată sau părăsită; ele oferă în cadrul unei funcţii o memorie
particulară permanentă pentru funcţia respectivă.
Alte funcţii nu au acces la variabilele statice interne proprii unei
funcţii.
Ele pot fi declarate şi implicit prin context; de exemplu şirurile
de caractere care apar în interiorul unei funcţii cum ar fi argumentele
funcţiei printf (vezi capitolul 11) sînt variabile statice interne.
Variabilele statice externe se definesc în afara oricărei funcţii şi
orice funcţie are acces la ele. Aceste variabile sînt însă globale numai
pentru fişierul sursă în care ele au fost definite. Nu sînt recunoscute
în alte fişiere.
În concluzie, variabila statică este externă dacă este definită în
afara oricărei funcţii şi este static internă dacă este definită în
interiorul unei funcţii.
În general, funcţiile sînt considerate obiecte externe. Există însă
şi posibilitatea să declarăm o funcţie de clasă static. Aceasta face
ca numele funcţiei să nu fie recunoscut în afara fişierului în care a
fost declarată.
__________________________________________________________________________
19
Variabile registru
O variabilă registru se declară prin specificatorul de clasă de
memorie register. Ca şi variabilele auto ele sînt locale unui
bloc sau funcţii şi valorile lor se pierd la ieşirea din blocul sau funcţia
respectivă. Variabilele declarate register indică compilatorului că
variabilele respective vor fi folosite foarte des. Dacă este posibil,
variabilele register vor li plasate de către compilator în regiştrii
rapizi ai calculatorului, ceea ce conduce la programe mai compacte şi
mai rapide.
Variabile register pot fi numai variabilele automatice sau
parametrii formali ai unei funcţii. Practic există cîteva restricţii
asupra variabilelor register care reflectă realitatea hardware-ului
de bază. Astfel:
− numai cîteva variabile din fiecare funcţie pot fi păstrate în regiştri
(de obicei 2 sau 3); declaraţia register este ignorată pentru celelalte
variabile;
− numai tipurile de date int, char şi pointer sînt admise;
− nu este posibilă referirea la adresa unei variabile register.
Tipul caracter
O variabilă de tip caracter se declară prin specificatorul de tip
char. Zona de memorie alocată unei variabile de tip char este de
un octet. Ea este suficient de mare pentru a putea memora orice
caracter al setului de caractere implementate pe calculator.
Dacă un caracter din setul de caractere este memorat într-o
variabilă de tip char, atunci valoarea sa este egală cu codul întreg al
caracterului respectiv. Şi alte cantităţi pot fi memorate în variabile de
tip char, dar implementarea este dependentă de sistemul de calcul.
__________________________________________________________________________
20
Ordinul de mărime al variabilelor caracter este între -128 şi
127. Caracterele setului ASCII sînt toate pozitive, dar o constantă
caracter specificată printr-o secvenţă de evitare poate fi şi negativă,
de exemplu '\377' are valoarea -1. Acest lucru se întîmplă atunci
cînd această constantă apare într-o expresie, moment în care se
converteşte la tipul int prin extensia bitului cel mai din stînga din
octet (datorită modului de funcţionare a instrucţiunilor
calculatorului).
Tipul întreg
Variabilele întregi pozitive sau negative pot fi declarate prin
specificatorul de tip int. Zona de memorie alocată unei variabile
întregi poate fi de cel mult trei dimensiuni.
Relaţii despre dimensiune sînt furnizate de calificatorii short,
long şi unsigned, care pot fi aplicaţi tipului int.
Calificatorul short se referă totdeauna la numărul minim de
octeţi pe care poate fi reprezentat un întreg, în cazul nostru 2.
Calificatorul long se referă la numărul maxim de octeţi pe care
poate fi reprezentat un întreg, în cazul nostru 4.
Tipul int are dimensiunea naturală sugerată de sistemul de
calcul. Scara numerelor întregi reprezentabile în maşină depinde de
asemenea de sistemul de calcul: un întreg poate lua valori între
-32768 şi 32767 (sisteme de calcul pe 16 biţi) sau între
-2147483648 şi 2147483647 (sisteme de calcul pe 32 de biţi).
Calificatorul unsigned alături de declaraţia de tip int
determină ca valorile variabilelor astfel declarate să fie considerate
întregi fără semn.
Numerele de tipul unsigned respectă legile aritmeticii modulo 2n,
unde n este numărul de biţi din reprezentarea unei variabile de tip
int. Numerele de tipul unsigned sînt totdeauna pozitive.
Declaraţiile pentru calificatori sînt de forma:
short int x;
long int y;
unsigned int z;
__________________________________________________________________________
21
Cuvîntul int poate fi omis în aceste situaţii.
Tipuri derivate
În afară de tipurile aritmetice fundamentale, există, în principiu, o
clasă infinită de tipuri derivate, construite din tipurile fundamentale
în următoarele moduri:
__________________________________________________________________________
22
– „masive de T” pentru masive de obiecte de un tip dat T, unde T este
unul dintre tipurile admise;
– „funcţii care returnează T” pentru funcţii care returnează obiecte de
un tip dat T;
– „pointer la T” pentru pointeri la obiecte de un tip dat T;
– „structuri” pentru un şir de obiecte de tipuri diferite;
– „reuniuni” care pot conţine obiecte de tipuri diferite, tratate într-o
singură zonă de memorie.
În general aceste metode de construire de noi tipuri de obiecte
pot fi aplicate recursiv. Amănunte despre tipurile derivate sînt date în
secţiunea 5.3.
__________________________________________________________________________
23
Expresii care nu au sens, ca de exemplu un număr flotant ca indice,
nu sînt admise.
Caractere şi întregi
Un caracter poate apărea oriunde unde un întreg este admis. În
toate cazurile valoarea caracterului este convertită automat într-un
întreg. Deci într-o expresie aritmetică tipul char şi int pot apărea
împreună. Aceasta permite o flexibilitate considerabilă în anumite
tipuri de transformări de caractere. Un astfel de exemplu este funcţia
atoi descrisă în secţiunea 7.5 care converteşte un şir de cifre în
echivalentul lor numeric.
Expresia:
s[i] - '0'
produce valoarea numerică a caracterului (cifră) memorat în ASCII.
Atragem atenţia că atunci cînd o variabilă de tip char este
convertită la tipul int, se poate produce un întreg negativ, dacă bitul
cel mai din stînga al octetului conţine 1. Caracterele din setul de
caractere ASCII nu devin niciodată negative, dar anumite configuraţii
de biţi memorate în variabile de tip caracter pot apărea ca negative
prin extensia la tipul int.
Conversia tipului int în char se face cu pierderea biţilor de
ordin superior.
Întregii de tip short sînt convertiţi automat la int. Conversia
întregilor se face cu extensie de semn; întregii sînt totdeauna cantităţi
cu semn.
Un întreg long este convertit la un întreg short sau char prin
trunchiere la stînga; surplusul de biţi de ordin superior se pierde.
Conversii flotante
Toate operaţiile aritmetice în virgulă mobilă se execută în
precizie extinsă. Conversia de la float la int se face prin
trunchierea părţii fracţionare. Conversia de la int la float este
acceptată.
__________________________________________________________________________
24
Întregi fără semn
Într-o expresie în care apar doi operanzi, dintre care unul
unsigned iar celălalt un întreg de orice alt tip, întregul cu semn
este convertit în întreg fără semn şi rezultatul este un întreg fără
semn.
Cînd un int trece în unsigned, valoarea sa este cel mai mic
întreg fără semn congruent cu întregul cu semn (modulo 216 sau 232).
Într-o reprezentare la complementul faţă de 2 (deci pentru numere
negative), conversia este conceptuală, nu există nici o schimbare
reală a configuraţiei de biţi.
Cînd un întreg fără semn este convertit la long, valoarea
rezultatului este numeric aceeaşi ca şi a întregului fără semn, astfel
conversia nu face altceva decît să adauge zerouri la stînga.
Conversii aritmetice
Dacă un operator aritmetic binar are doi operanzi de tipuri
diferite, atunci tipul de nivel mai scăzut este convertit la tipul de
nivel mai înalt înainte de operaţie. Rezultatul este de tipul de nivel
mai înalt. Ierarhia tipurilor este următoarea:
– char < short < int < long;
– float < double < long double;
– tip întreg cu semn < tip întreg fără semn;
– tip întreg < virgulă mobilă.
Conversii logice
Expresiile relaţionale de forma i<j şi expresiile logice legate
prin operatorii && şi || sînt definite ca avînd valoarea 1 dacă sînt
adevărate şi 0 dacă sînt false.
__________________________________________________________________________
25
Astfel atribuirea:
d = (c>='0') && (c<='9');
îl face pe d egal cu 1 dacă c este cifră şi egal cu 0 în caz contrar.
Conversii explicite
Dacă conversiile de pînă aici le-am putea considera implicite,
există şi conversii explicite de tipuri pentru orice expresie. Aceste
conversii se fac prin construcţia specială numită cast de forma:
(nume-tip) expresie
În această construcţie expresie este convertită la tipul specificat
după regulile precizate mai sus. Mai precis aceasta este echivalentă
cu atribuirea expresiei respective unei variabile de un tip specificat, şi
această nouă variabilă este apoi folosită în locul întregii expresii. De
exemplu, în expresia:
sqrt((double)n)
se converteşte n la double înainte de a se transmite funcţiei sqrt.
Notăm însă că, conţinutul real al lui n nu este alterat. Operatorul
cast are aceeaşi precedenţă ca şi oricare operator unar.
Expresia constantă
O expresie constantă este o expresie care conţine numai
constante. Aceste expresii sînt evaluate în momentul compilării şi nu
în timpul execuţiei; ele pot fi astfel utilizate în orice loc unde sintaxa
cere o constantă, ca de exemplu:
#define MAXLINE 1000
char line[MAXLINE+1];
__________________________________________________________________________
26
4. Operatori şi expresii
__________________________________________________________________________
27
La fel, un identificator declarat de tip „funcţie care returnează
...”, care nu apare pe poziţie de apel de funcţie este convertit la
„pointer la funcţie care returnează ...”.
O constantă este o expresie-primară. Tipul său poate fi int,
long sau double. Constantele caracter sînt de tip int, constantele
flotante sînt de tip long double.
Un şir este o expresie-primară. Tipul său original este „masiv de
caractere”, dar urmînd aceleaşi reguli descrise mai sus pentru
identificatori, acesta este modificat în „pointer la caracter” şi
rezultatul este un pointer la primul caracter al şirului. Există cîteva
excepţii în anumite iniţializări (vezi paragraful 5.4).
O expresie între paranteze rotunde este o expresie-primară, al
cărei tip şi valoare sînt identice cu cele ale expresiei din interiorul
parantezelor (expresia din paranteze poate fi şi o valoare-stînga).
O expresie-primară urmată de o expresie între paranteze pătrate
este o expresie-primară. Sensul intuitiv este de indexare. De obicei
expresia-primară are tipul „pointer la ...”, expresia-indice are tipul
int, iar rezultatul are tipul „...”. O expresie de forma E1[E2] este
identică (prin definiţie) cu *((E1)+(E2)), unde * este operatorul
de indirectare.
Un apel de funcţie este o expresie-primară. Ea constă dintr-o
expresie-primară urmată de o pereche de paranteze rotunde, care
conţin o listă-expresii separate prin virgule. Lista-expresii constituie
argumentele reale ale funcţiei; această listă poate fi şi vidă. Expresia-
primară trebuie să fie de tipul „funcţie care returnează ...”, iar
rezultatul apelului de funcţie va fi de tipul „...”.
Înaintea apelului, oricare argument de tip float este convertit la
tipul double, oricare argument de tip char sau short este
convertit la tipul int. Numele de masive sînt convertite în pointeri la
începutul masivului. Nici o altă conversie nu se efectuează automat.
Dacă este necesar pentru ca tipul unui argument actual să
coincidă cu cel al argumentului formal, se va folosi un cast (vezi
secţiunea 3.4).
Sînt permise apeluri recursive la orice funcţie.
__________________________________________________________________________
28
O valoare-stînga urmată de un punct şi un identificator este o
expresie-primară. Valoarea-stînga denumeşte o structură sau o
reuniune (vezi capitolul 10) iar identificatorul denumeşte un membru
din structură sau reuniune. Rezultatul este o valoare-stînga care se
referă la membrul denumit din structură sau reuniune.
O expresie-primară urmată de o săgeată (constituită dintr-o
liniuţă şi semnul > urmată de un identificator este o expresie-
primară. Prima expresie trebuie să fie un pointer la o structură sau
reuniune, iar identificatorul trebuie să fie numele unui membru din
structura sau reuniunea respectivă. Rezultatul este o valoare-stînga
care se referă la membrul denumit din structura sau reuniunea către
care indică expresia pointer.
Expresia E1−>E2 este identică din punctul de vedere al
rezultatului cu (*E1). E2
Descriem în continuare operatorii limbajului C împreună cu
expresiile care se pot constitui cu aceşti operatori.
__________________________________________________________________________
29
Operatorul unar * este operatorul de indirectare. Expresia care-l
urmează trebuie să fie un pointer, iar rezultatul este o valoare-stînga
care se referă la obiectul către care indică expresia. Dacă tipul
expresiei este „pointer la ...” atunci tipul rezultatului este „...”. Acest
operator tratează operandul său ca o adresă, face acces la ea şi îi
obţine conţinutul.
Exemplu: instrucţiunea y = *px; atribuie lui y conţinutul
adresei către care indică px.
Operatorul unar & este operatorul de obţinere a adresei unui
obiect sau de obţinere a unui pointer la obiectul respectiv. Operandul
este o valoare-stînga iar rezultatul este un pointer la obiectul referit
de valoarea-stînga. Dacă tipul valorii-stînga este „...” atunci tipul
rezultatului este „pointer la ...”.
Exemplu. Fie x o variabilă de tip int şi px un pointer creat într-
un anumit fel (vezi capitolul 9). Atunci prin instrucţiunea
px = &x;
se atribuie variabilei de tip „pointer la int” px adresa variabilei x;
putem spune acum că px indică spre x. Secvenţa:
px = &x; y = *px;
este echivalentă cu
y = x;
Operatorul & poate fi aplicat numai la variabile şi la elemente de
masiv. Construcţii de forma &(x+1) şi &3 nu sînt admise. De
asemenea nu se admite ca variabila să fie de clasă register.
Operatorul unar & ajută la transmiterea argumentelor de tip
adresă în funcţii.
Operatorul unar - este operatorul de negativare. Operandul său
este o expresie, iar rezultatul este negativarea operandului. În acest
caz sînt aplicate conversiile aritmetice obişnuite. Negativarea unui
întreg de tip unsigned se face scăzînd valoarea sa din 2n, unde n este
numărul de biţi rezervaţi tipului int.
Operatorul unar ! este operatorul de negare logică. Operandul
său este o expresie, iar rezultatul său este 1 sau 0 după cum valoarea
operandului este 0 sau diferită de zero. Tipul rezultatului este int.
__________________________________________________________________________
30
Acest operator este aplicabil la orice expresie de tip aritmetic sau la
pointeri.
Operatorul unar ~ (tilda) este operatorul de complementare la
unu. El converteşte fiecare bit 1 la 0 şi invers. El este un operator
logic pe biţi.
Operandul său trebuie să fie de tip întreg. Se aplică conversiile
aritmetice obişnuite.
Operatorul unar ++ este operatorul de incrementare. Operandul
său este o valoare-stînga. Operatorul produce incrementarea
operandului cu 1. Acest operator prezintă un aspect deosebit deoarece
el poate fi folosit ca un operator prefix (înaintea variabilei: ++n) sau
ca un operator postfix (după variabilă: n++). În ambele cazuri efectul
este incrementarea lui n. Dar expresia ++n incrementează pe n
înainte de folosirea valorii sale, în timp ce n++ incrementează pe n
după ce valoarea sa a fost utilizată. Aceasta înseamnă că în contextul
în care se urmăreşte numai incrementarea lui n, oricare construcţie
poate fi folosită, dar într-un context în care şi valoarea lui n este
folosită ++n şi n++ furnizează două valori distincte.
Exemplu: dacă n este 5, atunci
x = n++ ; atribuie lui x valoarea 5
x = ++n ; atribuie lui x valoarea 6
În ambele cazuri n devine 6.
Rezultatul operaţiei nu este o valoare-stînga, dar tipul său este
tipul valorii-stînga.
Operatorul unar -- este operatorul de decrementare. Acest
operator este analog cu operatorul ++ doar că produce decrementarea
cu 1 a operandului.
Operatorul (nume-tip) este operatorul de conversie de tip. Prin
nume-tip înţelegem unul dintre tipurile fundamentale admise în C.
Operandul acestui operator este o expresie. Operatorul produce
conversia valorii expresiei la tipul denumit. Această construcţie se
numeşte cast.
Operatorul sizeof furnizează dimensiunea în octeţi a
operandului său. Aplicat unui masiv sau structuri, rezultatul este
__________________________________________________________________________
31
numărul total de octeţi din masiv sau structură. Dimensiunea se
determină în momentul compilării, din declaraţiile obiectelor din
expresie. Semantic, această expresie este o constantă întreagă care se
poate folosi în orice loc în care se cere o constantă. Cea mai frecventă
utilizare o are în comunicarea cu rutinele de alocare a memoriei sau
rutinele I/O sistem.
Operatorul sizeof poate fi aplicat şi unui nume-tip între
paranteze. În acest caz el furnizează dimensiunea în octeţi a unui
obiect de tipul indicat.
Construcţia sizeof(nume-tip) este luată ca o unitate, astfel că
expresia
sizeof(nume-tip)-2
este acelaşi lucru cu
(sizeof(nume-tip))-2
__________________________________________________________________________
32
Operatorul binar % furnizează restul împărţirii primei expresii la
cea de a doua. Operanzii nu pot fi de tip float. Restul are totdeauna
semnul deîmpărţitului. Totdeauna (a/b)*b+a%b este egal cu a
(dacă b este diferit de 0). Sînt executate conversiile aritmetice
obişnuite.
__________________________________________________________________________
34
4.7. Operatori de egalitate
Expresie-egalitate:
expresie == expresie
expresie != expresie
Operatorii == (egal cu) şi != (diferit de) sînt analogi cu operatorii
relaţionali, dar precedenţa lor este mai mică. Astfel a<b == c<d
este 1, dacă a<b şi c<d au aceeaşi valoare de adevăr.
& 0 1
0 0 0
1 0 1
Operatorul & este deseori folosit pentru a masca o anumită
mulţime de biţi: de exemplu:
c = n & 0177;
pune pe zero toţi biţii afară de ultimii 7 biţi de ordin inferior ai lui n,
fără a afecta conţinutul lui n.
^ 0 1
0 0 1
1 1 0
| 0 1
0 0 1
1 1 1
Operatorul | este folosit pentru a poziţiona biţi; de exemplu:
x = x | MASK;
pune pe 1 toţi biţii din x care corespund la biţi poziţionaţi pe 1 din
MASK. Se efectuează conversiile aritmetice obişnuite.
__________________________________________________________________________
36
ŞI-logic && garantează o evaluare de la stînga la dreapta; mai mult, al
doilea operand nu este evaluat dacă primul operand este 0.
Operanzii nu trebuie să aibă în mod obligatoriu acelaşi tip, dar
fiecare trebuie să aibă unul dintre tipurile fundamentale sau pointer.
Rezultatul este totdeauna de tip int.
__________________________________________________________________________
37
atribuie lui z. Dacă prima expresie nu este adevărată atunci z ia
valoarea lui b.
Expresia condiţională poate fi folosită peste tot unde sintaxa cere
o expresie.
Dacă este posibil, se execută conversiile aritmetice obişnuite
pentru a aduce expresia a doua şi a treia la un tip comun; dacă ambele
expresii sînt pointeri de acelaşi tip, rezultatul are şi el acelaşi tip;
dacă numai o expresie este un pointer, cealaltă trebuie sa fie
constanta 0, iar rezultatul este de tipul pointerului. Întotdeauna numai
una dintre expresiile a doua şi a treia este evaluată.
Dacă f este flotant şi n întreg, atunci expresia
(h>0)? f : n
este de tip double indiferent dacă n este pozitiv sau negativ.
Parantezele nu sînt necesare deoarece precedenţa operatorului ?:
este mai mică, dar ele pot fi folosite pentru a face expresia
condiţională mai vizibilă.
__________________________________________________________________________
39
4.16. Precedenţa şi ordinea de evaluare
Tabelul de la sfîrşitul acestei secţiuni constituie un rezumat al
regulilor de precedenţă şi asociativitate ale tuturor operatorilor.
Operatorii din aceeaşi linie au aceeaşi precedenţă; liniile sînt
scrise în ordinea descrescătoare a precedenţei, astfel de exemplu
operatorii *, / şi % au toţi aceeaşi precedenţă, care este mai mare
decît aceea a operatorilor + şi -.
După cum s-a menţionat deja, expresiile care conţin unul dintre
operatorii asociativi sau comutativi (*, +, &, ^, |) pot fi rearanjate de
compilator chiar dacă conţin paranteze. În cele mai multe cazuri
aceasta nu produce nici o diferenţă; în cazurile în care o asemenea
diferenţă ar putea apărea pot fi utilizate variabile temporare explicite,
pentru a forţa ordinea de evaluare.
Limbajul C, ca şi multe alte limbaje, nu specifică în ce ordine sînt
evaluaţi operanzii unui operator. De exemplu într-o instrucţiune de
forma:
x = f() + g();
f poate fi evaluată înainte sau după evaluarea lui g; dacă f sau g
alterează o variabilă externă de care cealaltă depinde, x poate
depinde de ordinea de evaluare. Din nou rezultate intermediare
trebuie memorate în variabile temporare pentru a asigura o secvenţă
particulară.
__________________________________________________________________________
40
Operator Asociativitate
() [] -> . stînga la dreapta
! ++ -- - (tip) * & sizeof dreapta la stînga
* / % stînga la dreapta
+ - stînga la dreapta
<< >> stînga la dreapta
< <= > >= stînga la dreapta
== != stînga la dreapta
& stînga la dreapta
^ stînga la dreapta
| stînga la dreapta
&& stînga la dreapta
|| stînga la dreapta
?: dreapta la stînga
= op= dreapta la stînga
, stînga la dreapta
__________________________________________________________________________
41
5. Declaraţii
__________________________________________________________________________
43
Într-o declaraţie poate să apară cel mult un specificator de clasă
de memorie. Dacă specificatorul de clasă lipseşte din declaraţie, el se
consideră implicit auto în interiorul unei funcţii şi definiţie extern în
afara funcţiei. Excepţie fac funcţiile care nu sînt niciodată
automatice. De exemplu liniile:
int sp;
double val[MAXVAL];
care apar într-un program în afara oricărei funcţii, definesc
variabilele externe sp de tip int şi val de tip masiv de double.
Ele determină alocarea memoriei şi servesc de asemenea ca declaraţii
ale acestor variabile în tot restul fişierului sursă. Pe de altă parte
liniile:
extern int sp;
extern double val[];
declară pentru restul fişierului sursă că variabilele sp şi val sînt
externe, sp este de tip int şi val este un masiv de double şi că
ele au fost definite în altă parte, unde li s-a alocat şi memorie. Deci
aceste declaraţii nu creează aceste variabile şi nici nu le alocă
memorie.
__________________________________________________________________________
44
Într-o declaraţie se admite cel mult un specificator de tip, cu
excepţia combinaţiilor amintite mai sus. Dacă specificatorul de tip
lipseşte din declaraţie, el se consideră implicit int.
Specificatorii de structuri şi reuniuni sînt prezentaţi în secţiunea
10.9, iar declaraţiile cu typedef în secţiunea 10.10.
5.3. Declaratori
Lista-declarator care apare într-o declaraţie este o succesiune de
declaratori separaţi prin virgule, fiecare dintre ei putînd avea un
iniţializator.
Declaratorii din lista-declarator sînt identificatorii care trebuie
declaraţi.
Fiecare declarator este considerat ca o afirmaţie care, atunci cînd
apare o construcţie de aceeaşi formă cu declaratorul, produce un
obiect de tipul şi de clasa de memorie indicată. Fiecare declarator
conţine un singur identificator. Gruparea declaratorilor este la fel ca
şi la expresii.
Dacă declaratorul este un identificator simplu, atunci el are tipul
indicat de specificatorul din declaraţie.
Un declarator între paranteze este tot un declarator, dar legătura
declaratorilor complecşi poate fi alterată de paranteze.
Să considerăm acum o declaraţie de forma:
T D1
unde T este un specificator de tip (ca de exemplu int) şi D1 un
declarator. Să presupunem că această declaraţie face ca
identificatorul să aibă tipul „...T” unde „...” este vid dacă D1 este un
identificator simplu (aşa cum tipul lui x în int x este int). Dacă D1
are forma:
*D
atunci tipul identificatorului pe care-l conţine acest declarator este
„pointer la T”.
Dacă D1 are forma:
D()
atunci identificatorul pe care-l conţine are tipul „funcţie care
returnează T”.
__________________________________________________________________________
45
Dacă D1 are forma:
D[expresie-constantă] sau D[]
atunci identificatorul pe care-l conţine are tipul „masiv de T”.
În primul caz expresia constantă este o expresie a cărei valoare
este determinabilă la compilare şi al cărei tip este int. Cînd mai
mulţi identificatori „masiv de T” sînt adiacenţi, se creează un masiv
multidimensional; expresiile constante care specifică marginile
masivelor pot lipsi numai pentru primul membru din secvenţă.
Această omisiune este utilă cînd masivul este extern şi definiţia reală
care alocă memoria este în altă parte (vezi secţiunea 5.1). Prima
expresie constantă poate lipsi de asemenea cînd declaratorul este
urmat de iniţializare. În acest caz dimensiunea este calculată la
compilare din numărul elementelor iniţiale furnizate.
Un masiv poate fi construit din obiecte de unul dintre tipurile de
bază, din pointeri, din reuniuni sau structuri, sau din alte masive
(pentru a genera un masiv multidimensional).
Nu toate posibilităţile admise de sintaxa de mai sus sînt permise.
Restricţiile sînt următoarele: funcţiile nu pot returna masive,
structuri, reuniuni sau funcţii, deşi ele pot returna pointeri la astfel de
obiecte; nu există masive de funcţii, dar pot fi masive de pointeri la
funcţii. De asemenea, o structură sau reuniune nu poate conţine o
funcţie, dar ea poate conţine un pointer la funcţie. De exemplu,
declaraţia
int i, *ip, f(), *fip(), (*pfi)();
declară un întreg i, un pointer ip la un întreg, o funcţie f care
returnează un întreg, o funcţie fip care returnează un pointer la un
întreg, un pointer pfi la o funcţie care returnează un întreg. Prezintă
interes compararea ultimilor doi declaratori.
Construcţia *fip() este *(fip()), astfel că declaraţia
sugerează apelul funcţiei fip şi apoi utilizînd indirectarea prin
intermediul pointerului se obţine un întreg.
În declaratorul (*pfi)(), parantezele externe sînt necesare
pentru arăta că indirectarea printr-un pointer la o funcţie furnizează o
funcţie, care este apoi apelată; ea returnează un întreg.
__________________________________________________________________________
46
Declaraţiile de variabile pot fi explicite sau implicite prin
context. De exemplu declaraţiile:
int a,b,c;
char d, m[100];
specifică un tip şi o listă de variabile. Aici clasa de memorie nu este
declarată explicit, ea se deduce din context. Dacă declaraţia este
făcută în afara oricărei funcţii atunci clasa de memorie este extern;
dacă declaraţia este făcută în interiorul unei funcţii atunci implicit
clasa de memorie este auto.
Variabilele pot fi distribuite în declaraţii în orice mod; astfel
listele le mai sus pot fi scrise şi sub forma:
int a;
int b;
int c;
char d;
char m[100];
Aceasta ultimă formă ocupă mai mult spaţiu dar este mai
convenabilă pentru adăugarea unui comentariu pentru fiecare
declaraţie sau pentru modificări ulterioare.
5.5. Iniţializare
Un declarator poate specifica o valoare iniţială pentru
identificatorul care se declară. Iniţializatorul este precedat de semnul
= şi constă dintr-o expresie sau o listă de valori incluse în acolade.
Iniţializator:
expresie
{listă-iniţializare}
Listă-iniţializare:
expresie
listă-iniţializare, listă-iniţializare
{listă-iniţializare}
Toate expresiile dintr-un iniţializator pentru variabile statice sau
externe trebuie să fie expresii constante (vezi secţiunea 3.4) sau
expresii care se reduc la adresa unei variabile declarate anterior,
posibil offset-ul unei expresii constante. Variabilele de clasă auto sau
register pot fi iniţializate cu expresii oarecare, nu neapărat expresii
constante, care implică constante sau variabile declarate anterior sau
chiar funcţii.
În absenţa iniţializării explicite, variabilele statice şi externe sînt
iniţializate implicit cu valoarea 0. Variabilele auto şi register au valori
iniţiale nedefinite (reziduale).
Pentru variabilele statice şi externe, iniţializarea se face o singură
dată, în principiu înainte ca programul să înceapă să se execute.
Pentru variabilele auto şi register, iniţializarea este făcută
la fiecare intrare în funcţie sau bloc.
Dacă un iniţializator se aplică unui „scalar” (un pointer sau un
obiect de tip aritmetic) el constă dintr-o singură expresie, eventual în
__________________________________________________________________________
48
acolade. Valoarea iniţială a obiectului este luată din expresie; se
efectuează aceleaşi operaţii ca în cazul atribuirii.
Pentru iniţializarea masivelor şi masivelor de pointeri vezi
secţiunea 9.8. Pentru iniţializarea structurilor vezi secţiunea 10.3.
Dacă masivul sau structura conţine sub-masive sau sub-structuri
regula de iniţializare se aplică recursiv la membrii masivului sau
structuri.
5.6. Nume-tip
În cele expuse mai sus furnizarea unui nume-tip a fost necesar în
două contexte:
− pentru a specifica conversii explicite de tip prin intermediul unui
cast (vezi secţiunea 3.4);
− ca argument al lui sizeof (vezi secţiunea 4.2).
Un nume-tip este în esenţă o declaraţie pentru un obiect de acest
tip, dar care omite numele obiectului.
Nume-tip:
specificator-tip declarator-abstract
Declarator-abstract:
vid
(declarator-abstract)
*declarator-abstract
declarator-abstract()
declarator-abstract[expresie-constantă<opt>]
Pentru a evita ambiguitatea, în construcţia:
(declarator-abstract)
declaratorul abstract se presupune a nu fi vid. Cu această restricţie,
este posibil să identificăm în mod unic locul într-un declarator-
abstract, unde ar putea apărea un identificator, dacă această
construcţie a fost un declarator într-o declaraţie. Atunci tipul denumit
este acelaşi ca şi tipul identificatorului ipotetic. De exemplu:
int
int*
__________________________________________________________________________
49
int *[3]
int(*)[3]
int *( )
int(*)()
denumeşte respectiv tipurile int, „pointer la întreg”, „masiv de 3
pointeri la întregi”, „pointer la un masiv de 3 întregi”, „funcţie care
returnează pointer la întreg” şi „pointer la o funcţie care returnează
întreg”.
__________________________________________________________________________
50
6. Instrucţiuni
__________________________________________________________________________
53
` Instrucţiunea după ultimul else se execută în cazul în care nici
o expresie nu a fost adevărată.
Dacă în acest caz nu există nici o acţiune explicită de făcut,
atunci partea
else instrucţiune-4
poate să lipsească.
Funcţia binary din secţiunea 7.5 este un exemplu de decizie
multiplă de ordinul 3.
Pot exista un număr arbitrar de construcţii:
else if (expresie)
instrucţiune
grupate între un if iniţial şi un else final.
Întotdeauna un else se leagă cu ultimul if întîlnit.
6.5. Instrucţiunea do
Format:
do instrucţiune while
(expresie);
__________________________________________________________________________
54
Instrucţiunea se execută repetat pînă cînd valoarea expresiei
devine zero. Testul are loc după fiecare execuţie a instrucţiunii.
__________________________________________________________________________
55
6.7. Instrucţiunea switch
Instrucţiunea switch este o decizie multiplă specială şi
determină transferul controlului unei instrucţiuni sau unui bloc de
instrucţiuni dintr-un şir de instrucţiuni în funcţie de valoarea unei
expresii.
Format:
switch (expresie) instrucţiune
Expresia este supusă la conversiile aritmetice obişnuite dar
rezultatul evaluării trebuie să fie de tip int.
Fiecare instrucţiune din corpul instrucţiunii switch poate fi
etichetată cu una sau mai multe prefixe case astfel:
case expresie-constantă:
unde expresie-constantă trebuie să fie de tip int.
Poate exista de asemenea cel mult o instrucţiune etichetată cu
default:
Cînd o instrucţiune switch se execută, se evaluează expresia
din paranteze şi valoarea ei se compară cu fiecare constantă din
fiecare case.
Dacă se găseşte o constantă case egală cu valoarea expresiei,
atunci se execută instrucţiunea care urmează după case-ul respectiv.
Dacă nici o constantă case nu este egală cu valoarea expresiei şi
dacă există un prefix default, atunci se execută instrucţiunea de
după el, altfel nici o instrucţiune din switch nu se execută.
Prefixele case şi default nu alterează fluxul de control, care
continuă printre astfel de prefixe.
Pentru ieşirea din switch se foloseşte instrucţiunea break
(vezi secţiunea 6.8) sau return (vezi secţiunea 6.10).
De obicei instrucţiunea care constituie corpul unui switch este
o instrucţiune compusă. La începutul acestei instrucţiuni pot apărea şi
declaraţii, dar iniţializarea variabilelor automatice şi registru este
inefectivă.
na = nb = nc = 0;
while (c=s[i++])
__________________________________________________________________________
56
switch (c) {
case '0':
case '1':
case '2':
case '3':
case '4':
case '5':
case '6':
case 'T':
case '8':
case '9':
nc[c-'0']++;
break;
case ' ':
case '\r':
case '\t':
nb++;
break;
default:
na++;
break;
}
printf("cifre: ");
for (i=0; i<10; i++)
printf(" %d",nc[i]);
printf("\nspatii albe: %d, altele: %d\n",
nb,na);
În acest exemplu se parcurg toate caracterele dintr-un şir, se
numără cifrele, spaţiile albe şi alte caractere şi se afişează aceste
numere însoţite de comentarii.
Instrucţiunea while este cea care asigură parcurgerea şirului
pînă la sfîrşit. Pentru fiecare caracter se execută corpul instrucţiunii
while care constă dintr-o singură instrucţiune switch.
Se evaluează expresia întreagă din paranteze (în cazul nostru
caracterul c) şi se compară valoarea sa cu toate constantele-case. În
__________________________________________________________________________
57
momentul cînd avem egalitate se începe execuţia de la case-ul
respectiv.
Afişarea rezultatelor se face prin intermediul instrucţiunii for şi
a funcţiei printf (vezi capitolul 11).
__________________________________________________________________________
63
Pentru a evita orice confuzie se recomandă ca tipul valorii
returnate de funcţie să fie întotdeauna precizat, iar dacă dorim în mod
expres ca funcţia să nu returneze o valoare să folosim tipul void.
De exemplu, funcţia atof(s) din biblioteca asociată
compilatorului converteşte şirul s de cifre în valoarea sa în dublă
precizie. Vom declara funcţia sub forma:
double atof(char s[]);
sau împreună cu alte variabile de tip double:
double sum, atof(char s[]);
Funcţiile nu pot returna masive, structuri, reuniuni sau funcţii.
Dacă o funcţie returnează o valoare de tip char, nu este nevoie
de nici o declaraţie de tip din cauza conversiilor implicite. Totdeauna
tipul char este convertit la int în expresii.
__________________________________________________________________________
66
s[i++]=c;
if (c=='\n') s[i++]=c;
s[i]='\0';
return i;
}
index(char s[], char t[]) {
/* returnează poziţia din şirul s unde începe şirul t, sau −1 */
int i,j,k;
for (i=0; s[i]!='\0'; i++) {
for (j=i, k=0; t[k]!='\0' &&
s[j]==t[k]; j++, k++)
;
if (t[k]=='\0')
return i;
}
return -1;
}
main() {
/* imprimă toate liniile care conţin cuvîntul „the” */
char line [MAXLINE];
while (getline(line, MAXLINE)>0)
if (index(line,"the")>=0)
printf("%s",line);
}
lower(int c) {
if (c>='A' && c<='Z')
return c + 'a' - 'A';
else
return c;
}
__________________________________________________________________________
68
5. Funcţia binary realizează căutarea valorii x într-un masiv
sortat v, care are n elemente.
binary(int x, int v[], int n) {
/* caută x în v0, v1, ..., vn-1 */
int low, high, mid;
low = 0;
high = n - 1;
while (low<=high) {
mid = (low + high) / 2;
if (x < v[mid])
high = mid - 1;
else if (x > v[mid])
low = mid + 1;
else /* s-a găsit o intrare */
return(mid);
}
return -1;
}
Funcţia returnează poziţia lui x (un număr între 0 şi n−1), dacă x
apare în v sau −1 altfel.
Exemplul ilustrează o decizie triplă, dacă x este mai mic, mai
mare sau egal cu elementul din mijlocul şirului v[mid].
__________________________________________________________________________
69
8. Liniile de control ale compilatorului
__________________________________________________________________________
72
verifică dacă identificatorul a fost subiectul unei linii de control de
forma #define.
O linie de control de forma:
#ifndef identificator
verifică dacă identificatorul este nedefinit în preprocesor.
Toate cele trei forme de linii de control precedente pot fi urmate
de un număr arbitrar de linii care, eventual, pot să conţină o linie de
control forma:
#else
şi apoi de o linie de control de forma:
#endif
Dacă condiţia supusă verificării este adevărată, atunci orice linie
între #else şi #endif este ignorată. Dacă condiţia este falsă atunci
toate liniile între testul de verificare şi un #else sau în lipsa unui
#else pînă la #endif sînt ignorate.
Toate aceste construcţii pot fi imbricate.
__________________________________________________________________________
75
9. Pointeri şi masive
__________________________________________________________________________
78
Dacă pa indică un element particular al unui masiv a, atunci prin
definiţie pa+i indică un element cu i poziţii după elementul pe care
îl indică pa, după cum pa-i indică un element cu i poziţii înainte
de cel pe care indică pa. Astfel, dacă variabila pa indică pe a[0]
atunci *(pa+i) se referă la conţinutul lui a[i].
Aceste observaţii sînt adevărate indiferent de tipul variabilelor
din masivul a.
Întreaga aritmetică cu pointeri are în vedere faptul că expresia
pa+i înseamnă de fapt înmulţirea lui i cu lungimea elementului pe
care îl indică pa şi adunarea apoi la pa, obţinîndu-se astfel adresa
elementului de indice i al masivului.
Corespondenţa dintre indexarea într-un masiv şi aritmetica de
pointeri este foarte strînsă. De fapt, o referire la un masiv este
convertită de compilator într-un pointer la începutul masivului.
Efectul este că un nume de masiv este o expresie pointer, deoarece
numele unui masiv este identic cu numele elementului de indice zero
din masiv.
Atribuirea:
pa = &a[0];
este identică cu:
pa = a;
De asemenea, expresiile a[i] şi *(a+i) sînt identice. Aplicînd
operatorul & la ambele părţi obţinem &a[i] identic cu a+i. Pe de
altă parte, dacă pa este un pointer, expresiile pot folosi acest pointer
ca un indice: pa[i] este identic cu *(pa+i). Pe scurt orice
expresie de masiv şi indice poate fi scrisă ca un pointer şi un
deplasament şi invers, chiar în aceeaşi instrucţiune.
Există însă o singură diferenţă între un nume de masiv şi un
pointer la începutul masivului. Un pointer este o variabilă, deci
pa = a şi pa++ sînt instrucţiuni corecte. Dar un nume de masiv
este o constantă şi deci construcţii de forma a = pa, a++ sau
p = &a sînt ilegale.
Cînd se transmite unei funcţii un nume de masiv, ceea ce se
transmite de fapt este adresa primului element al masivului. Aşadar,
un nume de masiv, argument al unei funcţii, este în realitate un
__________________________________________________________________________
79
pointer, adică o variabilă care conţine o adresă. Fie de exemplu
funcţia strlen care calculează lungimea şirului s:
strlen(char *s) { /* returnează lungimea şirului */
int n;
for (n=0; *s!='\0'; s++)
n++;
return n;
}
Incrementarea lui s este legală deoarece s este o variabilă
pointer. s++ nu afectează şirul de caractere din funcţia care apelează
pe strlen, ci numai copia adresei şirului din funcţia strlen.
Este posibil să se transmită unei funcţii, ca argument, numai o
parte a unui masiv, printr-un pointer la începutul sub-masivului
respectiv. De exemplu, dacă a este un masiv, atunci:
f(&a[2])
f(a+2)
transmit funcţiei f adresa elementului a[2], deoarece &a[2] şi
a+2 sînt expresii pointer care, ambele, se referă la al treilea element
al masivului a. În cadrul funcţiei f argumentul se poate declara astfel:
f(int arr[]) { }
sau
f(int *arr) { }
Declaraţiile int arr[] şi int *arr sînt echivalente,
opţiunea pentru una din aceste forme depinzînd de modul în care vor
fi scrise expresiile în interiorul funcţiei.
Testul if (allocp+n<=allocbuf+ALLOCSIZE)
verifică dacă există spaţiu suficient pentru satisfacerea cererii de
alocare a n caractere. Dacă cererea poate fi satisfăcută, alloc revine
cu un pointer la zona de n caractere consecutive. Dacă nu, alloc
trebuie să semnaleze lipsa de spaţiu pe care o face returnînd valoarea
constantei simbolice NULL. Limbajul C garantează că nici un pointer
care indică corect o dată nu va conţine zero, prin urmare o revenire
cu valoarea zero poate fi folosită pentru semnalarea unui eveniment
anormal (în cazul nostru, lipsa de spaţiu). Atribuirea valorii zero unui
pointer este deci un caz special.
Observăm de asemenea că variabilele allocbuf şi allocp
sînt declarate static cu scopul ca ele să fie locale numai fişierului
sursă care conţine funcţiile alloc şi free.
Exemplul de mai sus demonstrează cîteva din facilităţile
aritmeticii de adrese (pointeri). În primul rînd, pointerii pot fi
comparaţi în anumite situaţii. Dacă p şi q sînt pointeri la membri
unui acelaşi masiv, atunci relaţiile <, <=, >, >=, ==, != sînt
valide. Relaţia p<q, de exemplu, este adevărată dacă p indică un
element mai apropiat de începutul masivului decît elementul indicat
de pointerul q. Comparările între pointeri pot duce însă la rezultate
imprevizibile, dacă ei se referă la elemente aparţinînd la masive
diferite.
Se observă că pointerii şi întregii pot fi adunaţi sau scăzuţi.
Construcţia de forma:
p+n
înseamnă adresa celui de-al n-lea element după cel indicat de p,
indiferent de tipul elementului pe care îl indică p. Compilatorul C
aliniază valoarea lui n conform dimensiunii elementelor pe care le
__________________________________________________________________________
82
indică p, dimensiunea fiind determinată din declaraţia lui p (scara de
aliniere este 1 pentru char, 2 pentru int etc).
Dacă p şi q indică elemente ale aceluiaşi masiv, p-q este
numărul elementelor dintre cele pe care le indică p şi q. Să scriem o
altă versiune a funcţiei strlen folosind această ultimă observaţie:
strlen(char *s) { /* returnează lungimea unui şir */
char *p;
p = s;
while (*p != '\0')
p++;
return p-s;
}
În acest exemplu s rămîne constant cu adresa de început a
şirului, în timp ce p avansează la următorul caracter de fiecare dată.
Diferenţa p-s dintre adresa ultimului element al şirului şi adresa
primului element al şirului indică numărul de elemente.
În afară de operaţiile binare menţionate (adunarea sau scăderea
pointerilor cu întregi şi scăderea sau compararea a doi pointeri),
celelalte operaţii cu pointeri sînt ilegale. Nu este permisă adunarea,
înmulţirea, împărţirea sau deplasarea pointerilor, după cum nici
adunarea lor cu constante de tip double sau float.
Sînt admise de asemenea incrementările şi decrementările
precum şi alte combinaţii ca de exemplu *++p şi *--p.
__________________________________________________________________________
83
Cea mai frecventă apariţie a unei constante şir este ca argument
la funcţii, caz în care accesul la ea se realizează prin intermediul unui
pointer.
În exemplul:
printf("Buna dimineata\n");
funcţia printf primeşte de fapt un pointer la masivul de caractere.
În prelucrarea unui şir de caractere sînt implicaţi numai pointeri,
limbajul C neoferind nici un operator care să trateze şirul de caractere
ca o unitate de informaţie.
Vom prezenta cîteva aspecte legate de pointeri şi masive
analizînd două exemple. Să considerăm pentru început funcţia
strcpy(s,t) care copiază şirul t peste şirul s. O primă versiune
a programului ar fi următoarea:
strcpy(char s[], char t[]) {/* copiază t peste s */
int t;
i = 0;
while ((s[i]=t[i]) != '\0')
i++;
}
O a doua versiune cu ajutorul pointerilor este următoarea:
strcpy(char *s, char *t) {
/* versiune cu pointeri */
while ((*s++=*t++) != '\0') ;
}
Această versiune cu pointeri modifică prin incrementare pe s şi t
în partea de test. Valoarea lui *t++ este caracterul indicat de
pointerul t, înainte de incrementare. Notaţia postfix ++ asigură că t
va fi modificat după depunerea conţinutului indicat de el, la vechea
poziţie a lui s, după care şi s se incrementează. Efectul este că se
copiază caracterele şirului t în şirul s pînă la caracterul terminal
'\0' inclusiv.
__________________________________________________________________________
84
Am mai putea face o observaţie legată de redundanţa comparării
cu caracterul '\0', redundanţă care rezultă din structura
instrucţiunii while.
Şi atunci forma cea mai prescurtată a funcţiei strcpy(s,t)
este:
strcpy(char *s, char *t) {
while (*s++ = *t++) ;
}
Să considerăm, ca al doilea exemplu, funcţia strcmp(s,t)
care compară caracterele şirurilor s şi t şi returnează o valoare
negativă, zero sau pozitivă, după cum şirul s este lexicografic mai
mic, egal sau mai mare ca şirul t. Valoarea returnată se obţine prin
scăderea caracterelor primei poziţii în care s şi t diferă.
O primă versiune a funcţiei strcmp(s,t) este următoarea:
strcmp(char s, char t) {/* compară şirurile s şi t */
int i;
i = 0;
while (s[i]==t[i])
if (s[i++]=='\0')
return 0;
return s[i]-t[i];
}
Versiunea cu pointeri a aceleiaşi funcţii este:
strcmp(char *s, char *t) {
for (; *s==*t; s++,t++)
if (*s=='\0')
return 0;
return *s-*t;
}
În final prezentăm funcţia strsav care copiază un şir dat prin
argumentul ei într-o zonă obţinută printr-un apel la funcţia alloc.
Ea returnează un pointer la şirul copiat sau NULL, dacă nu mai există
suficient spaţiu pentru memorarea şirului.
__________________________________________________________________________
85
char *strsav(char *s) { /* copiază şirul s */
char *p;
p = alloc(strlen(s)+1);
if (p!=NULL)
strcpy(p,s);
return p;
}
__________________________________________________________________________
86
În limbajul C, prin definiţie, un masiv cu două dimensiuni este în
realitate un masiv cu o dimensiune ale cărui elemente sînt masive. De
aceea indicii se scriu sub forma [i][j] în loc de [i,j], cum se
procedează în cele mai multe limbaje. Un masiv bidimensional poate
fi tratat în acelaşi fel ca şi în celelalte limbaje, în sensul că elementele
sînt memorate pe linie, adică indicele cel mai din dreapta variază cel
mai rapid.
Un masiv se iniţializează cu ajutorul unei liste de iniţializatori
închişi între acolade; fiecare linie a unui masiv bidimensional se
iniţializează cu ajutorul unei subliste de iniţializatori. În cazul
exemplului nostru, masivul day_tab începe cu o coloană zero,
pentru ca numerele lunilor să fie între 1 şi 12 şi nu între 0 şi 11,
aceasta pentru a nu face modificări în calculul indicilor.
Şi atunci funcţiile care realizează conversiile cerute de exemplul
nostru sînt:
day_of_year (int year, int month, int day)
{ /* ziua anului din lună şi zi */
int i, leap;
leap = (year%4==0) && (year%100!=0) ||
(year%400==0);
for (i=1; i<month; i++)
day += day_tab[leap][i];
return day;
}
Deoarece variabila leap poate lua ca valori numai zero sau unu
după cum expresia:
(year%4==0) && (year%100!=0) ||
(year%400==0)
este falsă sau adevărată, ea poate fi folosită ca indice de linie în
tabelul day_tab care are doar două linii în exemplul nostru.
month_day(int year, int yearday,
int *pmonth, int *pday) {
int i,leap;
leap = (year%4==0) && (year%100!=0) ||
__________________________________________________________________________
87
(year%400==0);
for (i=1; yearday>day_tab[leap][i]; i++)
yearday -= day_tab[leap][i];
*pmonth = i;
*pday = yearday;
}
Deoarece această ultimă funcţie returnează două valori,
argumentele lună şi zi vor fi pointeri.
Exemplu: month_day(1984,61,&m,&d) va încărca pe m cu
3, iar pe d cu 1 (adică 1 martie).
Dacă un masiv bidimensional trebuie transmis unei funcţii,
declaraţia argumentelor funcţiei trebuie să includă dimensiunea
coloanei. Dimensiunea liniei nu este necesar să apară în mod
obligatoriu, deoarece ceea ce se transmite de fapt este un pointer la
masive de cîte 13 întregi, în cazul exemplului nostru. Astfel, dacă
masivul day_tab trebuie transmis unei funcţii f, atunci declaraţia
lui f poate fi:
f(int (*day_tab)[13])
unde declaraţia (*day_tab)[13]) indică faptul că argumentul lui
f este un pointer la un masiv de 13 întregi.
În general deci, un masiv d-dimensional a[i][j]...[p] de
rangul i*j*...*p este un masiv d−1 - dimensional de rangul
j*k*...*p ale cărui elemente, fiecare, sînt masive d−2 -
dimensionale de rang k*...*p ale cărui elemente, fiecare, sînt
masive d−3 - dimensionale ş.a.m.d. Oricare dintre expresiile a[i],
a[i][j]..., a[i][j]... [p] pot apărea în expresii. Prima are
tipul masiv, ultima are tipul int, de exemplu, dacă masivul este de
tipul int. Vom mai reveni asupra acestei probleme cu detalii.
__________________________________________________________________________
89
Rutina de intrare readlines trebuie să memoreze caracterele
fiecărei linii şi să construiască un masiv de pointeri la liniile citite.
Trebuie, de asemenea, să numere liniile din textul de la intrare,
deoarece această informaţie este necesară în procesul de sortare şi de
imprimare. Întrucît funcţia de intrare poate prelucra numai un număr
finit de linii de intrare, ea poate returna un număr ilegal, cum ar fi −1,
spre a semnala că numărul liniilor de intrare este prea mare pentru
capacitatea de care dispune.
Atunci funcţia readlines care citeşte liniile textului de la
intrare este următoarea:
#define MAXLEN 1000
#define NULL 0
#define EOF -1
readlines(char *lineptr[], int maxlines) {
/* citeşte liniile */
int len,nlines;
char *p,*alloc(),line[MAXLEN];
nlines = 0;
while ((len=getline(line,MAXLEN))>0)
if (nlines>=maxlines)
return -1;
else if ((p=alloc(len))==NULL)
return -1;
else {
line[len-1] = '\0';
strcpy(p,line);
lineptr[nlines++] = p;
}
return nlines;
}
Instrucţiunea line[len-1] = '\0'; şterge caracterul <
LF> de la sfîrşitul fiecărei linii ca să nu afecteze ordinea în care sînt
sortate liniile şi depune în locul lui caracterul '\0' ca marcă de
sfîrşit de şir.
__________________________________________________________________________
90
Rutina care tipăreşte liniile în noua lor ordine este writelines
şi are următorul cod:
writelines(char *lineptr[], int nlines) {
/* scrie liniile sortate */
int i;
for (i=0; i<nlines; i++)
printf("%s\n",lineptr[i]);
}
Declaraţia nouă care apare în aceste programe este:
char *lineptr[LINES];
care indică faptul că lineptr este un masiv de LINES elemente,
fiecare element al masivului fiind un pointer la un caracter. Astfel
lineptr[i] este un pointer la un caracter, iar *lineptr[i] permite
accesul la caracterul respectiv.
Deoarece lineptr este el însuşi un masiv, care se transmite ca
argument funcţiei writelines, el va fi tratat ca un pointer (vezi
secţiunea 9.3) şi atunci funcţia writelines mai poate fi scrisă şi
astfel:
writelines(char *lineptr[], int nlines) {
while (--nlines>=0)
printf("%s\n",*lineptr++);
}
În funcţia printf, lineptr indică iniţial prima linie de
imprimat; fiecare incrementare avansează pe *lineptr la
următoarea linie de imprimat, în timp ce nlines se micşorează
după fiecare tipărire a unei linii cu 1.
Funcţia care realizează sortarea efectivă a liniilor se bazează pe
algoritmul de înjumătăţire şi are următorul cod:
#define NULL 0
#define LINES 100 /* nr maxim de linii de sortat */
sort(char *v[], int n) {
/* sortează şirurile v0, v1, ... vn-1 în ordine crescătoare */
int gap,i,j;
__________________________________________________________________________
91
char *temp;
for (gap=n/2; gap>0; gap/=2)
for (i=gap; i<n; i++)
for (j=i-gap; j>=0; j-=gap) {
if (strcmp(v[j],v[j+gap])<=0)
break;
temp = v[j];
v[j] = v[j+gap];
v[j+gap] = temp;
}
}
Deoarece fiecare element al masivului v (care este de fapt
masivul lineptr) este un pointer la primul caracter al unei linii,
variabila temp va fi şi ea un pointer la un caracter, deci operaţiile de
atribuire din ciclu după variabila j sînt admise şi ele realizează
reinversarea pointerilor la linii dacă ele nu sînt în ordinea cerută.
Să reţinem deci următoarele lucruri legate de masive şi pointeri.
De cîte ori apare într-o expresie un identificator de tip masiv el este
convertit într-un pointer la primul element al masivului. Prin
definiţie, operatorul de indexare [] este interpretat astfel încît
E1[E2] este identic cu *((E1)+(E2)). Dacă E1 este un masiv, iar
E2 un întreg, atunci E1[E2] se referă la elementul de indice E2 al
masivului E1.
O regulă corespunzătoare se aplică şi masivelor multi-
dimensionale. Dacă E1 este un masiv d-dimensional, de rangul
i*j*...*k, atunci ori de cîte ori e1 apare într-o expresie, e1 va fi
convertit într-un pointer la un masiv d−1 - dimensional de rangul
j*...*k, ale cărui elemente sînt masive. Dacă operatorul * se
aplică acestui pointer, rezultatul este masivul d−1 - dimensional, care
se va converti imediat într-un pointer la un masiv d−2 - dimensional
ş.a.m.d. Raţionamentul se poate aplica în mod inductiv pînă cînd, în
final, ca urmare a aplicării operatorului * se obţine ca rezultat un
întreg, de exemplu, dacă masivul a fost declarat de tipul int.
Să considerăm, de exemplu, masivul:
__________________________________________________________________________
92
int x[3][5];
x este un masiv de întregi, de rangul 3*5. Cînd x apare într-o
expresie, el este convertit într-un pointer la (primul din cele trei)
masive de 5 întregi.
__________________________________________________________________________
96
elemente, altul un masiv de două elemente şi altul de exemplu poate
să nu indice nici un masiv.
Cu toate că problema prezentată în acest paragraf am descris-o în
termenii întregilor, ea este cel mai frecvent utilizată în memorarea
şirurilor de caractere de lungimi diferite (ca în funcţia month_name
prezentată mai sus).
__________________________________________________________________________
98
Această versiune arată că argumentul funcţiei printf poate fi o
expresie ca oricare alta, cu toate că acest mod de utilizare nu este
foarte frecvent.
Ca un al doilea exemplu, să reconsiderăm programul din
secţiunea 7.5, care imprimă fiecare linie a unui text care conţine un
şir specificat de caractere (schemă).
Dorim acum ca această schemă să poată fi modificată dinamic,
de la execuţie la execuţie. Pentru aceasta o specificăm printr-un
argument în linia de comandă.
Şi atunci programul care caută schema dată de primul argument
al liniei de comandă este:
#define MAXLINE 1000
main(int argc, char *argv[ ]) {
/* găseşte schema din primul argument */
char line[MAXLINE];
if (argc!=2)
printf("Linia de comanda eronata\n");
else
while (getline(line,MAXLINE)>0)
if (index(line,argv[1])>=0)
printf("%s",line);
}
unde linia de comandă este de exemplu: "find limbaj" în care
"find" este numele programului, iar "limbaj" este schema
căutată. Rezultatul va fi imprimarea tuturor liniilor textului de intrare
care conţin cuvîntul "limbaj".
Să elaborăm acum modelul de bază, legat de linia de comandă şi
argumentele ei.
Să presupunem că dorim să introducem în linia de comandă două
argumente opţionale: unul care să tipărească toate liniile cu excepţia
acelora care conţin schema, şi al doilea care să preceadă fiecare linie
tipărită cu numărul ei de linie.
O convenţie pentru programele scrise în limbajul C este ca
argumentele dintr-o linie de comandă care încep cu un semn '-' să
introducă un parametru opţional. Dacă alegem, de exemplu, -x
__________________________________________________________________________
99
pentru a indica „cu excepţia” şi -n pentru a cere „numărarea
liniilor”, atunci comanda:
find -x -n la
avînd intrarea:
la miezul stinselor lumini
s-ajung victorios,
la temelii, la rădăcini,
la măduvă, la os.
va produce tipărirea liniei a doua, precedată de numărul ei, deoarece
această linie nu conţine schema "la".
Argumentele opţionale sînt permise în orice ordine în linia de
comandă. Analizarea şi prelucrarea argumentelor unei linii de
comandă trebuie efectuată în funcţia principală main, iniţializînd în
mod corespunzător anumite variabile. Celelalte funcţii ale
programului nu vor mai ţine evidenţa acestor argumente.
Este mai comod pentru utilizator dacă argumentele opţionale sînt
concatenate, ca în comanda:
find -xn la
Caracterele 'x' respectiv 'n' indică doar absenţa sau prezenţa
acestor opţiuni (switch) şi nu sînt tratate din punct de vedere al
valorii lor.
Fie programul care caută schema "la" în liniile de la intrare şi
le tipăreşte pe acelea, care nu conţin schema, precedate de numărul
lor de linie. Programul tratează corect, atît prima formă a liniei de
comandă cît şi a doua.
__________________________________________________________________________
101
9.11. Pointeri la funcţii
În limbajul C o funcţie nu este o variabilă, dar putem defini un
pointer la o funcţie, care apoi poate fi prelucrat, transmis unor alte
funcţii, introdus într-un masiv şi aşa mai departe. Relativ la o funcţie
se pot face doar două operaţii: apelul ei şi considerarea adresei ei.
Dacă numele unei funcţii apare într-o expresie, fără a fi urmat
imediat de o paranteză stîngă, deci nu pe poziţia unui apel la ea,
atunci se generează un pointer la această funcţie. Pentru a transmite o
funcţie unei alte funcţii, ca argument, se poate proceda în felul
următor:
int f();
g(f);
unde funcţia f este un argument pentru funcţia g. Definiţia funcţiei g
va fi:
g(int(*funcpt) ()) {
(*funcpt)();
}
Funcţia f trebuie declarată explicit în rutina apelantă (int
f();), deoarece apariţia ei în g(f) nu a fost urmată de paranteză
stîngă ’(’. În expresia g(f) f nu apare pe poziţia de apel de funcţie.
În acest caz, pentru argumentul funcţiei g se generează un pointer la
funcţia f. Deci g apelează funcţia f printr-un pointer la ea.
Declaraţiile din funcţia g trebuie studiate cu grijă.
int (*funcpt)();
spune că funcpt este un pointer la o funcţie care returnează un
întreg. Primul set de paranteze este necesar, deoarece fără el
int *funcpt();
înseamnă că funcpt este o funcţie care returnează un pointer la un
întreg, ceea ce este cu totul diferit faţă de sensul primei expresii.
Folosirea lui funcpt în expresia:
(*funcpt)();
indică faptul că funcpt este un pointer la o funcţie, *funcpt este
funcţia, iar (*funcpt)() este apelul funcţiei.
O formă echivalentă simplificată de apel este următoarea:
funcpt();
__________________________________________________________________________
102
Ca un exemplu, să considerăm procedura de sortare a liniilor de
la intrare, descrisă în secţiunea 9.7, dar modificată în sensul ca dacă
argumentul opţional -n apare în linia de comandă, atunci liniile se
vor sorta nu lexicografic ci numeric, liniile conţinînd grupe de
numere.
O sortare constă adesea din trei părţi: o comparare care determină
ordinea oricărei perechi de elemente, un schimb care inversează
ordinea elementelor implicate şi un algoritm de sortare care face
comparările şi inversările pînă cînd elementele sînt aduse în ordinea
cerută. Algoritmul de sortare este independent de operaţiile de
comparare şi inversare, astfel încît transmiţînd diferite funcţii de
comparare şi inversare funcţiei de sortare, elementele de intrare se
pot aranja după diferite criterii.
Compararea lexicografică a două linii se realizează prin funcţiile
strcmp şi swap. Mai avem nevoie de o rutină numcmp care să
compare două linii pe baza valorilor numerice şi care să returneze
aceiaşi indicatori ca şi rutina strcmp.
Declarăm aceste trei funcţii în funcţia principală main, iar
pointerii la aceste funcţii îi transmitem ca argumente funcţiei sort,
care la rîndul ei va apela aceste funcţii prin intermediul pointerilor
respectivi.
Funcţia principală main va avea atunci următorul cod:
#define LINES 100 /* nr maxim de linii de sortat */
main (int argc, char *argv[]) {
char *lineptr[LINES]; /* pointeri la linii text */
int nlines; /* număr de linii citite */
int strcmp(), numcmp(); /* funcţii de comparare */
int swap (); /* funcţia de inversare */
int numeric;
numeric = 0; /* 1 dacă sort numeric */
if (argc>1 && argv[1][0]=='-' &&
argv[1][1]=='n')
numeric = 1;
if ((nlines=readlines(lineptr,LINES))>=0)
__________________________________________________________________________
103
{
if (numeric)
sort(lineptr,nlines,numcmp,swap);
else
sort(lineptr,nlines,strcmp,swap);
writelines (lineptr,nlines);
}
else
printf
("Nr de linii de intrare prea mare\n");
}
În apelul funcţiei sort, argumentele strcmp, numcmp şi
swap sînt adresele funcţiilor respective. Deoarece ele au fost
declarate funcţii care returnează un întreg, operatorul ’&’ nu este
necesar să preceadă numele funcţiilor, compilatorul fiind cel care
gestionează transmiterea adreselor funcţiilor.
Funcţia sort care aranjează liniile în ordinea crescătoare se va
modifica astfel:
sort(char *v[], int n, int (*comp)(),
int (*exch)()) { /* sortează v0, v1, ... , vn−1 */
int gap,i,j;
for (gap=n/2; gap>0; gap/=2)
for (i=gap; i<n; i++)
for (j=i-gap; j>=0; j-=gap) {
if (comp(v[j],v[j+gap])<=0)
break;
exch(v+j,v+j+gap);
}
}
Să studiem declaraţiile din această funcţie.
int(*comp)(), (*exch)();
indică faptul că comp şi exch sînt pointeri la funcţii care returnează
un întreg (primul set de paranteze este necesar).
if (comp(v[j],v[j+gap])<=0)
__________________________________________________________________________
104
înseamnă apelul funcţiei comp (adică strcmp sau numcmp),
deoarece comp este un pointer la funcţie, *comp este funcţia, iar
comp(v[j],v[j+gap])
este apelul funcţiei.
exch(v+j,v+j+gap)
este apelul funcţiei swap, de inversare a două linii, inversare care
realizează interschimbarea adreselor liniilor implicate (vezi secţiunea
9.2). Funcţia numcmp este următoarea:
numcmp(char *s1, char *s2) {
/* compară s1 şi s2 numeric */
double atof(),v1,v2;
v1 = atof(s1);
v2 = atof(s2);
if (v1<v2)
return -1;
else
if (v1>v2)
return 1;
else
return 0;
}
Pentru ca programul nostru să fie complet să mai prezentăm şi
codul funcţiei swap, care schimbă între ei pointerii a două linii.
swap(char *px[], char *py[]) {
char *temp;
temp = *px;
*px = *py;
*py = temp;
}
__________________________________________________________________________
105
10. Structuri şi reuniuni
__________________________________________________________________________
106
Elementele sau variabilele menţionate într-o structură se numesc
membri ai structurii. Un membru al structurii sau o etichetă şi o
variabilă oarecare, nemembru, pot avea acelaşi nume fără a genera
conflicte, deoarece ele vor fi întotdeauna deosebite una de alta din
context.
Acolada dreaptă care încheie o listă de membri ai unei structuri
poate fi urmată de o listă de variabile, la fel ca şi în cazul tipurilor de
bază. De exemplu:
struct {. . .} x,y,z;
este din punct de vedere sintactic analog cu:
int x,y,z;
în sensul că fiecare declaraţie declară pe x, y şi z ca variabile de
tipul numit (structură în primul caz şi întreg în al doilea) şi cauzează
alocarea de spaţiu pentru ele.
O declaraţie de structură care nu este urmată de o listă de
variabile nu alocă memorie; ea descrie numai un şablon, o formă de
structură. Dacă structura este marcată sau etichetată, atunci marcajul
ei poate fi folosit mai tîrziu pentru definirea unor alte variabile de tip
structură, cu acelaşi şablon ca structura marcată. De exemplu, fiind
dată declaraţia:
struct date d;
ea defineşte variabila d, ca o structură de acelaşi fel (şablon) ca
structura date.
O structură externă sau statică poate fi iniţializată, ataşînd după
definiţia ei o listă de iniţializatori pentru componente, de exemplu:
struct date d = {4,7,1984,185,"iulie"};
Un membru al unei structuri este referit printr-o expresie de
forma:
nume-structură.membru
în care operatorul membru de structură ’.’ leagă numele membrului
de numele structurii. Ca exemplu fie atribuirea:
leap = (d.year%4==0) && (d.year%100!=0)
|| (d.year%400==0);
sau verificarea numelui lunii:
if (strcmp(d.mon_name,"august")==0) ...
__________________________________________________________________________
107
Structurile pot fi imbricate; o înregistrare de stat de plată, de
exemplu, poate fi de următoarea formă:
struct person {
char name[NAMESIZE];
char address[ADRSIZE];
long zipcode;
long ss_number;
double salary;
struct date birthdate;
struct date hiredate;
};
Structura person conţine două structuri de şablon date.
Declaraţia:
struct person emp;
defineşte şi alocă o structură cu numele emp de acelaşi şablon ca şi
person. Atunci:
emp.birthdate.month
se referă la luna de naştere. Operatorul de membru de structură ’.’
este asociativ de la stînga la dreapta.
__________________________________________________________________________
108
Ca un exemplu, să rescriem programul de conversie a datei, care
calculează ziua anului, din lună şi zi.
day_of_year(struct date *pd) {
/* calculul zilei anului */
int i, day, leap;
day = pd->day;
leap = (pd->year%4==0) &&
(pd->year%100!==0) ||
(pd->year%400==0);
for (i=1; i<pd->month; i++)
day += day_tab[leap][i];
return day;
}
Declaraţia:
struct date * pd;
indică faptul că pd este un pointer la o structură de şablonul lui date.
Notaţia:
pd->year
indică faptul că se referă membrul "year" al acestei structuri. În
general, dacă p este un pointer la o structură p->membru-structură
se referă la un membru particular (operatorul ’->’ se formează din
semnul minus urmat de semnul mai mare).
Deoarece pd este pointer la o structură, membrul year poate fi de
asemenea referit prin:
(*pd).year
Notaţia "->" se impune ca un mod convenabil de prescurtare. În
notaţia (*pd).year, parantezele sînt necesare deoarece precedenţa
operatorului membru de structură ’.’ este mai mare decît cea a
operatorului *.
Ambii operatori ’.’ şi ’->’ sînt asociativi de la stînga la dreapta,
astfel încît:
p->q->membru
emp.birthdate.month
sînt de fapt:
__________________________________________________________________________
109
(p->q)->membru
(emp.birthdate).month
Operatorii ’->’ şi ’.’ ai structurilor, împreună cu () pentru
listele de argumente şi [] pentru indexare se găsesc în vîrful listei de
precedenţă (vezi secţiunea 4.16), fiind din acest punct de vedere
foarte apropiaţi. Astfel, fiind dată declaraţia:
struct {
int x;
int *y;} *p;
unde p este un pointer la o structură, atunci expresia:
++p->x
incrementează pe x, nu pointerul p, deoarece operatorul ’->’ are o
precedenţă mai mare decît ’++’. Parantezele pot fi folosite pentru a
modifica ordinea operatorilor dată de precedenţa. Astfel:
(++p)->x
incrementează mai întîi pe p şi apoi accesează elementul x, din
structura nou pointată.
În expresia (p++)->x se accesează mai întîi x, apoi se
incrementează pointerul p.
În mod analog, *p->y indică conţinutul adresei pe care o indică
y. Expresia *p->y++ accesează mai întîi ceea ce indică y şi apoi
incrementează pe y. Expresia (*p->y)++ incrementează ceea ce
indică y. Expresia *p++->y accesează ceea ce indică y şi apoi
incrementează pointerul p.
__________________________________________________________________________
116
deoarece adunarea a doi pointeri este o operaţie ilegală, nedefinită.
Această instrucţiune trebuie modificată în:
mid = low + (high-low) / 2
care face ca mid să pointeze elementul de la jumătatea distanţei
dintre low şi high.
Să mai observăm iniţializarea pointerilor low şi high, care este
perfect legală, deoarece este posibilă iniţializarea unui pointer cu o
adresă a unui element deja definit.
În funcţia main avem următorul ciclu:
for(p=keytab; p<keytab+NKEYS; p++)...
Dacă p este un pointer la un masiv de structuri, orice operaţie
asupra lui p ţine cont de dimensiunea unei structuri, astfel încît p++
incrementează pointerul p la următoarea structură din masiv, adunînd
la p dimensiunea corespunzătoare a unei structuri. Acest lucru nu
înseamnă că dimensiunea structurii este egală cu suma dimensiunilor
membrilor ei deoarece din cerinţe de aliniere a unor membri se pot
genera „goluri” într-o structură.
În sfîrşit, cînd o funcţie returnează un tip complicat şi are o listă
complicată de argumente, ca în:
struct key *binary(char *word, struct key
tab, int n)
funcţia poate fi mai greu vizibilă şi detectabilă cu un editor de texte.
Din acest motiv, se poate opta şi pentru următoarea formă:
struct key *binary(word,tab,n)
char *word; struct key tab; int n;
unde înainte de acolada de deschidere se precizează tipul fiecărui
parametru.
Alegeţi forma care vă convine şi care vi se pare mai sugestivă.
__________________________________________________________________________
117
căutare liniară pentru fiecare cuvînt, pe măsura apariţiei lui pentru a
vedea dacă a mai fost prezent sau nu, pentru că timpul de execuţie al
programelor ar creşte pătratic cu numărul cuvintelor de la intrare.
Un mod de a organiza datele pentru a lucra eficient cu o listă de
cuvinte arbitrare este de a păstra mulţimea de cuvinte, tot timpul
sortată, plasînd fiecare nou cuvînt din intrare pe o poziţie
corespunzătoare, relativ la intrările anterioare. Dacă am realiza acest
lucru prin deplasarea cuvintelor într-un masiv liniar, programul ar
dura, de asemenea, foarte mult. De aceea, pentru rezolvarea eficientă
a acestei probleme vom folosi o structură de date numită arbore binar.
Fiecare nod al arborelui va reprezenta un cuvînt distinct din
intrare şi va conţine următoarea informaţie:
- un pointer la cuvînt;
- un contor pentru numărul de apariţii;
- un pointer la descendentul stîng al cuvîntului;
- un pointer la descendentul drept al cuvîntului. Nici un nod al
arborelui nu va avea mai mult decît doi descendenţi dar poate avea un
descendent sau chiar nici unul.
Arborele se construieşte astfel încît pentru orice nod, sub-
arborele stîng al său conţine numai cuvintele care sînt mai mici decît
cuvîntul din nod, iar sub-arborele drept conţine numai cuvinte, care
sînt mai mari decît cuvîntul din nod, compararea făcîndu-se din punct
de vedere lexicografic.
Pentru a şti dacă un cuvînt nou din intrare există deja în arbore se
porneşte de la nodul rădăcină şi se compară noul cuvînt cu cuvîntul
memorat în nodul rădăcină. Dacă ele coincid se incrementează
contorul de numărare a apariţiilor pentru nodul rădăcină şi se va citi
un nou cuvînt din intrare.
Dacă noul cuvînt din intrare este mai mic decît cuvîntul memorat
în nodul rădăcină, căutarea continuă cu descendentul stîng, altfel se
investighează descendentul drept. Dacă nu există nici un descendent
pe direcţia cerută, noul cuvînt nu există în arbore şi va fi inserat pe
poziţia descendentului corespunzător. Se observă că acest proces de
căutare este recursiv, deoarece căutarea din fiecare nod utilizează o
căutare într-unul dintre descendenţii săi.
__________________________________________________________________________
118
Prin urmare se impune de la sine ca rutinele de inserare în arbore
şi de imprimare să fie recursive.
Revenind la descrierea unui nod, el apare ca fiind o structură cu
patru componente:
struct tnode { /* nodul de bază */
char *word; /* pointer la cuvînt */
int count; /* numărător de apariţii */
struct tnode *left; /* descendent stîng */
struct tnode *right; /* descendent drept */
};
Această declaraţie „recursivă” a unui nod este perfect legală,
deoarece o structură nu poate conţine ca şi componentă o intrare a ei
însăşi dar poate conţine un pointer la o structură de acelaşi şablon cu
ea.
Declaraţia:
struct tnode *left;
declară pe left ca fiind un pointer la structură (nod) şi nu o
structură însăşi.
În program vom folosi rutinele getword, pentru citirea unui
cuvînt din intrare, alloc pentru rezervarea de spaţiu necesar
memorării unui cuvînt şi alte cîteva rutine pe care le cunoaştem deja.
Rutina principală main citeşte prin intermediul rutinei getword un
cuvînt, şi îl plasează în arbore prin rutina tree.
#define MAXWORD 20
main() { /* contorizare apariţii cuvinte */
struct tnode *root, *tree();
char word[MAXWORD];
int t;
root = NULL;
while ((t=getword(word,MAXWORD))!=EOF)
if (t==LETTER)
root = tree(root,word);
treeprint(root);
}
__________________________________________________________________________
119
Rutina main gestionează fiecare cuvînt din intrare începînd cu
cel mai înalt nivel al arborelui (rădăcina). La fiecare pas, cuvîntul din
intrare este comparat cu cuvîntul asociat rădăcinii şi este apoi
transmis în jos, fie descendentului stîng, fie celui drept, printr-un apel
recursiv la rutina tree. În acest proces, cuvîntul fie există deja,
undeva în arbore, caz în care contorul lui de numărare a apariţiilor se
incrementează, fie căutarea continuă pînă la întîlnirea unui pointer
NULL, caz în care nodul trebuie creat şi adăugat arborelui. Cînd se
creează un nod nou, rutina tree returnează un pointer la el, care
apoi este introdus în nodul de origine (adică în nodul al cărui
descendent este noul nod) în cîmpul left sau right după cum
noul cuvînt este mai mic sau mai mare faţă de cuvîntul origine.
Rutina tree, care returnează un pointer la o structură de şablon
tnode are următorul cod:
struct tnode *tree(struct tnode *p,
char *w) { /* introduce cuvîntul w în nodul p */
struct tnode *talloc(int n);
char *strsav(char *s);
int cond;
if (p==NULL) { /* a sosit un nou cuvînt */
p = talloc(); /* creează un nod nou */
p->word = strsav(w);
p->count = 1;
p->left = p->right = NULL;
}
else
if ((cond=strcmp(w,p->word))==0)
p->count++;
else
if (cond<0) /* noul cuvînt mai mic */
p->left = tree(p->left,w);
else /* noul cuvînt mai mare */
p->right = tree(p->right,w);
return p;
__________________________________________________________________________
120
}
Memoria pentru noul nod se alocă de către rutina talloc, care
este o adaptare a rutinei alloc, pe care am văzut-o deja. Ea
returnează un pointer la un spaţiu liber, în care se poate înscrie noul
nod al arborelui. Vom discuta rutina talloc mai tîrziu. Noul cuvînt
se copiază în acest spaţiu cu ajutorul rutinei strsav, care returnează
un pointer la începutul cuvîntului, contorul de apariţii se iniţializează
la 1 şi pointerii către cei doi descendenţi se fac NULL. Această parte
de cod se execută numai cînd se adaugă un nou nod.
Rutina treeprint tipăreşte arborele astfel încît pentru fiecare
nod se imprimă sub-arborele lui stîng, adică toate cuvintele mai mici
decît cuvîntul curent, apoi cuvîntul curent şi la sfîrşit sub-arborele
drept, adică toate cuvintele mai mari decît cuvîntul curent. Rutina
treeprint este una din cele mai tipice rutine recursive.
treeprint(struct tnode *p) {
/* tipăreşte arborele p recursiv */
if (p!=NULL) {
treeprint(p->left);
printf("%5d %s\n",p->count,p->word);
treeprint(p->right);
}
}
Este important de reţinut faptul că în algoritmul de căutare în
arbore, pentru a ajunge la un anumit nod, se parcurg toate nodurile
precedente, pe ramura respectivă (stîngă sau dreaptă), începînd
întotdeauna cu nodul rădăcină. După fiecare ieşire din rutina tree,
din cauza recursivităţii, se parcurge acelaşi drum, de data aceasta de
la nodul găsit spre rădăcina arborelui, refăcîndu-se toţi pointerii
drumului parcurs.
Dacă consideraţi ca nu aţi înţeles suficient de bine recursivitatea,
desenaţi-vă un arbore şi imprimaţi-l cu ajutorul rutinei treeprint,
avînd grijă să memoraţi fiecare ieşire din tree şi treeprint.
O observaţie legată de acest exemplu: dacă arborele este
„nebalansat“, adică cuvintele nu sosesc în ordine aleatoare din punct
__________________________________________________________________________
121
de vedere lexicografic, atunci timpul de execuţie al programului
poate deveni foarte mare. Cazul limită în acest sens este acela în care
cuvintele de la intrare sînt deja în ordine, (crescătoare sau
descrescătoare), caz în care programul nostru simulează o căutare
liniară într-un mod destul de costisitor.
Să ne oprim puţin asupra alocării de memorie. Cu toate că se
alocă diferite tipuri de obiecte, este de preferat să existe un singur
alocator de memorie într-un program. Relativ la acest alocator de
memorie se pun doua probleme: în primul rînd cum poate satisface el
condiţiile de aliniere ale obiectelor de un anumit tip (de exemplu
întregii trebuie alocaţi la adrese pare); în al doilea rînd cum se poate
declara că alocatorul returnează pointeri la tipuri diferite de obiecte.
Cerinţele de aliniere pot fi în general rezolvate cu uşurinţă pe
seama unui spaţiu care se pierde, dar care este nesemnificativ ca
dimensiune. De exemplu, alocatorul alloc returnează totdeauna un
pointer la o adresă pară. În cazul în care cererea de alocare poate fi
satisfăcută şi de o adresă impară (pentru şiruri de caractere, de
exemplu) se pierde un caracter.
În ceea ce priveşte declararea tipului alocatorului alloc (adică a
tipului de obiect pe care îl indică pointerul returnat de alloc), un
foarte bun procedeu în limbajul C este de a declara că funcţia alloc
returnează un pointer la char şi apoi să convertim explicit acest
pointer la tipul dorit printr-un cast. Astfel dacă p este declarat în
forma:
char *p;
atunci:
(struct tnode *)p;
converteşte pe p dintr-un pointer la char într-un pointer la o
structură de şablon tnode, dacă el apare într-o expresie. Şi atunci, o
versiune a alocatorului talloc poate fi următoarea:
struct tnode *talloc() {
char *alloc();
return (struct tnode *) alloc
(sizeof(struct tnode));
}
__________________________________________________________________________
122
10.6. Căutare în tabele
O altă problemă legată de definirea şi utilizarea structurilor este
căutarea în tabele. Cînd se întîlneşte de exemplu, o linie de forma:
#define YES 1
simbolul YES şi textul de substituţie 1 se memorează într-o tabelă.
Mai tîrziu, ori de cîte ori textul YES va apărea în instrucţiuni, el se va
înlocui cu constanta 1.
Crearea şi gestionarea tabelelor de simboluri este o problemă de
bază în procesul de compilare. Există două rutine principale care
gestionează simbolurile şi textele lor de substituţie. Prima,
install(s,t) înregistrează simbolul s şi textul de substituţie t
într-o tabelă, s şi t fiind şiruri de caractere. A doua, lookup(s)
caută şirul s în tabelă şi returnează fie un pointer la locul unde a fost
găsit, fie NULL dacă şirul s nu figurează în tabel.
Algoritmul folosit pentru crearea şi gestionarea tabelei de
simboluri este o căutare pe bază de hashing. Fiecărui simbol i se
calculează un cod hash astfel: se adună codurile ASCII ale
caracterelor simbolului şi se ia restul provenit din împărţirea
numărului obţinut din adunare şi dimensiunea tabelului. Astfel,
fiecărui simbol i se asociază un cod hash H care verifică relaţia:
0<=H<0x100 (în hexazecimal)
Codul hash astfel obţinut va fi folosit apoi ca un indice într-o
tabelă de pointeri. Un element al acestei tabele (masiv) indică
începutul unui lanţ de blocuri care descriu simboluri cu acelaşi cod
hash. Dacă un element al tabelei este NULL înseamnă că nici un
simbol nu are valoarea respectivă de hashing.
Un bloc dintr-un lanţ indicat de un element al tabelei este o
structură care conţine un pointer la simbol, un pointer la textul de
substituţie şi un pointer la următorul bloc din lanţ. Un pointer NULL
la următorul bloc din lanţ indică sfîrşitul lanţului.
Şablonul unei structuri (nod) este următorul:
struct nlist {
char *name;
char *def;
__________________________________________________________________________
123
struct nlist *next;/ * următoarea intrare în lanţ */
};
Tabelul de pointeri care indică începuturile lanţului de blocuri ce
descriu simboluri de acelaşi cod hash este:
#define HASHSIZE 0x100
static struct nlist *hashtab[HASHSIZE];
Algoritmul de hashing pe care-l prezentăm nu este cel mai bun
posibil, dar are meritul de a fi extrem de simplu:
hash(char *s) {
/* formează valoarea hash pentru şirul s */
int hashval;
for (hashval=0; *s!='\0';)
hashval += *s++;
return hashval % HASHSIZE;
}
Algoritmul de hashing produce un indice în masivul de pointeri
hashtab. În procesul de căutare a unui simbol, dacă el există, el
trebuie să fie în lanţul de blocuri care începe la adresa conţinută de
elementul din hashtab cu indicele respectiv.
Căutarea în tabela de simboluri hashtab se realizează cu
funcţia lookup. Dacă simbolul căutat este prezent undeva în lanţ,
funcţia returnează un pointer la el; altfel returnează NULL.
struct nlist *lookup(char *s) {
/* caută şirul s în hashtab */
struct nlist *np;
for (np=hashtab[hash(s)]; np!=NULL;
np=np->next)
if (strcmp(s,np->name)==0)
return np; /* s-a găsit s */
return NULL; /* nu s-a găsit s */
}
__________________________________________________________________________
124
Rutina install foloseşte funcţia lookup pentru a determina
dacă simbolul nou care trebuie introdus în lanţ este deja prezent sau
nu. Dacă mai există o definiţie anterioară pentru acest simbol, ea
trebuie înlocuită cu definiţia nouă. Altfel, se creează o intrare nouă
pentru acest simbol, care se introduce la începutul lanţului. Funcţia
install returnează NULL, dacă din anumite motive nu există
suficient spaţiu pentru crearea unui bloc unu.
struct nlist *install(char *name, char
*def) { /* scrie (nume, def) în htab */
struct nlist *np, *lookup();
char *strsav(), *alloc();
int hashval;
if ((np=lookup(name))==NULL) { /* nu s-a găsit */
np = (struct nlist*)alloc(sizeof(*np));
if (np==NULL)
return NULL; /* nu există spaţiu */
if ((np->name=strsav(name))==NULL)
return NULL;
hashval = hash(np->name);
np->next = hashtab[hashval];
hashtab[hashval] = np;
}
else /* nodul există deja */
free(np->def); /* eliberează definiţia veche */
if ((np->def=strsav(def))==NULL)
return NULL;
return np;
}
Deoarece apelurile la funcţiile alloc şi free pot apărea în
orice ordine şi deoarece alinierea contează, versiunea simplă a
funcţiei alloc, prezentată în capitolul 9 nu este adecvată aici. În
biblioteca standard există funcţii de alocare fără restricţii, care se
apelează implicit sau explicit de către utilizator dintr-un program
scris în C pentru a obţine spaţiul de memorie necesar. Deoarece şi
alte acţiuni dintr-un program pot cere spaţiu de memorie într-o
__________________________________________________________________________
125
manieră asincronă, spaţiul de memorie gestionat de funcţia alloc
poate să fie necontiguu. Astfel, spaţiul liber de memorie este păstrat
sub forma unui lanţ de blocuri libere, fiecare bloc conţinînd o
dimensiune, un pointer la următorul bloc şi spaţiul liber propriu-zis.
Blocurile sînt păstrate în ordinea crescătoare a adreselor iar, ultimul
bloc, de adresa cea mai mare, indică primul bloc, prin pointerul lui la
blocul următor din lanţ, astfel încît lanţul este circular.
Cînd se lansează o cerere, se examinează lista spaţiului liber, pînă
se găseşte un bloc suficient de mare pentru cererea respectivă. Dacă
blocul are exact dimensiunea cerută, el se eliberează din lanţul
blocurilor libere şi este returnat utilizatorului. Dacă blocul este mai
mare se descompune, astfel încît partea cerută se transmite
utilizatorului, iar partea rămasă se introduce înapoi în lista de spaţiu
liber. Dacă nu se găseşte un bloc suficient de mare pentru cererea
lansată se caută un alt bloc de memorie.
Eliberarea unei zone de memorie prin intermediul rutinei free
cauzează, de asemenea, o căutare în lista de spaţiu liber, pentru a găsi
locul corespunzător de inserare a blocului de memorie eliberat. Dacă
blocul de memorie eliberat este adiacent cu un bloc din lista de spaţiu
liber la orice parte a sa, el este alipit la acel bloc, creîndu-se un bloc
mai mare, astfel ca memoria să nu devină prea fragmentată.
Determinarea adiacenţei este uşurată de faptul că lista de spaţiu liber
se păstrează în ordinea crescătoare a adreselor de memorie.
Exemplul de utilizare a acestor funcţii iniţializează elementele
masivului hashtab cu NULL. În continuare se aşteaptă de la
tastatură introducerea unui nume şi a unei definiţii pentru acest nume.
Dacă numele introdus nu există în lista hashtab atunci se afişează
un mesaj corespunzător, altfel se afişează vechea definiţie care este
apoi înlocuită de noua definiţie introdusă.
main() {
char num[30],def[30];
int i;
struct nlist *np;
for (i=0; i<HASHSIZE; i++)
hashtab[i] = NULL;
__________________________________________________________________________
126
do {
getword(num); getword(def);
if ((np=lookup(num))==NULL)
printf("New name\n");
else
printf("Old definition: %s\n",
np->def);
install(num,def);
} while (1);
}
10.7. Cîmpuri
Un cîmp se defineşte ca fiind o mulţime de biţi consecutivi dintr-
un cuvînt sau întreg. Adică din motive de economie a spaţiului de
memorie, este utilă împachetarea unor obiecte într-un singur cuvînt
maşină. Un caz frecvent de acest tip este utilizarea unui set de flaguri,
fiecare pe un bit, pentru tabela de simboluri a unui compilator.
Fiecare simbol dintr-un program are anumite informaţii asociate
lui, cum sînt de exemplu, clasa de memorie, tipul, dacă este sau nu
cuvînt cheie ş.a.m.d. Cel mai compact mod de a codifica aceste
informaţii este folosirea unui set de flaguri, de cîte un bit, într-un
singur întreg sau caracter.
Modul cel mai uzual pentru a face acest lucru este de a defini un
set de măşti, fiecare mască fiind corespunzătoare poziţiei bitului m
interiorul caracterului sau cuvîntului. De exemplu:
#define KEYWORD 01
#define EXTERNAL 02
#define STATIC 04
definesc măştile KEYWORD, EXTERNAL şi STATIC care se referă la
biţii 0, 1 şi respectiv 2 din caracter sau cuvînt. Atunci accesarea
acestor biţi se realizează cu ajutorul operaţiilor de deplasare, mascare
şi complementare, descrişi într-un capitol anterior. Numerele trebuie
să fie puteri ale lui 2.
Expresii de forma:
__________________________________________________________________________
127
flags | = EXTERNAL | STATIC;
apar frecvent şi ele setează biţii 1 şi 2 din caracterul sau întregul
flags (în exemplul nostru)
în timp ce expresia:
flags &= (EXTERNAL | STATIC);
selectează biţii 1 şi 2 din flags.
Expresia:
if (flags & (EXTERNAL | STATIC)) ...
este adevărată cînd cel puţin unul din biţii 1 sau 2 din flags este unu.
Expresia:
if (!(flags & (EXTERNAL | STATIC))) ...
este adevărată cînd biţii 1 şi 2 din flags sînt ambii zero.
Limbajul C oferă aceste expresii, ca o alternativă, pentru
posibilitatea de a defini şi de a accesa biţii dintr-un cuvînt, în mod
direct, folosind operatorii logici pe biţi.
Sintaxa definiţiei cîmpului şi a accesului la el se bazează pe
structuri. De exemplu construcţiile #define din exemplul de mai
sus pot fi înlocuite prin definirea a trei cîmpuri:
struct {
unsigned is_keyword: 1;
unsigned is_external:1;
unsigned is_static: 1;
} flags;
Această construcţie defineşte variabila flags care conţine 3
cîmpuri, fiecare de cîte un bit. Numărul care urmează după ’:’
reprezintă lungimea cîmpului în biţi. Cîmpurile sînt declarate
unsigned pentru a sublinia că ele sînt cantităţi fără semn. Pentru a
ne referi la un cîmp individual din variabila flags folosim o notaţie
similară cu notaţia folosită pentru membrii structurilor.
flags.is_keyword
flags.is_static
__________________________________________________________________________
128
Cîmpurile se comportă ca nişte întregi mici fără semn şi pot
participa în expresii aritmetice ca orice alţi întregi. Astfel, expresiile
anterioare pot fi scrise mai natural sub forma următoare:
flags.is_extern = flags.is_static = 1;
pentru setarea biţilor 1 şi 2 din variabila flags,
flags.is_extern = flags.is_static = 0;
pentru ştergerea biţilor, iar:
if (flags.is_extern==0 &&
flags.is_static==0)
pentru testarea lor.
Un cîmp nu trebuie să depăşească limitele unui cuvînt. În caz
contrar, cîmpul se aliniază la limita următorului cuvînt. Cîmpurile nu
necesită să fie denumite. Un cîmp fără nume, descris numai prin
caracterul ’:’ şi lungimea lui în biţi este folosit pentru a rezerva
spaţiu în vederea alinierii următorului cîmp. Lungimea zero a unui
cîmp poate fi folosită pentru forţarea alinierii următorului cîmp la
limita unui nou cuvînt, el fiind presupus a conţine tot cîmpuri şi nu
un membru obişnuit al structuri, deoarece în acest ultim caz, alinierea
se face în mod automat. Nici un cîmp nu poate fi mai lung decît un
cuvînt. Cîmpurile se atribuie de la dreapta la stînga.
Cîmpurile nu pot constitui masive, nu au adrese, astfel încît
operatorul '&' nu se poate aplica asupra lor.
10.8. Reuniuni
O reuniune este o variabilă care poate conţine, la momente
diferite, obiecte de diferite tipuri şi dimensiuni; compilatorul este cel
care ţine evidenţa dimensiunilor şi aliniamentului.
Reuniunile oferă posibilitatea ca mai multe tipuri diferite de date
să fie tratate într-o singură zonă de memorie, fără a folosi în program
vreo informaţie dependentă de maşină.
Să reluăm exemplul tabelei de simboluri a unui compilator,
presupunînd că constantele pot fi de tip int, float sau şiruri de
caractere.
__________________________________________________________________________
129
Valoarea unei constante particulare trebuie memorată într-o
variabilă de tip corespunzător, cu toate că este mai convenabil, pentru
gestiunea tabelei de simboluri, ca valoarea să fie memorată în aceeaşi
zonă de memorie, indiferent de tipul ei şi să ocupe aceeaşi cantitate
de memorie. Acesta este scopul unei reuniuni: de a furniza o singură
variabilă care să poată conţine oricare dintre valorile unor tipuri de
date. Ca şi în cazul cîmpurilor, sintaxa definiţiei şi accesului la o
reuniune se bazează pe structuri. Fie definiţia:
union u_tag. { int ival;
float fval;
char *pval;
} uval;
Variabila uval va fi suficient de mare ca să poată păstra pe cea
mai mare dintre cele trei tipuri de componente. Oricare dintre tipurile
de mai sus poate fi atribuit variabilei uval şi apoi folosit în expresii
în mod corespunzător, adică tipul în uval este tipul ultim atribuit.
Utilizatorul este cel care ţine evidenţa tipului curent memorat într-o
reuniune.
Sintactic, membrii unei reuniuni sînt accesibili printr-o
construcţie de forma:
nume-reuniune. membru
sau
pointer-la-reuniune->membru
Dacă variabila utype este utilizată pentru a ţine evidenţa tipului
curent memorat în uval, atunci fie următorul cod:
if (utype==INT)
printf ("%d\n",uval.ival);
else if (utype== FLOAT)
printf("%f\n",uval.fval);
else if (utype==STRING)
printf("%s\n",uval.pval);
else
printf("tip incorect %d in utype\n",
utype);
__________________________________________________________________________
130
Reuniunile pot apărea în structuri şi masive şi invers. Sintaxa
pentru accesarea unui membru al unei reuniuni, dintr-o structură, sau
invers este identică cu cea pentru structurile imbricate. Pe exemplu,
în masivul de structuri symtab[NSYM] definit de:
struct {
char * name;
int flags;
int utype;
union {
int ival;
float fval;
char *pval;
} uval;
} symtab[NSYM];
variabila ival se referă prin:
symtab[i].uval.ival
iar primul caracter al şirului pointat de pval prin:
*symtab[i].uval.pval
De fapt, o reuniune este o structură în care toţi membrii au
deplasamentul zero, structura fiind suficient de mare pentru a putea
păstra pe cel mai mare membru. Alinierea este corespunzătoare
pentru toate tipurile reuniunii. Ca şi la structuri, singurele operaţii
permise cu reuniuni sînt accesul la un membru al reuniunii şi
considerarea adresei ei.
Reuniunile nu pot fi atribuite, transmise la funcţii sau returnate
de către acestea. Pointerii la reuniuni pot fi folosiţi în mod similar cu
pointerii la structuri.
__________________________________________________________________________
131
struct-sau-union identificator { lista-declaraţiilor }
struct-sau-union identificator
Struct-sau-union:
struct
union
Lista-declaraţiilor este o secvenţă de declaraţii pentru membrii
structurii sau reuniunii.
Lista-declaraţiilor:
declaraţie-structură
declaraţie-structură, lista-declaraţiilor
Declaraţie-structură:
specificator-tip, lista-declarator;
Lista-declarator:
declarator-structură
declarator-structură, lista-declarator
În mod obişnuit, un declarator-structură este chiar un declarator
pentru un membru al structurii sau reuniunii. Un membru al structurii
poate fi constituit dintr-un număr specificat de biţi, caz în care avem
de-a face cu un cîmp. Lungimea lui se separă de nume prin caracterul
’:’ Atunci:
Declarator-structură:
declarator
declarator : expresie-constantă
: expresie-constantă
Într-o structură fiecare membru care nu este un cîmp începe la o
adresă corespunzătoare tipului său. Astfel într-o structură pot exista
zone fără nume neutilizate, rezultate din motive de aliniere.
Limbajul C nu introduce restricţii privind tipurile obiectelor care
pot fi declarate cîmpuri.
Un specificator-structură-sau-reuniune de forma a doua declară
un identificator ca fiind eticheta (marcajul) structurii sau reuniunii.
Atunci o declaraţie ulterioară poate folosi forma a treia a unui
specificator-structură-sau-reuniune.
__________________________________________________________________________
132
Etichetele de structuri permit definirea structurilor auto-referite;
de asemenea permit ca partea de declaraţie a corpului structurii să fie
dată o singură dată şi folosită de mai multe ori. Este interzisă
declararea recursivă a unei structuri sau reuniuni, dar o structură sau
o reuniune poate conţine un pointer la ea.
Două structuri pot partaja o secvenţă iniţială comună de membri;
adică acelaşi membru poate apărea în două structuri diferite dacă el
are acelaşi tip în ambele structuri şi dacă toţi membri precedenţi lui
sînt identici în cele două structuri.
10.10. Typedef
Limbajul C oferă o facilitate numită typedef pentru a crea noi
nume de tipuri de date. Specificatorul de tip typedef-nume are
sintaxa:
typedef-nume:
declarator
Într-o declaraţie implicînd typedef fiecare identificator care
apare ca parte a unui declarator devine sintactic echivalent cu
cuvîntul cheie rezervat pentru tipul asociat cu identificatorul. De
exemplu, declaraţia:
typedef int LENGTH;
îl face pe LENGTH sinonim cu int. „Tipul” LENGTH poate fi folosit
ulterior în declaraţii în acelaşi mod ca şi tipul int.
LENGTH len, maxlen;
LENGTH *length[];
În mod similar, declaraţia:
typedef char *STRING;
îl face pe STRING sinonim cu char*, adică pointer la caracter, care
apoi poate fi utilizat în declaraţii de tipul:
STRING p, lineptr[LINES], alloc();
Se observă că tipul care se declară prin typedef apare pe
poziţia numelui de variabilă nu imediat după cuvîntul rezervat
typedef. Sintactic typedef este sinonim cu clasele de memorie
__________________________________________________________________________
133
extern, static etc, dar nu rezervă memorie pentru variabilele
respective.
Ca un exemplu mai complicat să reluăm declaraţia unui nod al
unui arbore, de data aceasta folosind typedef pentru a crea un nou
nume pentru un tip structură (vezi secţiunea 10.5).
typedef struct tnode {
char *word; /* pointer la text */
int count; /* număr apariţii */
struct tnode *left; /* descendent stîng */
struct tnode *right; /* descendent drept */
} TREENODE, *TREEPTR;
Această declaraţie creează două nume noi de tipuri, numite
TREENODE, care este o structură şi TREEPTR, care este un pointer la
o structură. Atunci rutina talloc poate fi scrisă sub forma:
TREEPTR talloc() {
char *alloc();
return (TREEPTR)alloc(sizeof(TREENODE)));
}
Trebuie subliniat faptul că declaraţia typedef nu creează noi
tipuri în nici un caz; ea adaugă doar sinonime pentru anumite tipuri
de date, deja existente. Variabilele declarate în acest fel au exact
aceleaşi proprietăţi ca şi cele declarate explicit. De fapt, typedef se
aseamănă cu #define, cu excepţia faptului că în timp ce #define
este tratat de preprocesor, typedef este tratat de către compilator.
De exemplu:
typedef int(*PFI)();
creează numele PFI pentru „pointer la o funcţie care returnează un
întreg”, tip care poate fi folosit ulterior într-un context de tipul:
PFI strcmp, numcmp, swap;
în programul de sortare din capitolul 9.
Există două motive principale care impun folosirea declaraţiilor
typedef. Primul este legat de problemele de portabilitate. Cînd se
folosesc declaraţii typedef pentru tipuri de date care sînt
__________________________________________________________________________
134
dependente de maşină, atunci pentru o compilare pe un alt sistem de
calcul este necesară modificarea doar a acestor declaraţii nu şi a
datelor din program.
Al doilea constă în faptul că prin crearea de noi nume de tipuri se
oferă posibilitatea folosirii unor nume mai sugestive în program, deci
o mai rapidă înţelegere a programului.
__________________________________________________________________________
135
11. Intrări / ieşiri
__________________________________________________________________________
137
11.2. Accesul la fişiere; deschidere şi închidere
Nume
fopen - deschide un flux
Declaraţie
FILE *fopen(const char *path,
const char *mode);
Descriere
Funcţia fopen deschide fişierul al cărui nume este un şir indicat
de path şi îi asociază un flux.
Argumentul mode indică un şir care începe cu una din secvenţele
următoare:
r deschide un fişier pentru citire;
r+ deschide pentru citire şi scriere;
w trunchiază fişierul la lungime zero sau creează un fişier pentru
scriere;
w+ deschide pentru adăugare la sfîrşit, în citire şi scriere; fişierul este
creat dacă nu există, altfel este trunchiat;
a deschide pentru adăugare la sfîrşit, în scriere; fişierul este creat
dacă nu există;
a+ deschide pentru adăugare la sfîrşit, în citire şi scriere; fişierul este
creat dacă nu există;
După deschidere, în primele patru cazuri indicatorul poziţiei în
flux este la începutul fişierului, în ultimele două la sfîrşitul acestuia.
Şirul mode include de asemenea litera b (deschide un fişier
binar) sau t (deschide un fişier text) fie pe ultima poziţie fie pe cea
din mijloc.
Operaţiile de citire şi scriere pot alterna în cazul fluxurilor read /
write în orice ordine. Să reţinem că standardul ANSI C cere să existe
o funcţie de poziţionare între o operaţie de intrare şi una de ieşire, sau
între o operaţie de ieşire şi una de intrare, cu excepţia cazului cînd o
operaţie de citire detectează sfîrşitul de fişier. Această operaţie poate
__________________________________________________________________________
138
fi inefectivă - cum ar fi fseek(flux, 0L, SEEK_CUR) apelată
cu scop de sincronizare.
Valori returnate
În caz de succes se returnează un pointer de tip FILE. În caz de
eroare se returnează NULL şi variabila globală errno indică codul
erorii.
Nume
fclose - închide un flux
Declaraţie
int fclose( FILE *flux);
Descriere
Funcţia fclose închide fişierul asociat fluxului flux. Dacă
flux a fost deschis pentru ieşire, orice date aflate în zone tampon
sînt scrise în fişier în prealabil cu un apel fflush.
Valori returnate
În caz de succes se returnează 0. În caz de eroare se returnează
EOF şi variabila globală errno indică codul erorii.
Nume
tmpfile - creează un fişier temporar
Declaraţie
FILE *tmpfile();
Descriere
Funcţia tmpfile generează un nume unic de fişier temporar.
Acesta este deschis în mod binar pentru scriere / citire ("wb+").
Fişierul va fi şters automat la închidere sau la terminarea
programului.
Valoare returnată
Funcţia returnează un descriptor de flux în caz de succes, sau
NULL dacă nu poate fi generat un nume unic de fişier sau dacă
__________________________________________________________________________
139
fişierul nu poate fi deschis. În caz de eroare variabila globală errno
indică codul erorii.
Nume
fflush - forţează scrierea în flux
Declaraţie
int fflush(FILE *flux);
Descriere
Funcţia fflush forţează o scriere a tuturor datelor aflate în zone
tampon ale fluxului flux. Fluxul rămîne deschis.
Valori returnate
În caz de succes se returnează 0. În caz de eroare se returnează
EOF şi variabila globală errno indică codul erorii.
Nume
fseek, ftell, rewind - repoziţionează un flux
Declaraţie
int fseek(FILE *flux, long offset,
int reper);
long ftell(FILE *flux);
void rewind(FILE *flux);
Descriere
Funcţia fseek setează indicatorul de poziţie pentru fişierul
asociat fluxului flux. Noua poziţie, dată în octeţi, se obţine adunînd
offset octeţi la poziţia specificată de reper. Dacă reper este
SEEK_SET, SEEK_CUR, sau SEEK_END, offset este relativ la
începutul fişierului, poziţia curentă a indicatorului, respectiv sfîrşitul
fişierului. Funcţia fseek şterge indicatorul de sfîrşit de fişier.
Funcţia ftell obţine valoarea curentă a indicatorului de poziţie
pentru fişierul asociat fluxului flux.
__________________________________________________________________________
140
Funcţia rewind poziţionează indicatorul de poziţie pentru
fişierul asociat fluxului flux la începutul fişierului. Este echivalentă
cu:
(void)fseek(flux, 0L, SEEK_SET)
cu completarea că funcţia rewind şterge şi indicatorul de eroare al
fluxului.
Valori returnate
Funcţia rewind nu returnează nici o valoare. În caz de succes,
fseek returnează 0, şi ftell returnează offset-ul curent. În caz de
eroare se returnează EOF şi variabila globală errno indică codul
erorii.
Nume
fgets - citeşte un şir de caractere dintr-un flux text
Declaraţie
char *fgets(char *s, int size, FILE *flux);
Descriere
Funcţia fgets cel mult size-1 caractere din flux şi le
memorează în zona indicată de s. Citirea se opreşte la detectarea
sfîrşitului de fişier sau new-line. Dacă se citeşte caracterul new-line
acesta este memorat în s. După ultimul caracter se memorează null.
Apeluri ale acestei funcţii pot fi combinate cu orice apeluri ale
altor funcţii de intrare din bibliotecă (fscanf, de exemplu) pentru
un acelaşi flux de intrare.
Valori returnate
Funcţia returnează adresa s în caz de succes, sau NULL în caz de
eroare sau la întîlnirea sfîrşitului de fişier dacă nu s-a citit nici un
caracter.
__________________________________________________________________________
141
Nume
fputs - scrie un şir de caractere într-un flux text
Declaraţie
int fputs(const char *s, FILE *flux);
Descriere
Funcţia fputs scrie şirul s în flux fără caracterul terminator
null.
Apeluri ale acestei funcţii pot fi combinate cu orice apeluri ale
altor funcţii de ieşire din bibliotecă (fprintf, de exemplu) pentru
un acelaşi flux de ieşire.
Valori returnate
Funcţia returnează o valoare non-negativă în caz de succes, sau
EOF în caz de eroare.
Nume
fread, fwrite - intrări / ieşiri pentru fluxuri binare
Declaraţie
unsigned fread(void *ptr, unsigned size,
unsigned nel, FILE *flux);
unsigned fwrite(const void *ptr, unsigned
size, unsigned nel, FILE *flux);
Descriere
Funcţia fread citeşte nel elemente, fiecare avînd mărimea
size octeţi, din fluxul indicat de flux, şi le memorează în zona
indicată de ptr.
Funcţia fwrite scrie nel elemente, fiecare avînd mărimea
size octeţi, din fluxul indicat de flux, pe care le ia din zona
indicată de ptr.
Valori returnate
Funcţiile returnează numărul de elemente citite sau scrise cu
succes (şi nu numărul de caractere). Dacă apare o eroare sau se
__________________________________________________________________________
142
întîlneşte sfîrşitul de fişier, valoarea returnată este mai mică decît
nel (posibil zero).
Nume
scanf, fscanf, sscanf - citire cu format
Declaraţie
int scanf(const char *format, ...);
int fscanf(FILE *flux, const char *format,
...);
int sscanf(const char *str, const char
*format, ...);
Descriere
Familia de funcţii scanf scanează intrarea în concordanţă cu şirul
de caractere format după cum se descrie mai jos. Acest format
poate conţine specificatori de conversie; rezultatele unor astfel de
conversii (dacă se efectuează) se memorează prin intermediul
argumentelor pointer. Funcţia scanf citeşte şirul de intrare din
fluxul standard stdin, fscanf din flux, şi sscanf din şirul
indicat de str.
Fiecare argument pointer trebuie să corespundă în ordine ca tip
cu fiecare specificator de conversie (dar a se vedea suprimarea mai
jos). Dacă argumentele nu sînt suficiente comportamentul
programului este imprevizibil. Toate conversiile sînt introduse de
caracterul %. Şirul format poate conţine şi alte caractere. Spaţii albe
(blanc, tab, sau new-line) din şirul format se potrivesc cu orice spaţiu
alb în orice număr (inclusiv nici unul) din şirul de intrare. Orice alte
caractere trebuie să se potrivească exact. Scanarea se opreşte atunci
cînd un caracter din şirul de intrare nu se potriveşte cu cel din format.
Scanarea se opreşte de asemenea atunci cînd o conversie nu se mai
poate efectua (a se vedea mai jos).
__________________________________________________________________________
143
Conversii
După caracterul % care introduce o conversie poate urma un
număr de caractere indicatori, după cum urmează:
* Suprimă atribuirea. Conversia care urmează se face în mod
obişnuit, dar nu se foloseşte nici un argument pointer; rezultatul
conversiei este pur şi simplu abandonat.
h Conversia este de tip dioux sau n şi argumentul asociat este un
pointer la short (în loc de int).
l Conversia este de tip dioux sau n şi argumentul asociat este un
pointer la long (în loc de int), sau conversia este de tip efg şi
argumentul asociat este un pointer la double (în loc de
float).
L Conversia este de tip efg şi argumentul asociat este un pointer la
long double.
În completare la aceşti indicatori poate exista o mărime w
maximă opţională pentru cîmp, exprimată ca un întreg zecimal, între
caracterul % şi cel de conversie, şi înaintea indicatorului. Dacă nu este
dată o mărime maximă se foloseşte mărimea implicită infinit (cu o
excepţie la conversia de tip c); în caz contrar se scanează cel mult un
număr de w caractere în timpul conversiei. Înainte de a începe o
conversie, majoritatea conversiilor ignoră spaţiile albe; acestea nu
sînt contorizate în mărimea cîmpului.
Sînt disponibile următoarele conversii:
% Potrivire cu un caracter %. Cu alte cuvinte, %% în şirul format
trebuie să se potrivească cu un caracter %. Nu se efectuează nici o
conversie şi nici o atribuire.
d Potrivire cu un întreg zecimal (eventual cu semn); argumentul
asociat trebuie să fie un pointer la int.
i Potrivire cu un întreg (eventual cu semn); argumentul asociat
trebuie să fie un pointer la int. Valoarea întreagă este citită în
__________________________________________________________________________
144
baza 16 dacă începe cu 0x sau 0X, în baza 8 dacă începe cu 0, şi
în baza 10 în caz contrar. Sînt folosite numai caracterele care
corespund bazei respective.
o Potrivire cu un întreg octal fără semn; argumentul asociat trebuie
să fie un pointer la unsigned.
u Potrivire cu un întreg zecimal fără semn; argumentul asociat
trebuie să fie un pointer la unsigned.
x Potrivire cu un întreg hexazecimal fără semn; argumentul asociat
trebuie să fie un pointer la unsigned.
f Potrivire cu un număr în virgulă mobilă (eventual cu semn);
argumentul asociat trebuie să fie un pointer la float.
e,g Echivalent cu f.
s Potrivire cu o secvenţă de caractere diferite de spaţiu alb;
argumentul asociat trebuie să fie un pointer la char, şi zona
trebuie să fie suficient de mare pentru a putea primi toată
secvenţa şi caracterul terminator null. Şirul de intrare se termină
la un spaţiu alb sau la atingerea mărimii maxime a cîmpului
(prima condiţie întîlnită).
c Potrivire cu o secvenţă de caractere de mărime w (dacă aceasta
este specificată; prin lipsă se ia w=1); argumentul asociat trebuie
să fie un pointer la char, şi zona trebuie să fie suficient de mare
pentru a putea primi toată secvenţa (nu se adaugă terminator
null). Nu se ignoră ca de obicei spaţiile albe din faţă. Pentru a
ignora mai întîi spaţiile albe se indică un spaţiu explicit în format.
[ Potrivire cu o secvenţă nevidă de caractere din setul specificat de
caractere acceptate; argumentul asociat trebuie să fie un pointer
la char, şi zona trebuie să fie suficient de mare pentru a putea
primi toată secvenţa şi caracterul terminator null. Nu se ignoră ca
de obicei spaţiile albe din faţă. Şirul de intrare va fi format din
caractere aflate în (sau care nu se află în) setul specificat în
format; setul este definit de caracterele aflate între [ şi ]. Setul
__________________________________________________________________________
145
exclude acele caractere dacă primul caracter după [ este ^.
Pentru a include caracterul ] în set, acesta trebuie să fie primul
caracter după [ sau ^; caracterul ] aflat în orice altă poziţie
închide setul. Caracterul - are şi el un rol special: plasat între
două alte caractere adaugă toate celelalte caractere aflate în
intervalul respectiv la set. Pentru a include caracterul - acesta
trebuie să fie ultimul caracter înainte de ]. De exemplu,
"%[^]0-9-]" semnifică setul orice caracter cu excepţia ], 0
pînă la 9, şi -. Şirul se termină la apariţia unui caracter care nu
se află (sau, dacă se precizează ^, care se află) în set sau dacă se
atinge mărimea maximă specificată.
p Potrivire cu o valoare pointer (aşa cum se afişează cu %p în
printf); argumentul asociat trebuie să fie un pointer la pointer.
n Nu se prelucrează nimic din şirul de intrare; în schimb, numărul
de caractere consumate pînă la acest punct din şirul de intrare
este memorat la argumentul asociat, care trebuie să fie un pointer
la int.
Valori returnate
Funcţiile returnează numărul de valori atribuite, care poate fi mai
mic decît numărul de argumente pointer, sau chiar zero, în cazul în
care apar nepotriviri între format şi şirul de intrare. Zero indică faptul
că, chiar dacă avem un şir de intrare disponibil, nu s-a efectuat nici o
conversie (şi atribuire); această situaţie apare atunci cînd un caracter
din şirul de intrare este invalid, cum ar fi un caracter alfabetic pentru
o conversie %d. Valoarea EOF este returnată dacă apare un eroare
înainte de prima conversie, cum ar fi detectarea sfîrşitului de fişier.
Dacă o eroare sau un sfîrşit de fişier apare după ce o conversie a
început, se returnează numărul de conversii efectuate cu succes.
__________________________________________________________________________
146
11.5. Scriere cu format
Nume
printf, fprintf, sprintf - scriere cu format
Declaraţie
int printf(const char *format, ...);
int fprintf(FILE *flux, const char
*format, ...);
int sprintf(char *str, const char *format,
...);
Descriere
Funcţiile din familia printf generează o ieşire în concordanţă cu
format după cum se descrie mai jos. Funcţia printf afişează ieşirea
la fluxul standard stdout; fprintf scrie ieşirea la flux;
sprintf scrie ieşirea în şirul de caractere str.
Aceste funcţii generează ieşirea sub controlul şirului format care
specifică cum se convertesc argumentele pentru ieşire.
Şirul de formatare
Şirul format este un şir de caractere, printre care se pot afla zero
sau mai multe directive: caractere obişnuite (diferite de %) care sînt
copiate aşa cum sînt în fluxul de ieşire, şi specificaţii de conversie,
fiecare dintre ele rezultînd din încărcarea a zero sau mai multe
argumente. Fiecare specificaţie de conversie este introdusă de
caracterul % şi se termină cu un specificator de conversie. Între
acestea pot fi (în această ordine) zero sau mai mulţi indicatori, o
mărime minimă a cîmpului opţională, o precizie opţională şi un
modificator opţional de lungime.
Argumentele trebuie să corespundă în ordine cu specificatorii de
conversie. Acestea sînt folosite în ordinea dată, unde fiecare caracter
* şi fiecare specificator de conversie solicită următorul argument.
Dacă argumentele nu sînt suficiente comportamentul programului
este imprevizibil.
__________________________________________________________________________
147
Caractere indicatori
Caracterul % este urmat de zero, unul sau mai mulţi indicatori:
# Valoarea numerică se converteşte în format alternativ. Pentru
conversii de tip o, primul caracter al şirului de ieşire este zero
(prin prefixare cu 0 dacă valoarea nu este zero). Pentru conversii
de tip x şi X, o valoare nenulă este prefixată cu 0x (sau 0X
pentru conversii de tip X). Pentru conversii de tip e, E, f, F, g şi
G, rezultatul va conţine întotdeauna punctul zecimal, chiar dacă
nu apare partea fracţionară (în mod normal punctul zecimal apare
în aceste conversii numai dacă există şi partea fracţionară).
Pentru conversii de tip g şi G zerourile finale nu sînt eliminate
aşa cum se procedează în mod normal. Pentru alte conversii
rezultatul este nedefinit.
0 Valoarea numerică este convertită cu zerouri la stînga. Pentru
conversii de tip d, i, o, u, x, X, e, E, f, F, g şi G, valoarea
convertită este completată cu zerouri la stînga în loc de blanc.
Dacă apar indicatorii 0 şi - împreună, indicatorul 0 este ignorat.
Dacă pentru o conversie numerică (d, i, o, u, x, X) este dată o
precizie, indicatorul 0 este ignorat. Pentru alte conversii
rezultatul este nedefinit.
- Valoarea convertită este aliniată la stînga (implicit alinierea se
face la dreapta). Cu excepţia conversiilor de tip n, valoarea
convertită este completată la dreapta cu blanc, în loc să fie
completată la stînga cu blanc sau zero. Dacă apar indicatorii 0 şi
- împreună, indicatorul 0 este ignorat.
Sp (spaţiu) În cazul unui rezultat al unei conversii cu semn, înaintea
unui număr pozitiv sau şir vid se pune un blanc.
+ Semnul (+ sau -) este plasat înaintea numărului generat de o
conversie cu semn. Implicit semnul este folosit numai pentru
numere negative. Dacă apar indicatorii + şi Sp împreună,
indicatorul Sp este ignorat.
__________________________________________________________________________
148
Lăţimea cîmpului
Un şir de cifre zecimale (cu prima cifră nenulă) specifică o lăţime
minimă pentru cîmp. Dacă valoarea convertită are mai puţine
caractere decît lăţimea specificată, va fi completată cu spaţii la stînga
(sau dreapta, dacă s-a specificat aliniere la stînga). În locul unui
număr zecimal se poate folosi * pentru a specifica faptul că lăţimea
cîmpului este dată de argumentul următor, care trebuie să fie de tip
int. O valoare negativă pentru lăţime este considerată un indicator -
urmat de o valoare pozitivă pentru lăţime. În nici un caz nu se va
trunchia cîmpul; dacă rezultatul conversiei este mai mare decît
lăţimea cîmpului, cîmpul este expandat pentru a conţine rezultatul
conversiei.
Precizia
Precizia (opţională) este dată de caracterul . urmat de un şir de
cifre zecimale. În locul şirului de cifre zecimale se poate scrie *
pentru a specifica faptul că precizia este dată de argumentul următor,
care trebuie să fie de tip int. Dacă precizia este dată doar de ., sau
dacă precizia este negativă, atunci aceasta se consideră zero. Precizia
dă numărul minim de cifre care apar pentru conversii de tip d, i, o,
u, x, X, numărul de cifre care apar după punctul zecimal pentru
conversii de tip e, E, f, F, numărul maxim de cifre semnificative
pentru conversii de tip g şi G, sau numărul maxim de caractere
generate pentru conversii de tip s.
Modificator de lungime
În acest caz prin conversie întreagă înţelegem conversie de tip d,
i, o, u, x, X.
h Conversia întreagă care urmează corespunde unui argument
short sau unsigned short, sau următoarea conversie de tip
n corespunde unui argument de tip pointer la short.
l Conversia întreagă care urmează corespunde unui argument
long sau unsigned long, sau următoarea conversie de tip n
corespunde unui argument de tip pointer la long.
__________________________________________________________________________
149
L Următoarea conversie de tip e, E, f, g sau G corespunde unui
argument long double.
Specificator de conversie
Un caracter care specifică tipul conversiei care se va face.
Specificatorii de conversie şi semnificaţia lor sînt:
d,i
Argumentul de tip int este convertit la notaţia zecimală cu
semn. Precizia, dacă este dată, dă numărul minim de cifre care
trebuie să apară; dacă valoarea convertită necesită mai puţine
cifre, aceasta este completată la stînga cu zerouri. Precizia
implicită este 1. Dacă valoarea 0 este afişată cu precizie explicită
0, ieşirea este vidă.
o,u,x,X
Argumentul de tip unsigned este convertit la notaţie octală
fără semn (o), zecimală fără semn (u), sau hexazecimală fără
semn (x şi X). Literele abcdef se folosesc pentru conversii de
tip x; literele ABCDEF pentru conversii de tip X. Precizia, dacă
este dată, dă numărul minim de cifre care trebuie să apară; dacă
valoarea convertită necesită mai puţine cifre, aceasta este
completată la stînga cu zerouri. Precizia implicită este 1. Dacă
valoarea 0 este afişată cu precizie explicită 0, ieşirea este vidă.
e,E
Argumentul de tip flotant este rotunjit şi convertit în stil
[-]d.ddde±dd unde avem o cifră înainte de punctul zecimal şi
numărul de cifre după acesta este egal cu precizia; dacă aceasta
lipseşte se consideră 6; dacă precizia este zero, punctul zecimal
nu apare. O conversie de tip E foloseşte litera E (în loc de e)
pentru a introduce exponentul. Exponentul are întotdeauna cel
puţin două cifre; dacă valoarea este zero, exponentul este 00.
f,F
Argumentul de tip flotant este rotunjit şi convertit în notaţie
zecimală în stil [-]ddd.ddd, unde numărul de cifre după punctul
zecimal este egal cu precizia specificată. Dacă precizia lipseşte se
__________________________________________________________________________
150
consideră 6; dacă precizia este explicit zero, punctul zecimal nu
apare. Dacă punctul zecimal apare, cel puţin o cifră apare
înaintea acestuia.
g,G
Argumentul de tip flotant este convertit în stil f sau e (sau E
pentru conversii de tip G). Precizia specifică numărul de cifre
semnificative. Dacă precizia lipseşte se consideră 6; dacă precizia
este zero se consideră 1. Stilul e este folosit dacă exponentul
rezultat în urma conversiei este mai mic decît −4 ori mai mare
sau egal cu precizia. Zerourile finale sînt eliminate din partea
fracţionară a rezultatului; punctul zecimal apare numai dacă este
urmat de cel puţin o cifră.
c Argumentul de tip int este convertit la unsigned char şi se
scrie caracterul rezultat.
s Argumentul de tip const char * este un pointer la un şir de
caractere. Caracterele din şir sînt scrise pînă la (fără a include)
caracterul terminator null; dacă precizia este specificată, nu se
scrie un număr mai mare decît cel specificat. Dacă precizia este
dată, nu e nevoie de caracterul null; dacă precizia nu este
specificată, sau dacă este mai mare decît mărimea şirului, şirul
trebuie să conţină un caracter terminator null.
p Argumentul de tip pointer este scris în hexazecimal; formatul este
specific sistemului de calcul.
n Numărul de caractere scrise pînă în acest moment este memorat
la argumentul de tip int *. Nu se face nici o conversie.
% Se scrie un caracter %. Nu se face nici o conversie. Specificaţia
completă este %%.
Valoare returnată
Funcţiile returnează numărul de caractere generate (nu se include
caracterul terminator null pentru sprintf).
__________________________________________________________________________
151
11.6. Tratarea erorilor
Nume
perror - afişează un mesaj de eroare sistem
Declaraţie
void perror(const char *s);
#include <errno.h>
const char *sys_errlist[];
int sys_nerr;
Descriere
Rutina perror afişează un mesaj la ieşirea standard de eroare,
care descrie ultima eroare întîlnită la ultimul apel sistem sau funcţie
de bibliotecă. Mai întîi se afişează argumentul s, apoi virgula şi
blanc, şi în final mesajul de eroare şi new-line. Se recomandă (mai
ales pentru depanare) ca argumentul s să includă numele funcţiei în
care a apărut eroarea. Codul erorii se ia din variabila externă errno.
Lista globală de erori sys_errlist[] indexată cu errno
poate fi folosită pentru a obţine mesajul de eroare fără new-line.
Ultimul indice de mesaj din listă este sys_nerr-1. Se recomandă
o atenţie deosebită în cazul accesului direct la listă deoarece unele
coduri noi de eroare pot lipsi din sys_errlist[].
Dacă un apel sistem eşuează variabila errno indică codul erorii.
Aceste valori pot fi găsite în <errno.h>. Funcţia perror serveşte
la afişarea acestui cod de eroare într-o formă lizibilă. Dacă un apel
terminat cu eroare nu este imediat urmat de un apel perror,
valoarea variabilei errno se poate pierde dacă nu e salvată.
Nume
clearerr, feof, ferror - verifică şi resetează starea
fluxului
Declaraţie
void clearerr(FILE *flux);
__________________________________________________________________________
152
int feof(FILE *flux);
int ferror(FILE *flux);
int fileno( FILE *flux);
Descriere
Funcţia clearerr şterge indicatorii de sfîrşit de fişier şi eroare
ai fluxului.
Funcţia feof testează indicatorul de sfîrşit de fişier al fluxului,
şi returnează non-zero dacă este setat. Acesta este setat dacă o
operaţie de citire a detectat sfîrşitul de fişier.
Funcţia ferror testează indicatorul de eroare al fluxului, şi
returnează non-zero dacă este setat. Acesta este setat dacă o operaţie
de citire sau scriere a detectat o eroare (datorată de exemplu
hardware-ului).
Funcţiile de citire (cu sau fără format) nu fac distincţie între
sfîrşit de fişier şi eroare, astfel că trebuie apelate funcţiile feof şi
ferror pentru a determina cauza.
Funcţia fileno examinează argumentul flux şi returnează
descriptorul asociat de sistemul de operare acestui flux.
Atenţie! Este foarte frecventă folosirea incorectă a funcţiei feof
pentru a testa dacă s-a ajuns la sfîrşitul fişierului. Nu se recomandă în
nici un caz acest stil de programare:
#define LSIR 80
char lin[LSIR];
FILE *fi,*fo;
fi=fopen(nume-fişier-intrare,"rt");
fo=fopen(nume-fişier-ieşire,"wt");
while (!feof(fi)) { /* greşit! */
fgets(lin,LSIR,fi);
fputs(lin,fo);
}
fclose(fi); fclose(fo);
În această secvenţă, dacă şi ultima linie a fişierului text de intrare
este terminată cu new-line, aceasta va fi scrisă de două ori în fişierul
de ieşire. De ce? După ce se citeşte ultima linie încă nu este
__________________________________________________________________________
153
poziţionat indicatorul de sfîrşit de fişier, deci funcţia fgets
returnează succes. La reluarea ciclului se încearcă un nou fgets şi
abia acum se depistează sfîrşitul de fişier, fapt marcat în zona
rezervată fluxului fi. Astfel conţinutul tabloului lin rămîne
nemodificat şi este scris a doua oară în fişierul de ieşire. Abia la o
nouă reluare a ciclului funcţia feof ne spune că s-a depistat sfîrşitul
de fişier.
În acest manual sînt prezentate mai multe programe care
efectuează diferite prelucrări asupra unor fişiere text. Pentru
simplitate toate programele presupun că nu apar erori la citire sau la
scriere.
Nume
opendir - deschide un director
Declaraţie
DIR *opendir(const char *nume);
Descriere
Funcţia opendir deschide un flux pentru directorul cu numele
nume, şi returnează un pointer la fluxul deschis. Fluxul este
poziţionat pe prima intrare din director.
Valoare returnată
Funcţia returnează un pointer la flux în caz de succes, sau NULL
în caz de eroare şi variabila globală errno indică codul erorii.
__________________________________________________________________________
154
Cîteva erori posibile
EACCES Acces interzis
ENOTDIR nume nu este un director
Nume
readdir - citeşte un director
Declaraţie
struct dirent *readdir(DIR *dir);
Descriere
Funcţia readdir returnează un pointer la o structură de tip
dirent care reprezintă următoarea intrare din directorul indicat de
fluxul dir. Returnează NULL dacă s-a depistat sfîrşitul de director
sau dacă a apărut o eroare.
Structura de tip dirent conţine un cîmp char d_name[].
Utilizarea altor cîmpuri din structură reduce portabilitatea
programelor.
Valoare returnată
Funcţia returnează un pointer la o structură de tip dirent, sau
NULL dacă s-a depistat sfîrşitul de director sau dacă a apărut o
eroare.
Nume
closedir - închide un director
Declaraţie
int closedir(DIR *dir);
Descriere
Funcţia closedir închide fluxul dir.
Valoare returnată
Funcţia returnează 0 în caz de succes sau EOF în caz de eroare.
__________________________________________________________________________
155
Nume
rename - redenumeşte un fişier
remove - şterge un fişier
Declaraţie
int rename(const char *old, const char
*new);
int remove(const char *name);
Descriere
Funcţia rename schimbă numele unui fişier din old în new.
Dacă a fost precizat un periferic în new, acesta trebuie să coincidă cu
cel din old. Directoarele din old şi new pot să fie diferite, astfel că
rename poate fi folosită pentru a muta un fişier dintr-un director în
altul. Nu se permit specificatori generici (wildcards).
Funcţia remove şterge fişierul specificat prin name.
Valoare returnată
În caz de succes se returnează 0. În caz de eroare se returnează
EOF şi variabila globală errno indică codul erorii.
__________________________________________________________________________
159
12. Alte rutine din biblioteca standard
__________________________________________________________________________
161
Funcţia qsort sortează un tablou de nel elemente, fiecare de
mărime size. Argumentul base indică spre începutul tabloului.
Elementele tabloului sînt sortate în ordine crescătoare în
concordanţă cu funcţia de comparare referită de comp, apelată cu
două argumente care indică spre obiectele ce se compară. Funcţia de
comparare trebuie să returneze un întreg mai mic decît, egal cu, sau
mai mare decît zero dacă primul argument este considerat a fi mai
mic decît, egal cu, respectiv mai mare decît al doilea. Dacă cele două
elemente comparate sînt egale, ordinea în tabloul sortat este
nedefinită.
Funcţia bsearch caută într-un tablou de nel elemente, fiecare
de mărime size, un membru care coincide cu obiectul indicat de
key. Argumentul base indică spre începutul tabloului.
Conţinutul tabloului trebuie să fie sortat crescător în concordanţă
cu funcţia de comparare referită de comp, apelată cu două argumente
care indică spre obiectele ce se compară. Funcţia de comparare
trebuie să returneze un întreg mai mic decît, egal cu, sau mai mare
decît zero dacă primul argument este considerat a fi mai mic decît,
egal cu, respectiv mai mare decît al doilea.
Valoare returnată
Funcţia bsearch returnează un pointer la un membru al
tabloului care coincide cu obiectul indicat de key, sau NULL dacă nu
se găseşte nici un membru. Dacă există mai multe elemente care
coincid cu key, poate fi returnat oricare element cu această
proprietate.
__________________________________________________________________________
163
isprint
Verifică dacă c este un caracter afişabil inclusiv spaţiu.
ispunct
Verifică dacă c este un caracter diferit de spaţiu şi non-
alfanumeric.
isspace
Verifică dacă c este un spaţiu alb.
isupper
Verifică dacă c este o literă mare.
isxdigit
Verifică dacă c este o cifră hexazecimală din setul 0 1 2 3 4 5 6 7
8 9 a b c d e f A B C D E F.
tolower
Converteşte caracterul c, dacă este o literă, la litera mică
corespunzătoare.
toupper
Converteşte caracterul c, dacă este o literă, la litera mare
corespunzătoare.
Valoare returnată
Valoarea returnată de funcţiile is... este nenulă dacă caracterul c
se află în clasa testată, şi zero în caz contrar.
Valoarea returnată de funcţiile to... este litera convertită dacă
caracterul c este o literă, şi nedefinită în caz contrar.
__________________________________________________________________________
164
Nume
memcpy - copiază o zonă de memorie
Declaraţie
void *memcpy(void *dest, const void *src,
unsigned n);
void *memmove(void *dest, const void *src,
unsigned n);
Descriere
Funcţia memcpy copiază n octeţi din zona de memorie src în
zona de memorie dest. Zonele de memorie nu trebuie să se
suprapună. Dacă există acest risc se utilizează memmove.
Valoare returnată
Funcţiile returnează un pointer la dest.
Nume
memcmp - compară două zone de memorie
Declaraţie
int memcmp(const void *s1, const void *s2,
unsigned n);
Descriere
Funcţia memcmp compară primii n octeţi ai zonelor de memorie
s1 şi s2.
Valoare returnată
Returnează un întreg mai mic decît, egal cu, sau mai mare decît
zero dacă s1 este mai mic decît, coincide, respectiv este mai mare
decît s2.
Nume
memset - umple o zonă de memorie cu o constantă pe un
octet
Declaraţie
__________________________________________________________________________
165
void *memset(void *s, int c, unsigned n);
Descriere
Funcţia memset umple primii n octeţi ai zonei de memorie
indicată de s cu constanta c pe un octet.
Valoare returnată
Funcţia returnează un pointer la zona de memorie s.
Nume
memchr - caută în memorie un caracter
Declaraţie
void *memchr(const void *s, int c,
unsigned n);
Descriere
Funcţia memchr caută caracterul c în primii n octeţi de memorie
indicaţi de s. Căutarea se opreşte la primul octet care are valoarea c
(interpretată ca unsigned char).
Valoare returnată
Funcţia returnează un pointer la octetul găsit sau NULL dacă
valoarea nu există în zona de memorie.
Nume
strlen - calculează lungimea unui şir
Declaraţie
unsigned strlen(const char *s);
Descriere
__________________________________________________________________________
166
Funcţia strlen calculează lungimea şirului s, fără a include
caracterul terminator null.
Valoare returnată
Funcţia returnează numărul de caractere din s.
Nume
strcpy, strncpy - copiază un şir de caractere
Declaraţie
char *strcpy(char *dest, const char *src);
char *strncpy(char *dest, const char *src,
unsigned n);
Descriere
Funcţia strcpy copiază şirul indicat de src (inclusiv
caracterul terminator null) în zona indicată de dest. Şirurile nu
trebuie să se suprapună, şi în plus zona dest trebuie să fie suficient
de mare pentru a primi copia.
Funcţia strncpy este similară, cu excepţia faptului că nu se
copiază mai mult de n octeţi din src. Astfel, dacă caracterul
terminator null nu se află în primii n octeţi din src, rezultatul nu va
fi terminat cu null. În cazul în care lungimea lui src este mai mică
decît n, restul octeţilor din dest primesc valoarea null.
Valoare returnată
Funcţiile returnează un pointer la şirul dest.
Nume
strdup - duplică un şir
Declaraţie
char *strdup(const char *s);
Descriere
Funcţia strdup returnează un pointer la un nou şir care este un
duplicat al şirului s. Memoria pentru noul şir se obţine cu malloc,
şi poate fi eliberată cu free.
__________________________________________________________________________
167
Valoare returnată
Funcţia returnează un pointer la şirul duplicat, sau NULL dacă nu
există memorie suficientă disponibilă.
Nume
strcat, strncat - concatenează două şiruri
Declaraţie
char *strcat(char *dest, const char *src);
char *strncat(char *dest, const char *src,
unsigned n);
Descriere
Funcţia strcat adaugă şirul src la şirul dest suprascriind
caracterul null de la sfîrşitul lui dest, şi la sfîrşit adaugă un caracter
terminator null. Şirurile nu trebuie să se suprapună, şi în plus şirul
dest trebuie să aibă suficient spaţiu pentru a păstra rezultatul.
Funcţia strncat este similară, cu excepţia faptului că numai
primele n caractere din src se adaugă la dest.
Valoare returnată
Funcţiile returnează un pointer la şirul rezultat dest.
Nume
strcmp - compară două şiruri de caractere
Declaraţie
int strcmp(const char *s1, const char
*s2);
Descriere
Funcţia strcmp compară cele două şiruri s1 şi s2.
Valoare returnată
Funcţia returnează un întreg mai mic decît, egal cu, sau mai mare
decît zero dacă s1 este mai mic decît, coincide, respectiv este mai
mare decît s2.
__________________________________________________________________________
168
Nume
strchr, strrchr - localizează un caracter
Declaraţie
char *strchr(const char *s, int c);
char *strrchr(const char *s, int c);
Descriere
Funcţia strchr returnează un pointer la prima apariţie a
caracterului c în şirul s.
Funcţia strrchr returnează un pointer la ultima apariţie a
caracterului c în şirul s.
Valoare returnată
Funcţiile returnează un pointer la caracterul găsit sau NULL dacă
valoarea nu a fost găsită.
Nume
strstr - localizează un subşir
Declaraţie
char *strstr(const char *sir, const char
*subs);
Descriere
Funcţia strstr găseşte prima apariţie a subşirului subs în
şirul sir. Caracterul terminator null nu este luat în considerare.
Valoare returnată
Funcţia returnează un pointer la începutul subşirului, sau NULL
dacă subşirul nu este găsit.
Nume
strspn, strcspn - caută un set de caractere într-un şir
Declaraţie
unsigned strspn(const char *s, const char
__________________________________________________________________________
169
*acc);
unsigned strcspn(const char *s, const char
*rej);
Descriere
Funcţia strspn calculează lungimea segmentului iniţial din s
format în întregime numai cu caractere din acc.
Funcţia strcspn calculează lungimea segmentului iniţial din s
format în întregime numai cu caractere care nu se găsesc în rej.
Valori returnate
Funcţia strspn returnează poziţia primului caracter din s care
nu se află în acc.
Funcţia strcspn returnează poziţia primului caracter din s care
se află în rej.
__________________________________________________________________________
172
12.7. Programe demonstrative
1) Programul prezentat în continuare generează un şir de n valori
întregi aleatoare în intervalul [0,M−1] pe care le depune în tabloul X
(alocat dinamic), şi apoi le sortează crescător. În continuare se
generează k valori întregi aleatoare pe care le caută în tabloul X.
Pentru fiecare căutare cu succes se afişează pe terminal valoarea
căutată şi poziţia în tablou.
Valorile n, k şi M se iau în această ordine din linia de comandă.
#include <stdlib.h>
#include <stdio.h>
#include <time.h>
int cmp(const void *A, const void *B) {
return *(int *)A-*(int *)B;
}
int main(int ac, int **av) {
int *X,*p,M,n,k,i,v;
if (ac!=4) {
fputs("Trei argumente!\n",stderr);
return 1;
}
n=atoi(av[1]); k=atoi(av[2]);
M=atoi(av[3]);
X=(int *)malloc(n*sizeof(int));
if (!X) return 1;
srand(time(NULL));
for (i=0; i<n; i++)
X[i]=rand()%M;
qsort(X,n,sizeof(int),cmp);
for (i=0; i<k; i++) {
v=rand()%M;
p=(int *)bsearch(&v,X,n,sizeof(int),
cmp);
if (p)
printf("Val: %d Pos: %d\n",v,p-X);
}
__________________________________________________________________________
173
free(X);
return 0;
}
__________________________________________________________________________
177
Bibliografie
Brian W Kernigham, Dennis M Ritchie - The C Programming Language
Prentice-Hall Software Series, 1978
∗ ∗ ∗ - Limbajul C; manual de programare
Institutul de tehnică de calcul, Cluj-Napoca 1984
Herbert Schildt - Manual C complet
Editura Teora, 1998
Manuale electronice
http://www.programmingtutorials.com/c.html
Marshall Brain - Introduction to C Programming
http://devcentral.iftech.com/learning/tutorials/c-cpp/c/
Steve Summit - Introductory C Programming Class Notes
http://www.eskimo.com/~scs/cclass/cclass.html
Steve Summit - Intermediate C Programming Class Notes
http://www.eskimo.com/~scs/cclass/cclass.html
Brian Brown - C Programming
http://www.cit.ac.nz/smac/cprogram/onlinet.htm
Brian Brown - An Introduction to C Programming
http://www.cit.ac.nz/smac/cprogram/default.htm
__________________________________________________________________________
178
Cuprins
__________________________________________________________________________
182