Concepte ODI
Concepte ODI
Contextele reunesc componete ale arhitecturii fizice (arhitectura real a sistemului informatic) cu
componentele scehemei logice (arhitectura pe care lucreaz utilizatorii) a Oracle Data Integrator.
Schema componentelor Topology Manager este prezentat n figura 2.1.
Execuii ale sesiunilor la cererea modulelor din Oracle Data Integrator. Pentru acest lucru
trebuie lansat mai ntai un agent listener.
Execuia unor scenarii programate, n plus fa de execuia scenariilor la cerere. Agentul
fizic conine schedulator opional care permite scenariilor s se lanseze automat conform
programelor predefinite. Pentru acest lucru trebuie mai ntai lansat un agent schedulator.
2. Knowledge Module
Knowledge Module-urile (
adugate la surs sau verificate pentru a fi ncrcate incremental. Exista 2 tipuri de IKM-uri: cele
care presupun c staging area se afl pe acelai server ca datastore-ul destinaie i cele care nu
presupun c staging area se afl pe acelai server.
Cnd staging area se afl pe acelai server ca destinaia atunci IKM execut urmtorii pai: se
execut clauza SELECT pentru muta staging area i regurile declarative ale destinaiei n tabelele
C$ i n tabelele locale. Aceast aciune genereaz un set de rezultate. Opiunea de append
scrie direct setul de rezultate n tabelul destinaie. IKM-urile care au opiuni mai complexe
creaz un tabel I$ pentru a memoriza rezultatele. Dac fluxul de date trebuie verificat pentru a
vedea dac respect restriciile de integritate, IKM-ul cheam CKM pentru a scrie erorile n
tabelul I$. Apoi, IKM, scrie rezultatele din I$ n destinaie folosind opiunile alese (update
incremental, schimbarea dimensiunilor etc). IKM terge tabela temporar I$. Opional, IKM
poate rechema CKM pentru a verifica consistena datastore-ului destinaie.
Aceste KM nu pot gestiona datele care se afl n afara serverului de destinaie. Procesarea datelor
este orientat pentru a reui s execute task-uri pe volume mari de date.
Cnd staging area este diferit de serverul destinaie, IKM, de obicei, execut urmtorii pai:
execut clauza SELECT pentru muta regurile declarative ale destinaiei n tabelele C$ i n
tabelele locale. Aceast aciune genereaz un set de rezultate. IKM ncarc rezultatul n
datastore-ul destinaie utiliznd opiunea de append sau incremental update. Aceast arhitectur
este limitat deoarece un CKM nu poate fi utilizat pentru datele care pot fi procesate. Datele
trebuie extrase din staging area nainte de a fi ncrcate n surs ceea ce poate duce la probleme
de performan.
Journalizing Knowledge Modules (JKM)
JKM creaz infrastructura pentru Change Data Capture(CDC) pe un model, sub-model sau
datastore. JKM nu sunt utilizate n interfee ci n modele pentru a determina cum sunt iniializate
infrastructurile CDC-urilor.
Service Knowledge Modules (SKM)
SKM sunt responsabile de crearea i deploy-ingul manipulrii datelor pe Web Service pe
infrastructura Service Oriented Architecture (SOA). SKM-urile sunt setate pe un model. Ele
definesc operaii diferite de generat pentru fiecare datastore a web service-ului. Spre deosebire de
celelalte KM-uri, SKM nu genereaz un cod executabil. Ele genereaz cod Java utiliznd
framework-ul Oracle Data Integrator-ului pentru Web Service. Codul este apoi compilat i apoi
instalat pe containerele Application Server.
Un proiect este un grup de obiecte dezvoltate utiliznd Oracle Data Integrator. Componentele
unui proiect sunt:
Folder: anumite obiecte din proiect sunt grupate n foldere i sub foldere.
Pachetul: este cea mai mare unitate de execuie din Oracle Data Integrator. Un pachet este
construit dintr-o secven de pai organizai ntr-o diagram de execuie.
Interfa: const ntr-un set de reguli care definesc ncrcarea unui Datastore sau o structur de
date destinaie temporar dintr-una sau mai multe surse de Datastore.
Proceduri: o procedur specific este component reutilizabil care grupeaz operaii care nu se
potrivesc n framework-ul interfeei, ncrcnd un datastore destinaie din una sau mai multe
surse.
Exemple de proceduri: ateapt i unzip un fiier, trimite un batch file via FTP, primete
email-uri. O procedur poate lansa comenzi pe schemele logice definite n topologie, dar de
asemenea poate utiliza comenzi OS sau intrumente Oracle Data Integrator.
Variabil: este o valoare memorat n Oracle Data Integrator. Aceast valoare se poate schimba
pe parcursul execuiei. Valoarea:
o Are definit o valoarea de default la momentul crerii.
o Poate fi transmis ca parametru cnd ruleaz un scenariu care utilizeaz variabila.
o Se poate schimba cu paii variabilei de refresh, set i increment.
o Poate fi evaluat pentru a crea condiii n scenariu
o Poate fi utilizat n interfee, proceduri etc.
O variabil poate fi definit n afara proiectului, adic poate fi definit global, pentru a putea fi
utilizat n toate proiectele.
Secvena: este o variabil incrementat automat atunci cnd se utilizeaz. ntre dou utilizri,
valoarea este persistent. Secvenele se pot utiliza ca variabilele n interfee, proceduri etc. O
secven poate fi definit n afara proiectului pentru a putea fi folosit n toate proiectele.
User functions: permite utilizatorului s defineasc funcii customizate sau funcii alias pentru
care trebuie specificate tehnologiile necesare implementrii. Se pot utiliza n interfee i n
proceduri.
Knowledge Modules: Oracle Data Integrator utilizeaz Knowledge Modules pentru a defini
metode legate de o anumite tehnologie.
Marker: elementele unui proiect pot fi marcate pentru a reflecta metodologia de organizare a
dezvoltrilor. Steguleele sunt definite utiliznd markere. Aceste markere sunt organizate n
grupuri i pot fi aplicate la majoritatea obiectelor dintr-un proiect.
Scenariu: cnd un pachet, o interfa, o procedur sau o variabil este finalizat, este compilat
ntr-un scenariu. Scenariul este unitatea de execuie pentru producie. Acesta poate fi i
programat.
Etape n construirea unui proiect:
-
utilizarea de markere(opional)
importul KM-urilor
generearea scenariului
programarea scenariului
Crearea de pachete poate fi realizat datorit urmtoarelor procese: crearea unui nou pachet,
manevrarea pailor(insert, duplicate, delete), definirea secvenelor de pai, rularea pachetului.
- Datastore-ul surs: conine date menite s ncarce datastore-ul destinaie. Dou tipuri de
datastore pot fi utilizate ca surs a unei interfee: datastore-urile din modele i datastore-urile
temporare.
Datastore-ul surs al interfeei poate fi filtrat n timpul procesului de ncrcare i poate fi pus n
relaii de join. Filtrii i join-urile pot fi recuperate din definiia modelelor i de asemenea pot fi
definite pentru interfa.
- Mapri: definesc regulile de transformare pe surs capabile s genereze date pentru ncrcarea
destinaiei.
- Fluxul: este un set de strategii de ncrcare i integrare pentru datele mapate bazate pe
knowledge module-uri.
- Control Strategy: permite definirea metodei de verificare a fluxului nainte de ncrcarea n
destinaie. Control Strategy este definit de un Check Kwnoledge Module.
Interfeele utilizeaz urmtoarele componente: datastore-ul definit n modele ca surs i
destinaie pentru procesul de ncrcare; Kwnoledge Module-ulul pentru a genera procesul
necesar ncrcrii; variabilele i secvenele pentru a memora valori n expresii; user function-uri
pentru a uura coding-ul regulilor de transformare.