Académique Documents
Professionnel Documents
Culture Documents
Îmi încep lucrarea prin a prezenta câteva noțiuni teoretice introductive legate de
procesarea și analiza imaginilor.
Atât în procesarea imaginilor alb-negru cât și a imaginilor color, detecția muchiilor este
una dintre operațiile de bază. Muchia în imaginile alb-negru este definită într-un mod acromatic,
de fapt, este o discontinuitate în funcția luminozității. Pe de altă parte, muchia în imaginile color
este o extensie a muchiei în imaginile alb-negru cu scopul de a găsi discontinuitățile de-a lungul
regiunilor adiacente a unei imagini color într-un spațiu 3D color dependent de unele funcții de
măsură a distanțelor în spațiul color. Principala problemă a detecției muchiilor color este
necorelarea tehnicilor monocrome aplicate celor trei plane de culoare. De exemplu, pentru
netezirea unei anumite componente de culoare din imagine, filtrarea vectorială va da rezultate
incorecte. Motivul este filtrarea nelineară a operației de netezire. Folosind filtrarea vectorială,
pixelul median rezultat prin operațiile vectoriale nu va fi același cu fiecare pixel median de pe
cele trei plane de culoare (roșu, verde sau albastru) și prin urmare, rezultatul poate să conțină
zgomot și/sau o valoare incorectă a pixelului. În schimb, folosind filtrul median, se va alege
pixelul corect deoarece este aleasă valoarea corectă a medianei pixelului folosind informații
despre distanță, considerând culoarea un vector 3D. Există și operații alternative atunci când,
pentru filtrarea neliniară, sunt folosite operații vectoriale. O nouă metodă folosește Algebra
Geometrică, ce definește culoarea ca fiind o singură entitate vectorială folosită pentru procesarea
imaginilor color.
În ultimii ani, dispozitivele mobile și nu numai au fost dotate cu obiective tot mai bune și
display-uri cu o rezoluție tot mai mare. Un alt pas important în procesarea unei imagini color
într-un lanț digital de genul obiectiv-display este scalarea imaginii. Un senzor de 5 megapixeli
este tipic unei camere digitale dar este folosit și la telefoanele mobile performante, acest
parametru crescând constant. Mărimea display-urilor dispozitivelor mobile nu a crescut în același
ritm, dar imaginile captate trebuie micșorate pentru a încăpea pe display. Aici este aplicat cu
succes acest tip de procesare, dimensionarea imaginii. Acest lucru înseamnă micșorarea imaginii
folosind metode de decimare. În alte cazuri, o imagine este mai mică decât display-ul sau conține
un anumit detaliu. În acest caz imaginea poate fi mărită. Această operație folosește metode de
interpolare. Metodele de decimare și de interpolare de bază nu sunt complexe și sunt
implementate cu succes, dar produc distorsiuni și pixelații severe. Algoritmii de micșorare și
mărire trebuie să fie adecvați, altfel sunt introduse în imagine distorsiuni, neteziri excesive,
pixelații sau muchii crestate.
Câteodată doar o parte din imagine ne interesează și variind nivelul de mărire ne ajută să
vizualizăm această parte. Operațiunea de mărire poate fi implementată folosind anumiți
algoritmi. O metodă de bază pentru această operațiune se numește copierea pixelului (pixel
copy), ceea ce înseamnă că se va copia un pixel de intrare peste mai mulți pixeli de ieșire.
Această metodă produce pixelații puternice. Rezultate mai bune se obțin folosind metode care
folosesc unele filtrări spațiale. Fiecare metodă în parte are o anumită complexitate.
Din cauză că se variază dimensiunea imaginii sursă și imaginii target, este nevoie de
metode care suportă toate rapoartele posibile. O altă metodă cunoscută este interpolarea
bilineară. În această metodă, pixelul de ieșire reprezintă media ponderată a pixelilor de intrare
vecini. Practic, ponderea poate fi calculată pentru orice tip de raport. De aceea, interpolarea
bilineară este un bun compromis între complexitate și calitate. Deasemenea, o medie ponderată a
pixelilor vecini poate fi folosită și în cazul decimării. O altă metodă care folosește media
ponderată a pixelilor vecini este LUT (Look-up Table), aceasta fiind rapidă și potrivită pentru
implementarea pe dispozitivele mobile.
Mai departe discut despre procesul generării unei imagini cu super-rezoluție (SR), dintr-o
imagine de mică-rezoluție (low-resolution LR). O aplicație importantă a acestei procesări stă în
industria cinematografică și televiziune, fiind nevoie de proiecții cu rezoluție mare (HD, 2K,
4K). O altă aplicație a super-rezoluției poate fi găsită pe site-urile de video streaming, care de
cele mai multe ori stochează fișiere video de mică rezoluție (352 x 288 pixeli) din mai multe
motive. Problema apare atunci când utilizatorii încearcă să urmărească fișierul video pe tot
ecranul (full screen) la o rezoluție, să zicem, de 1024 x 768, sau mai mare. Acest proces cere ca
imaginile să fie interpolate la o rezoluție mai mare. O altă aplicație vine odată cu apariția
display-urilor HDTV. Pentru a se putea folosi cât mai bine capacitățile unui astfel de display,
semnalul de intrare care vine de la o sursă de rezoluție scăzută (LR) trebuie să fie mai întâi
transformat într-unul cu o rezoluție mai mare prin interpolare.
Producătorii din industria cinematografică caută o soluție care să înglobeze tot procesul –
de la filmare până la post-producție și mai departe, la proiecție. Recent apărut, cinema-ul digital
încă are de suferit din cauza limitărilor care pot să împiedice productivitatea și creativitatea
cineaștilor și companiilor din acest domeniu. O astfel de limitare este faptul că, camerele folosite
pentru rezoluții mari sunt foarte scumpe și fișierele produse și stocate au dimensiuni mari. Din
acest motiv, studiourile încearcă să capteze imaginile la o rezoluție mai mică (2K). Mai târziu,
secvențele pot fi interpolate în secvențe de 4K prin folosirea unei tehnici de super-rezoluție și
proiecția se face pe dispozitive de mare rezoluție.
Există trei categorii de abordări pentru această problemă: metode bazate pe interpolare,
metode bazate pe reconstrucție și metode bazate pe învățare. Cea mai des folosită în practică este
metoda interpolării, cum ar fi interpolarea bilineară sau bicubică, acestea au nevoie de puține
resurse. Dar fiind metode foarte simplificate, acestea produc imagini cu unele probleme cum ar
fi: distorsionări, imagini blurate și muchii în zig-zag. Între timp, au fost propuși unii algoritmi
pentru a îmbunătăți acest tip de abordare. Unul dintre cei mai buni algoritmi de interpolare este
bazat pe transformarea facțională, acesta furnizează o reprezentare geometrică multidimensională
eficientă pentru imagini naturale.
În continuare vreau să discut despre despre o metodă simplă, numită “codare risipită” cu
o bibliotecă redundanță, având un randament bun în reprezentarea imaginilor, prin care unele
procese cum ar fi eliminarea zgomotului și eliminarea estompărilor sunt cu succes rezolvate. Mai
mult de atât, de curând, în domeniul neuroștiințelor, ipotezele funcționale, care în domeniul
reprezentărilor semnalelor nervoase sunt implementate prin codarea risipită, câștigă tot mai mult
teren.
În domeniul procesării imaginilor color este abordată și problema compresiei. Cele mai
multe tehnici de compresie a imaginilor color se bazează pe decorelarea culorilor primare.
Această metodă constă în aplicarea unei transformări a componentelor color (CCT) în
componentele RGB pentru a reduce corelarea dintre culori, iar apoi codând separat fiecare
componentă color. JPEG și JPEG2000 sunt exemple de algoritmi care se bazează pe această
abordare. Recent a fost prezentată o nouă abordare a compresiei imaginilor color bazată pe
utilizarea corelației dintre componentele color, devansând metoda obișnuită bazată pe decorelare.
Cea mai nouă metodă de compresie a imaginilor color folosește ambele abordări
generalizate. Se deduce și se optimizează comportamentul R-D. Optimizarea oferă o nouă
perspectivă în ceea ce privește folosirea metodei optime CCT pentru fiecare plan de culoare. De
altfel, aceasta este și baza unui nou algoritm de compresie care folosește CCT.
Chiar și modelul perfect are imperfecțiuni. Chiar și cea mai bună fotografie se poate
îmbunătăți. În general procesările foto includ și post-procesări, în scopul ameliorării sau ajustării
imaginilor captate din diferite surse sau dispozitive, îmbunătățirea imaginii în scopul punerii în
evidență a caracteristicilor și conținutului acesteia. Post-procesarea se regăsește chiar și în
fotografia unor mari fotojurnaliști, chiar intensivă uneori, doar că nu își propune să altereze
realitatea prin elemente exagerate coloristic sau adăugarea de elemente externe, ci să sublinieze o
anumită atmosferă, accentuând, de multe ori, dramatismul momentului.
Bibliografie: