Databehandling er et felt innen informatikk som samler ulike teknikker knyttet til produksjon, prosessering, indeksering og komprimering av digitale bilder . Et digitalt bilde er en binær representasjon av et bilde, bestående av en matrise av punkter kalt piksler, som kan ha forskjellige dimensjoner ( romlig, tidsmessig, etc. ) og forskjellige kodenivåer ( farger, grånivåer, etc. ).
Computational imaging har mange applikasjoner innen forskjellige felt, for eksempel bildesyntese, virtuell virkelighet, utvidet virkelighet, 3D -modellering , bildebehandling videobehandling , videoredigering , komprimering , datasyn bildesøk etter innhold , eller til og med videospill .
I denne artikkelen vil vi introdusere deg til de grunnleggende prinsippene for databehandling, typer digitale bilder, metoder for bildebehandling og analyse, samt hovedområdene for bruk av denne teknologien .
Hva er typene digitale bilder?
Datamaskinavbildning er avhengig av tre hovedstadier: innhenting , transformasjon og visualisering av digitale bilder .
Innhenting av digitale bilder
Digital bildeinnsamling innebærer å konvertere et analogt bilde (for eksempel et fotografi eller en ekte scene) til et digitalt bilde. For å gjøre dette må vi bruke enheter som er i stand til å fange lys og transformere det til elektriske signaler, deretter til binære data. Disse enhetene kalles sensorer eller analog-til-digital-omformere. Det finnes ulike typer sensorer, avhengig av hvilken type bilde som skal innhentes ( stillbilde eller bevegelig bilde, farge- eller svart-hvitt-bilde osv.) og avhengig av bruksområdet (fotografi, video, skanner, termisk kamera osv.) .).
Transformasjon av digitale bilder
Transformasjonen av digitale bilder består i å modifisere de binære dataene som representerer bildet, for å forbedre kvaliteten, trekke ut relevant informasjon eller lage ny. For å gjøre dette må du bruke dataprogrammer som bruker spesifikke algoritmer på digitale bilder. Disse programmene kalles bildeprogramvare eller grafikkverktøy. Det finnes ulike typer bildeprogramvare, avhengig av type transformasjon som skal utføres (korreksjon, filtrering, segmentering, kantdeteksjon, formgjenkjenning, etc.) og avhengig av bruksområdet (fotoredigering, videoredigering, syntese) . bilde osv.).
Se digitale bilder
Å se digitale bilder innebærer å vise det digitale bildet på et passende medium, for eksempel en dataskjerm, skriver eller projektor. For å gjøre dette er det nødvendig å bruke enheter som er i stand til å konvertere binære data til elektriske eller optiske signaler som vil stimulere elementene i støtten. Disse enhetene kalles digital-til-analog-omformere. Det finnes forskjellige typer digital-til-analog-omformere , avhengig av typen media som brukes (LCD-skjerm, OLED-skjerm, blekkskriver, laserskriver, etc.) og avhengig av ønsket visningsmodus (2D- eller 3D-bilde, stereoskopisk bilde) eller holografisk osv.)
Hva er typene digitale bilder?
Det finnes forskjellige typer digitale bilder, avhengig av hvordan pikslene er kodet og organisert. Vi kan skille mellom to hovedkategorier: rasterbilder og vektorbilder.
Rasterbilder
Rasterbilder er bilder som består av et rutenett av piksler, hvor hver piksel har en verdi som representerer fargen eller grånivået. Rasterbilder egner seg for å representere realistiske bilder, med fine detaljer og fargenyanser. De er også enkle å manipulere med bildebehandlingsprogramvare , som kan bruke piksel-for-piksel-transformasjoner. Rasterbilder har imidlertid også ulemper: de tar opp mye minneplass, de er utsatt for støy og kompresjonsartefakter, og de mister kvalitet når de forstørres eller reduseres.
Det finnes forskjellige filformater for lagring av rasterbilder, som J PEG, PNG, GIF, BMP, TIFF, etc. Disse formatene kan klassifiseres etter om de er komprimerte eller ukomprimerte, og om de er tapsfrie eller tapsfrie. Et komprimert format reduserer filstørrelsen ved å eliminere viss overflødig eller knapt merkbar informasjon. Et tapsformat fjerner informasjon som kan endre kvaliteten på bildet, mens et tapsfritt format beholder all informasjon.
Vektorbilder
Vektorbilder er bilder som består av geometriske objekter, som punkter, linjer, kurver, polygoner osv., hvor hvert objekt har attributter som definerer dens posisjon, form, farge, fyll osv. Vektorbilder er egnet for å representere enkle bilder , med vanlige former og ensartede farger. De er også enkle å modifisere med programvare for vektortegning , som kan bruke geometriske transformasjoner på objekter. I tillegg har vektorbilder fordelen av å oppta lite minneplass, være ufølsomme for støy og komprimering, og opprettholde kvaliteten uavhengig av zoomnivået .
Det finnes forskjellige filformater for lagring av vektorbilder , for eksempel SVG, EPS, PDF, WMF, etc. Disse formatene kan klassifiseres etter om de er standard eller proprietære, og om de er kompatible med nettlesere eller ikke. Et standardformat er et format som følger en åpen standard og kan leses av annen programvare. Et proprietært format er et som eies av et selskap eller en organisasjon og kan kreve spesifikk programvare for å spille. Et nettleserkompatibelt format er et format som kan vises direkte på en nettside uten behov for en plugin eller ekstern applikasjon .
Hva er metodene for å behandle og analysere digitale bilder?
Behandling og analyse av digitale bilder består i å bruke operasjoner på digitale bilder for å forbedre kvaliteten, trekke ut nyttig informasjon eller lage ny . Det finnes ulike metoder for å behandle og analysere digitale bilder, avhengig av type bilde (matrise eller vektor), domenet (romlig eller frekvens), formålet (korreksjon, filtrering, segmentering, kantdeteksjon, formgjenkjenning, etc. ) og nivået (lavt nivå, middels nivå eller høyt nivå).
Bearbeiding og analyse av rasterbilder
Behandling og analyse av rasterbilder kan gjøres i to forskjellige domener: det romlige domenet og frekvensdomenet.
Romdomenet
Det romlige domenet tilsvarer domenet der pikslene er ordnet i henhold til deres plassering i bildet . Behandlingen og analysen av rasterbilder i det romlige domenet består av å bruke operasjoner direkte på pikselverdiene, uten å gå gjennom en tidligere transformasjon . Disse operasjonene kan være av forskjellige typer, for eksempel:
- Correction , som har som mål å forbedre bildekvaliteten ved å endre parametere som lysstyrke, kontrast, fargebalanse, etc.
- Filtrering , som tar sikte på å redusere støy eller fremheve visse detaljer i bildet ved å bruke masker eller filtre som endrer pikselverdier basert på naboene.
- Segmentering eller meningsfulle områder i henhold til kriterier som farge, tekstur, intensitet, etc.
- Kantdeteksjon , som tar sikte på å identifisere grenser mellom bilderegioner ved å bruke operatører som beregner gradienten eller variasjonen i pikselintensitet.
- Mønstergjenkjenning , som tar sikte på å identifisere og klassifisere objekter som finnes i bildet ved hjelp av teknikker som mønstersammenligning, funksjonsbeskrivelse, maskinlæring, etc.
Frekvensdomenet
Frekvensdomenet tilsvarer domenet der pikslene er ordnet i henhold til deres frekvens eller deres periodisitet i bildet. Behandling og analyse av rasterbilder i frekvensdomenet innebærer å bruke operasjoner etter transformering av bildet fra det romlige domenet til frekvensdomenet. Denne transformasjonen gjør det mulig å representere bildet som en sum av sinusformede funksjoner med forskjellige frekvenser og amplituder. Lavfrekvente sinusfunksjoner tilsvarer generelle variasjoner i bildet, mens høyfrekvente sinusfunksjoner tilsvarer fine bildedetaljer. Operasjoner i frekvensdomenet kan være av forskjellige typer, for eksempel:
- Komprimering , som tar sikte på å redusere filstørrelsen ved å eliminere sinusformede funksjoner som har liten innvirkning på den visuelle oppfatningen av bildet .
- Filtrering , som tar sikte på å redusere støy eller fremheve visse detaljer i bildet ved å bruke filtre som modifiserer amplitudene til de sinusformede funksjonene i henhold til deres frekvens.
- Restoration , som tar sikte på å forbedre bildekvaliteten ved å korrigere forvrengninger forårsaket av sensoren eller digital-til-analog-omformeren .
- Mønstergjenkjenning , som tar sikte på å identifisere og klassifisere objekter som finnes i bildet ved hjelp av teknikker som krysskorrelasjon, Hough-transformasjon, wavelet-transformasjon, etc.
Bearbeiding og analyse av vektorbilder
Behandlingen og analysen av vektorbilder består i å bruke operasjoner på de geometriske objektene som utgjør bildet. Disse operasjonene kan være av forskjellige typer, for eksempel:
- Geometrisk transformasjon , som tar sikte på å endre posisjonen, størrelsen, orienteringen eller formen til geometriske objekter ved hjelp av matriser eller matematiske funksjoner.
- Fargelegging , som har som mål å endre fargen eller fyllet til geometriske objekter ved å bruke attributter eller gradienter.
- Opprettelsen av komplekse objekter , som tar sikte på å kombinere flere enkle geometriske objekter ved å bruke boolske operasjoner (union, skjæring, forskjell, etc.) eller deformasjonsoperasjoner (krumning, vridning, etc.).
- Rasterisering , som tar sikte på å konvertere et vektorbilde til et rasterbilde ved å beregne pikselverdiene som tilsvarer geometriske objekter.
- Vectorization , som tar sikte på å konvertere et rasterbilde til et vektorbilde ved å oppdage konturene og områdene av bildet og tilnærme dem med geometriske objekter.
Hva er de viktigste bruksområdene for databehandling?
Databehandling har mange applikasjoner innen ulike felt, som kan grupperes i tre brede kategorier: opprettelse, kommunikasjon og forståelse av digitale bilder .
Lage digitale bilder
Digital bildeskaping består i å produsere originale bilder eller modifisere eksisterende bilder for kunstneriske, rekreasjons- eller pedagogiske formål. Bruksområder for digital bildeoppretting inkluderer:
- Bildesyntese , som innebærer å generere bilder fra matematiske modeller eller digitale data, ved å bruke teknikker som strålesporing, ikke-fotorealistisk gjengivelse, prosedyregenerering, etc.
- Virtual reality , som består av å skape og simulere et oppslukende og interaktivt miljø der brukeren kan bevege seg og handle, ved hjelp av enheter som virtual reality-headsettet, datahansker, tredemølle, etc.
- Augmented reality , som består av å legge virtuelle elementer over et ekte bilde, ved å bruke enheter som smarttelefoner, nettbrett, tilkoblede briller, etc.
- 3D-modellering , som består av å lage og manipulere tredimensjonale objekter fra geometriske primitiver eller punktskyer, ved å bruke programvare som Blender, Maya, SketchUp, etc.
- Videoredigering , som innebærer å sette sammen, kutte, modifisere eller legge til effekter i videosekvenser, ved å bruke programvare som Adobe Premiere Pro, Final Cut Pro, iMovie, etc.
- Videospill , som består av å lage og spille interaktive og morsomme scenarier der spilleren kontrollerer en eller flere karakterer eller objekter, ved å bruke plattformer som spillkonsollen, datamaskinen, smarttelefonen osv.
Digital bildekommunikasjon
Digital bildekommunikasjon består i å overføre eller spre bilder gjennom ulike medier eller nettverk, for informasjons-, reklame- eller sosiale formål. Bruksområdene for digital bildekommunikasjon inkluderer:
- Komprimering lagring eller overføring av dem.
- Kryptografi , som innebærer å beskytte bilder mot uautorisert tilgang eller ondsinnet modifikasjon, ved å bruke teknikker som kryptering, digital vannmerking, digital signering, etc.
- Innholdsbasert bildesøk , som består av å finne bilder som ligner eller er relevante for et tekstlig eller visuelt søk, ved å bruke teknikker som visuell funksjonsekstraksjon , søkeordindeksering, likhetsvisuelt, rangering etter relevans, etc.
- Ansiktsgjenkjenning , som innebærer å identifisere eller verifisere identiteten til en person fra ansiktet deres, ved å bruke teknikker som funksjonspunktgjenkjenning, mønstersammenligning, dyp læring, etc.
- Sosiale nettverk , som består av å dele eller kommentere bilder med andre brukere, ved å bruke plattformer som Facebook, Instagram, Snapchat, etc.
Forstå digitale bilder
bildeforståelse innebærer å analysere eller tolke bilder for vitenskapelige, medisinske eller industrielle formål. Bruksområdene for å forstå digitale bilder inkluderer:
- Datasyn , som involverer simulering av menneskelig visuell persepsjon og trekke ut semantisk eller geometrisk informasjon fra bilder, ved å bruke teknikker som semantisk segmentering, gjenstandsdeteksjon, bevegelsessporing, 3D-rekonstruksjon, etc. .
- Medisinsk bildebehandling , som innebærer å produsere eller analysere bilder av menneskekroppen for diagnostiske eller behandlingsformål, ved bruk av teknikker som radiografi, ultralyd, MR, tomografi , etc.
- Vitenskapelig avbildning , som innebærer å produsere eller analysere bilder av naturlige eller kunstige fenomener for forsknings- eller utforskningsformål, ved bruk av teknikker som mikroskopi, spektroskopi, fjernmåling, astrofotografering, etc.
- Industriell bildebehandling , som innebærer å produsere eller analysere bilder av industrielle produkter eller prosesser for kvalitetskontroll eller sikkerhetsformål, ved bruk av teknikker som maskinsyn, ikke-destruktiv testing, infrarød termografi, etc. .
Konklusjon
Computational imaging er et spennende og utviklende felt , som gir mange muligheter for å skape, kommunisere og forstå digitale bilder. Enten for underholdning, informasjon eller vitenskap, gjør databehandling Databehandling byr imidlertid også på utfordringer og etiske problemer, som respekt for personvern, opphavsrett eller sannheten til bilder. Det er derfor viktig å trene i prinsippene og teknikkene for dataavbildning, men også å utvikle et kritisk og ansvarlig tankesett når man arbeider med digitale bilder. Business intelligence , for eksempel, er en av disiplinene som er avhengige av databehandling for å analysere og visualisere komplekse og store data, for å hjelpe beslutningstaking i ulike bruksområder.