Datoravbildning är ett område inom datavetenskap som sammanför olika tekniker relaterade till produktion, bearbetning, indexering och komprimering av digitala bilder. En digital bild är en binär representation av en bild, bestående av en matris av punkter som kallas pixlar, vilka kan ha olika dimensioner ( rumsliga, tidsmässiga, etc. ) och olika kodningsnivåer ( färger, gråskala, etc. ).
Datoravbildning har många tillämpningar inom olika områden, såsom bildsyntes, virtuell verklighet, förstärkt verklighet, 3D-modellering, bildbehandling , videobehandling , videoredigering , komprimering , datorseende , innehållsbaserad bildhämtning och videospel .
I den här artikeln kommer vi att introducera dig till de grundläggande principerna för datorbildbehandling, typerna av digitala bilder, bildbehandlings- och analysmetoder, samt de viktigaste tillämpningsområdena för denna teknik .
Vilka typer av digitala bilder finns det?

Datoravbildning bygger på tre huvudsteg: förvärv , omvandling och visualisering av digitala bilder .
Förvärv av digitala bilder
Digital bildinsamling innebär att konvertera en analog bild (till exempel ett fotografi eller en verklig scen) till en digital bild. Detta kräver enheter som kan fånga ljus och omvandla det till elektriska signaler och sedan till binära data. Dessa enheter kallas sensorer eller analog-till-digital-omvandlare. Olika typer av sensorer finns, beroende på vilken typ av bild som ska insamlas ( stillbild eller rörlig bild, färg- eller svartvit bild, etc.) och tillämpningen (fotografering, video, skanning, värmeavbildning, etc.).
Transformationen av digitala bilder

Digital bildtransformation innebär att modifiera den binära data som representerar bilden för att förbättra dess kvalitet, extrahera relevant information eller skapa ny information. Detta kräver användning av datorprogram som tillämpar algoritmer specifika för digitala bilder. Dessa program kallas bildprogram eller grafikverktyg. Olika typer av bildprogram finns, beroende på vilken typ av transformation som ska utföras (korrigering, filtrering, segmentering, kantdetektering, mönsterigenkänning, etc.) och tillämpningsområde ( fotoretuschering, videoredigering, bildsyntes , etc.).
Visualisera digitala bilder
Digital bildvisualisering innebär att den digitala bilden visas på ett lämpligt medium, såsom en datorskärm, skrivare eller projektor. Detta kräver enheter som kan omvandla binär data till elektriska eller optiska signaler som stimulerar elementen i mediet. Dessa enheter kallas digital-till-analog-omvandlare (DAC). Olika typer av DAC , beroende på vilken typ av medium som används (LCD-skärm, OLED-skärm, bläckstråleskrivare, laserskrivare, etc.) och önskat visningsläge (2D- eller 3D-bild, stereoskopisk eller holografisk bild, etc.).
Vilka typer av digitala bilder finns det?

Det finns olika typer av digitala bilder, beroende på hur pixlarna är kodade och organiserade. Två huvudkategorier kan urskiljas: rasterbilder och vektorbilder.
Matrisbilder
Rasterbilder är bilder som består av ett rutnät av pixlar, där var och en har ett värde som representerar dess färg- eller gråskalenivå. Rasterbilder är väl lämpade för att representera realistiska bilder med fina detaljer och subtila färgnyanser. De är också enkla att manipulera med bildredigeringsprogram , som kan tillämpa transformationer pixel för pixel. Rasterbilder har dock också nackdelar: de kräver mycket lagringsutrymme, är känsliga för brus och komprimeringsartefakter och förlorar i kvalitet när de förstoras eller förminskas.
Det finns olika filformat för att lagra rasterbilder, såsom JPEG , PNG, GIF, BMP, TIFF, etc. Dessa format kan klassificeras efter om de är komprimerade eller okomprimerade, och om de är förlustbetonade eller förlustfria. Ett komprimerat format minskar filstorleken genom att eliminera redundant eller osynlig information. Ett förlustbetonat format tar bort information som kan försämra bildkvaliteten, medan ett förlustfritt format bevarar all information.
Vektorbilder

Vektorbilder är bilder som består av geometriska objekt, såsom punkter, linjer, kurvor, polygoner etc., som var och en har attribut som definierar dess position, form, färg, fyllning och så vidare. Vektorbilder är väl lämpade för att representera enkla bilder med regelbundna former och enhetliga färger. De är också enkla att modifiera med vektorgrafikprogramvara , som kan tillämpa geometriska transformationer på objekten. Dessutom har vektorbilder fördelen att de kräver lite lagringsutrymme, är okänsliga för brus och komprimering, och bibehåller sin kvalitet oavsett zoomnivå .
Det finns olika filformat för att lagra vektorbilder , såsom SVG, EPS, PDF, WMF, etc. Dessa format kan klassificeras som standard eller proprietära, och som kompatibla med webbläsare. Ett standardformat följer en öppen standard och kan läsas av olika program. Ett proprietärt format tillhör ett företag eller en organisation och kan kräva specifik programvara för att läsas. Ett webbläsarkompatibelt format kan visas direkt på en webbsida utan behov av ett plugin eller externt program .
Vilka metoder finns det för att bearbeta och analysera digitala bilder?
bildbehandling och analys innebär att man tillämpar operationer på digitala bilder för att förbättra deras kvalitet, extrahera användbar information eller skapa ny information . Det finns olika metoder för att bearbeta och analysera digitala bilder, beroende på bildtyp (raster eller vektor), domän (spatial eller frekvens), syfte ( korrigering, filtrering, segmentering, kantdetektering, mönsterigenkänning, etc. ) och nivå (låg nivå, medelnivå eller hög nivå).
Matrisbildbehandling och analys

Bearbetning och analys av matrisbilder kan göras i två olika domäner: den rumsliga domänen och frekvensdomänen.
Rymdomänen
Den rumsliga domänen motsvarar det område där pixlar är arrangerade enligt sin position i bilden . Bearbetning och analys av rasterbilder i den rumsliga domänen innebär att operationer appliceras direkt på pixelvärdena, utan föregående transformation . Dessa operationer kan vara av olika typer, såsom:
- Korrigering , som syftar till att förbättra bildkvaliteten genom att modifiera parametrar som ljusstyrka, kontrast, färgbalans etc.
- Filtrering vissa bilddetaljer genom att använda masker eller filter som modifierar pixelvärden baserat på deras grannar.
- Segmentering i homogena eller meningsfulla regioner enligt kriterier som färg, textur, intensitet etc.
- Kantdetektering , som syftar till att identifiera gränserna mellan bildregioner med hjälp av operatorer som beräknar gradienten eller variationen i pixelintensitet.
- Mönsterigenkänning , som syftar till att identifiera och klassificera objekt som finns i bilden med hjälp av tekniker som mönsterjämförelse, funktionsbeskrivning, maskininlärning etc.
Frekvensdomänen
Frekvensdomänen motsvarar det område där pixlar är arrangerade enligt sin frekvens eller periodicitet i bilden. Bearbetning och analys av rasterbilder i frekvensdomänen innebär att man tillämpar operationer efter att bilden har transformerats från den rumsliga domänen till frekvensdomänen. Denna transformation gör att bilden kan representeras som en summa av sinusformade funktioner med olika frekvenser och amplituder. Lågfrekventa sinusformade funktioner motsvarar bildens övergripande variationer, medan högfrekventa sinusformade funktioner motsvarar bildens fina detaljer. Operationer i frekvensdomänen kan vara av olika typer, såsom:
- Komprimering , som syftar till att minska filstorleken genom att eliminera sinusformade funktioner som har liten inverkan på den visuella uppfattningen av bilden .
- Filtrering vissa bilddetaljer genom att använda filter som modifierar amplituderna hos sinusformade funktioner i enlighet med deras frekvens.
- Restaurering syftar till att förbättra bildkvaliteten genom att korrigera förvrängningar orsakade av sensorn eller digital-till-analog-omvandlaren .
- Mönsterigenkänning , som syftar till att identifiera och klassificera objekt som finns i bilden med hjälp av tekniker som korskorrelation, Hough-transform, wavelet-transform, etc.
Vektorbildbehandling och analys

Vektorbildbehandling och analys innebär att man tillämpar operationer på de geometriska objekt som utgör bilden. Dessa operationer kan vara av olika typer, såsom:
- Geometrisk transformation , som syftar till att modifiera positionen, storleken, orienteringen eller formen på geometriska objekt med hjälp av matriser eller matematiska funktioner.
- Färgläggning i geometriska objekt med hjälp av attribut eller gradienter.
- Skapandet av komplexa objekt , som syftar till att kombinera flera enkla geometriska objekt med hjälp av booleska operationer (förening, skärningspunkt, differens, etc.) eller deformationsoperationer (krökning, vridning, etc.).
- Rasterisering till en rasterbild genom att beräkna pixelvärdena som motsvarar geometriska objekt.
- Vektorisering bildens konturer och regioner och approximera dem med geometriska objekt .
Vilka är de viktigaste tillämpningsområdena för datorbildbehandling?

Datoravbildning har många tillämpningar inom olika områden, vilka kan grupperas i tre huvudkategorier: skapande, kommunikation och förståelse av digitala bilder .
Skapandet av digitala bilder
Digital bildskapande innebär att producera originalbilder eller modifiera befintliga bilder för konstnärliga, rekreativa eller utbildningsändamål. Användningsområden för digital bildskapande inkluderar:
- Bildsyntes , som består av att generera bilder från matematiska modeller eller digitala data med hjälp av tekniker som strålspårning, icke-fotorealistisk rendering, procedurgenerering etc.
- Virtuell verklighet , som består av att skapa och simulera en immersiv och interaktiv miljö där användaren kan röra sig och agera, med hjälp av enheter som VR-headset, datahandskar, löpband etc.
- Förstärkt verklighet , som består av att lägga virtuella element över en verklig bild med hjälp av enheter som smartphones, surfplattor, smarta glasögon etc.
- 3D-modellering , som består av att skapa och manipulera tredimensionella objekt från geometriska primitiver eller punktmoln, med hjälp av programvara som Blender, Maya, SketchUp, etc.
- Videoredigering , som består av att sätta ihop, klippa, modifiera eller lägga till effekter till videosekvenser med hjälp av programvara som Adobe Premiere Pro, Final Cut Pro, iMovie, etc.
- Videospel , som går ut på att skapa och spela interaktiva och lekfulla scenarier där spelaren styr en eller flera karaktärer eller objekt, med hjälp av plattformar som spelkonsoler, datorer, smartphones etc.
Digital bildkommunikation

Digital bildkommunikation innebär att bilder överförs eller sprider sig över olika medier eller nätverk för informations-, reklam- eller sociala ändamål. Tillämpningsområden för digital bildkommunikation inkluderar:
- Komprimering redundant eller knappt märkbar information, för att underlätta lagring eller överföring av dem.
- Kryptografi , som består av att skydda bilder mot obehörig åtkomst eller skadlig modifiering med hjälp av tekniker som kryptering, digital vattenstämpel, digital signatur etc.
- Innehållsbaserad bildsökning , som består av att hitta bilder som liknar eller är relevanta för en textuell eller visuell fråga, med hjälp av tekniker som visuell funktionsutvinning , nyckelordsindexering, visuell likhet, rangordning efter relevans etc.
- Ansiktsigenkänning , som består av att identifiera eller verifiera en persons identitet utifrån deras ansikte, med hjälp av tekniker som punktdetektering av särdrag, mönsterjämförelse, djupinlärning etc.
- Sociala nätverk , som består av att dela eller kommentera bilder med andra användare, med hjälp av plattformar som Facebook, Instagram, Snapchat, etc.
Att förstå digitala bilder

bildförståelse innebär att analysera eller tolka bilder för vetenskapliga, medicinska eller industriella ändamål. Tillämpningsområden för digital bildförståelse inkluderar:
- Datorseende , som består av att simulera mänsklig visuell perception och extrahera semantisk eller geometrisk information från bilder med hjälp av tekniker som semantisk segmentering, objektdetektering, rörelsespårning, 3D-rekonstruktion etc.
- Medicinsk avbildning , som består av att producera eller analysera bilder av människokroppen för diagnostiska eller behandlingsändamål, med hjälp av tekniker som radiografi, ultraljud, MR, tomografi etc.
- Vetenskaplig avbildning , som består av att producera eller analysera bilder av naturliga eller artificiella fenomen för forsknings- eller utforskningsändamål, med hjälp av tekniker som mikroskopi, spektroskopi, fjärranalys, astrofotografering etc.
- Industriell avbildning , som består av att producera eller analysera bilder av industriprodukter eller processer för kvalitetskontroll eller säkerhetsändamål, med hjälp av tekniker som maskinseende, oförstörande provning, infraröd termografi etc.
Slutsats
Datorbaserad bildbehandling är ett spännande och snabbt växande område som erbjuder många möjligheter att skapa, kommunicera och förstå digitala bilder. Oavsett om det gäller underhållning, information eller vetenskap, datorbaserad bildbehandling produktion och manipulation av bilder av oöverträffad kvalitet och rikedom. Datorbaserad bildbehandling medför dock också etiska utmaningar och frågor, såsom respekt för integritet, upphovsrätt och bildernas sanningsenlighet. Det är därför viktigt att lära sig principerna och teknikerna för datorbaserad bildbehandling, men också att utveckla ett kritiskt och ansvarsfullt förhållningssätt till digitala bilder. Affärsintelligens är till exempel en av de discipliner som förlitar sig på datorbaserad bildbehandling för att analysera och visualisera komplexa och stora datamängder för att stödja beslutsfattande inom olika tillämpningsområden.



