Computer Imaging: Vad är det?

Datoravbildning är ett område inom datavetenskap som sammanför olika tekniker relaterade till produktion, bearbetning, indexering och komprimering av digitala bilder . En digital bild är en binär representation av en bild, som består av en matris av punkter som kallas pixlar, som kan ha olika dimensioner ( rumslig, tidsmässig, etc. ) och olika kodningsnivåer ( färger, grånivåer, etc. ).

Beräkningsavbildning har många tillämpningar inom olika områden, såsom bildsyntes, virtuell verklighet, förstärkt verklighet, 3D -modellering , bildbehandling videobehandling , videoredigering , komprimering , datorseende bildsökning efter innehåll eller till och med videospel .

I den här artikeln kommer vi att introducera dig till de grundläggande principerna för datoravbildning, typer av digitala bilder, metoder för bildbehandling och analys, såväl som de viktigaste tillämpningsområdena för denna teknik .

Vilka typer av digitala bilder finns det?

Vilka typer av digitala bilder finns det?

Datoravbildning bygger på tre huvudsteg: förvärv , transformation och visualisering av digitala bilder .

Inhämtning av digitala bilder

Digital bildinsamling innebär att en analog bild (till exempel ett fotografi eller en riktig scen) konverteras till en digital bild. För att göra detta måste vi använda enheter som kan fånga ljus och omvandla det till elektriska signaler, sedan till binära data. Dessa enheter kallas sensorer eller analog-till-digital-omvandlare. Det finns olika typer av sensorer, beroende på vilken typ av bild som ska inhämtas ( stillbild eller rörlig bild, färg eller svartvit bild, etc.) och beroende på användningsområde (fotografi, video, skanner, värmekamera, etc.) .).

Transformation av digitala bilder

Transformation av digitala bilder

Transformationen av digitala bilder består av att modifiera de binära data som representerar bilden, för att förbättra dess kvalitet, extrahera relevant information eller skapa ny. För att göra detta måste du använda datorprogram som tillämpar specifika algoritmer på digitala bilder. Dessa program kallas bildprogramvara eller grafikverktyg. Det finns olika typer av bildbehandlingsprogram, beroende på vilken typ av transformation som ska utföras (korrigering, filtrering, segmentering, kantdetektering, formigenkänning, etc.) och beroende på användningsområde (fotoredigering, videoredigering, syntes) . bild etc.).

Visa digitala bilder

Att titta på digitala bilder innebär att den digitala bilden visas på ett lämpligt medium, såsom en datorskärm, skrivare eller projektor. För att göra detta är det nödvändigt att använda enheter som kan omvandla binära data till elektriska eller optiska signaler som kommer att stimulera elementen i stödet. Dessa enheter kallas digital-till-analog-omvandlare. Det finns olika typer av digital-till-analog-omvandlare , beroende på vilken typ av media som används (LCD-skärm, OLED-skärm, bläckstråleskrivare, laserskrivare, etc.) och beroende på önskat visningsläge (2D- eller 3D-bild, stereoskopisk bild) eller holografiska, etc.)

Vilka typer av digitala bilder finns det?

Vilka typer av digitala bilder finns det?

Det finns olika typer av digitala bilder, beroende på hur pixlarna är kodade och organiserade. Vi kan särskilja två huvudkategorier: rasterbilder och vektorbilder.

Rasterbilder

Rasterbilder är bilder som består av ett rutnät av pixlar, där varje pixel har ett värde som representerar dess färg eller grånivå. Rasterbilder är lämpliga för att representera realistiska bilder, med fina detaljer och färgnyanser. De är också lätta att manipulera med bildbehandlingsprogram , som kan tillämpa pixel-för-pixel-transformationer. Rasterbilder har dock också nackdelar: de tar upp mycket minnesutrymme, de är känsliga för brus och kompressionsartefakter och de tappar kvalitet när de förstoras eller förminskas.

Det finns olika filformat för att lagra rasterbilder, som J PEG, PNG, GIF, BMP, TIFF, etc. Dessa format kan klassificeras efter om de är komprimerade eller okomprimerade, och om de är förlustfria eller förlustfria. Ett komprimerat format minskar filstorleken genom att eliminera viss redundant eller knappt märkbar information. Ett förlustformat tar bort information som kan förändra bildens kvalitet, medan ett förlustfritt format behåller all information.

Vektorbilder

Vektorbilder

Vektorbilder är bilder som består av geometriska objekt, såsom punkter, linjer, kurvor, polygoner, etc., vars varje objekt har attribut som definierar dess position, form, färg, fyllning, etc. . Vektorbilder är lämpliga för att representera enkla bilder, med regelbundna former och enhetliga färger. De är också lätta att modifiera med vektorritningsprogram, som kan tillämpa geometriska transformationer på objekt. Dessutom har vektorbilder fördelen att de tar lite minnesutrymme, är okänsliga för brus och komprimering och bibehåller sin kvalitet oavsett zoomnivå .

Det finns olika filformat för att lagra vektorbilder, som SVG, EPS, PDF, WMF, etc. Dessa format kan klassificeras efter om de är standard eller proprietära, och om de är kompatibla med webbläsare eller inte. Ett standardformat är ett format som följer en öppen standard och kan läsas av olika program. Ett proprietärt format är ett som ägs av ett företag eller en organisation och kan kräva specifik programvara för att spela. Ett webbläsarkompatibelt format är ett format som kan visas direkt på en webbsida utan behov av en plugin eller extern applikation .

Vilka är metoderna för att bearbeta och analysera digitala bilder?

Bearbetning och analys av digitala bilder består av att tillämpa operationer på digitala bilder för att förbättra deras kvalitet, extrahera användbar information eller skapa ny . Det finns olika metoder för att bearbeta och analysera digitala bilder, beroende på typen av bild (matris eller vektor), domänen (spatial eller frekvens), syftet (korrigering, filtrering, segmentering, kantdetektering, formigenkänning, etc. ) och nivån (låg nivå, medelnivå eller hög nivå).

Bearbetning och analys av rasterbilder

Bearbetning och analys av rasterbilder

Bearbetningen och analysen av rasterbilder kan göras i två olika domäner: den rumsliga domänen och frekvensdomänen.

Rymddomänen

Den rumsliga domänen motsvarar den domän där pixlarna är ordnade efter deras position i bilden . Bearbetningen och analysen av rasterbilder i den rumsliga domänen består av att tillämpa operationer direkt på pixelvärdena, utan att gå igenom en föregående transformation . Dessa operationer kan vara av olika slag, såsom:

  • Correction , som syftar till att förbättra bildkvaliteten genom att ändra parametrar som ljusstyrka, kontrast, färgbalans, etc.
  • Filtrering , som syftar till att minska brus eller accentuera vissa detaljer i bilden genom att använda masker eller filter som modifierar pixelvärden baserat på deras grannar.
  • Segmentering eller meningsfulla regioner enligt kriterier som färg, textur, intensitet, etc.
  • Kantdetektering , som syftar till att identifiera gränser mellan bildregioner med hjälp av operatorer som beräknar gradienten eller variationen i pixelintensitet.
  • Mönsterigenkänning , som syftar till att identifiera och klassificera objekt som finns i bilden med hjälp av tekniker som mönsterjämförelse, funktionsbeskrivning, maskininlärning, etc.

Frekvensdomänen

Frekvensdomänen motsvarar den domän i vilken pixlarna är ordnade enligt deras frekvens eller deras periodicitet i bilden. Bearbetning och analys av rasterbilder i frekvensdomänen involverar tillämpning av operationer efter transformation av bilden från den rumsliga domänen till frekvensdomänen. Denna transformation gör det möjligt att representera bilden som en summa av sinusformade funktioner med olika frekvenser och amplituder. Lågfrekventa sinusfunktioner motsvarar övergripande variationer i bilden, medan högfrekventa sinusfunktioner motsvarar fina bilddetaljer. Operationer i frekvensdomänen kan vara av olika slag, såsom:

  • Komprimering , som syftar till att minska filstorleken genom att eliminera sinusformade funktioner som har liten inverkan på den visuella uppfattningen av bilden .
  • Filtrering , som syftar till att minska brus eller accentuera vissa detaljer i bilden genom att använda filter som modifierar amplituderna för de sinusformade funktionerna enligt deras frekvens.
  • Restoration , som syftar till att förbättra bildkvaliteten genom att korrigera förvrängningar som orsakas av sensorn eller digital-till-analog-omvandlaren .
  • Mönsterigenkänning , som syftar till att identifiera och klassificera objekt som finns i bilden med hjälp av tekniker som korskorrelation, Hough-transform, wavelet-transform, etc.

Bearbetning och analys av vektorbilder

Bearbetning och analys av vektorbilder

Bearbetningen och analysen av vektorbilder består av att tillämpa operationer på de geometriska objekt som utgör bilden. Dessa operationer kan vara av olika slag, såsom:

  • Geometrisk transformation , som syftar till att ändra position, storlek, orientering eller form av geometriska objekt med hjälp av matriser eller matematiska funktioner.
  • Färgning , som syftar till att ändra färgen eller fyllningen av geometriska objekt med hjälp av attribut eller gradienter.
  • Skapandet av komplexa objekt , som syftar till att kombinera flera enkla geometriska objekt med hjälp av booleska operationer (förening, skärning, skillnad, etc.) eller deformationsoperationer (krökning, vridning, etc.).
  • Rasterization , som syftar till att konvertera en vektorbild till en rasterbild genom att beräkna pixelvärdena som motsvarar geometriska objekt.
  • Vectorization , som syftar till att omvandla en rasterbild till en vektorbild genom att detektera bildens konturer och regioner och approximera dem med geometriska objekt.

Vilka är de huvudsakliga tillämpningsområdena för datoravbildning?

Vilka är de huvudsakliga tillämpningsområdena för datoravbildning?

Datoravbildning har många tillämpningar inom olika områden, som kan grupperas i tre breda kategorier: skapande, kommunikation och förståelse av digitala bilder .

Skapa digitala bilder

Digital bildskapande består av att producera originalbilder eller modifiera befintliga bilder för konstnärliga, rekreations- eller utbildningsändamål. Användningsområden för digital bildskapande inkluderar:

  • Bildsyntes , vilket innebär att generera bilder från matematiska modeller eller digital data, med hjälp av tekniker som strålspårning, icke-fotorealistisk rendering, procedurgenerering, etc.
  • Virtual reality , som består av att skapa och simulera en uppslukande och interaktiv miljö där användaren kan röra sig och agera, med hjälp av enheter som virtual reality-headsetet, datahandsken, löpbandet, etc.
  • Augmented reality , som består av att lägga virtuella element ovanpå en verklig bild, med hjälp av enheter som smartphones, surfplattor, uppkopplade glasögon, etc.
  • 3D-modellering , som består av att skapa och manipulera tredimensionella objekt från geometriska primitiver eller punktmoln, med hjälp av mjukvara som Blender, Maya, SketchUp, etc.
  • Videoredigering , vilket innebär att sätta ihop, klippa, ändra eller lägga till effekter till videosekvenser, med hjälp av programvara som Adobe Premiere Pro, Final Cut Pro, iMovie, etc.
  • TV-spel , som består av att skapa och spela interaktiva och roliga scenarier där spelaren styr en eller flera karaktärer eller objekt, med hjälp av plattformar som spelkonsolen, datorn, smartphonen, etc.

Digital bildkommunikation

Digital bildkommunikation

Digital bildkommunikation består av att överföra eller sprida bilder genom olika medier eller nätverk, i informations-, reklam- eller sociala syften. Tillämpningsområdena för digital bildkommunikation inkluderar:

  • Komprimering lagring eller överföring av dem.
  • Kryptografi , vilket innebär att skydda bilder från obehörig åtkomst eller skadlig modifiering, med hjälp av tekniker som kryptering, digital vattenmärkning, digital signering, etc.
  • Innehållsbaserad bildsökning , som består av att hitta bilder som liknar eller är relevanta för en textuell eller visuell fråga, med hjälp av tekniker som extrahering av visuella funktioner , sökordsindexering, likhetsvisuell, rankning efter relevans, etc.
  • Ansiktsigenkänning , vilket innebär att identifiera eller verifiera en persons identitet utifrån deras ansikte, med hjälp av tekniker som punktdetektering, mönsterjämförelse, djupinlärning, etc.
  • Sociala nätverk , som består av att dela eller kommentera bilder med andra användare, använda plattformar som Facebook, Instagram, Snapchat, etc.

Förstå digitala bilder

Förstå digitala bilder

bildförståelse innebär att analysera eller tolka bilder för vetenskapliga, medicinska eller industriella ändamål. Tillämpningsområdena för att förstå digitala bilder inkluderar:

  • Datorseende , som innebär att simulera mänsklig visuell perception och extrahera semantisk eller geometrisk information från bilder, med hjälp av tekniker som semantisk segmentering, objektdetektering, rörelsespårning, 3D-rekonstruktion, etc.
  • Medicinsk bildbehandling , som innebär att man producerar eller analyserar bilder av människokroppen för diagnostiska eller behandlingsändamål, med hjälp av tekniker som radiografi, ultraljud, MRI, tomografi , etc.
  • Vetenskaplig bildbehandling , som innebär att producera eller analysera bilder av naturliga eller artificiella fenomen för forsknings- eller utforskningsändamål, med hjälp av tekniker som mikroskopi, spektroskopi, fjärranalys, astrofotografi, etc.
  • Industriell bildbehandling , som innebär att producera eller analysera bilder av industriella produkter eller processer för kvalitetskontroll eller säkerhetsändamål, med hjälp av tekniker som maskinseende, oförstörande testning, infraröd termografi , etc.

Slutsats

Computational imaging är ett spännande och utvecklande område , som erbjuder många möjligheter för att skapa, kommunicera och förstå digitala bilder. Oavsett om det är för underhållning, information eller vetenskap, datoravbildning det möjligt att producera och manipulera bilder av oöverträffad kvalitet och rikedom. Men datoravbildning ställer också inför utmaningar och etiska frågor, såsom respekt för privatlivet, upphovsrätt eller bilders sanningsenlighet. Det är därför viktigt att träna på principerna och teknikerna för datoravbildning, men också att utveckla ett kritiskt och ansvarsfullt tänkesätt när man hanterar digitala bilder. Business intelligence , till exempel, är en av de discipliner som förlitar sig på beräkningsavbildning för att analysera och visualisera komplexa och stora data, för att underlätta beslutsfattande inom olika tillämpningsområden.

Föregående artikel Hur använder man HP Smart-appen utan ett konto?
Nästa artikel De bästa moderkorten för Ryzen 5 5600X
Hej :) Så vad är nytt? Letar du fortfarande efter de senaste saftiga tekniska nyheterna? I behov av exakta tester och skarpa åsikter? Du är på rätt plats! Om du inte känner mig så är jag Adrien, en inbiten nörd som ägnar sina dagar åt att spåra de galnaste tekniska nyheterna. Bärbar dator fastskruvad på handleden, smartphone ympad i handen och alltid på jakt efter minsta tekniska rykte, jag är din sherpa i teknikens skoningslösa värld :)