tisdag 6 januari 2009
CS logotype

Fokussajter

Läs mer om

Tjänster

Tidningen

För annonsörer

Kontakta oss

Computer Sweden är Sveriges ledande it- tidning som publicerar nyheter varje dag på webben samt tre gånger i veckan på papper.
............................................

Ring till 08-453 60 00.

Skicka gärna e-post till: cs@idg.se

Postadressen är:
Computer Sweden
106 78 Stockholm
............................................

"I dag är du bara 20 procent glad" - Computer Sweden:

Snålvideon visar ditt rätta ansikte

Rör på munnen. Komprimeringen bryr sig bara om munnen och ögonen. Konturernas rörelser matchas mot bilder som är lagrade på förhand. Inga bilder överförs under ett videosamtal, bara nummer som låter mottagarens telefon sätta ihop bilder av redan lagrade foton.
Rör på munnen. Komprimeringen bryr sig bara om munnen och ögonen. Konturernas rörelser matchas mot bilder som är lagrade på förhand. Inga bilder överförs under ett videosamtal, bara nummer som låter mottagarens telefon sätta ihop bilder av redan lagrade foton.

Att sända video från en gsm-telefon kan verka omöjligt. Det behövs runt 500 kbit/s, gärna mer, för att det ska bli uthärdligt – inte futtiga 9,6 kbit/s som i en enkel gsm-telefon.

Men en forskare i Umeå anser att det är möjligt.

Ulrik Söderström doktorerar på en avhandling om ”very low bitrate video communication” och han hävdar att han kan skicka ett pratande huvud från gsm-telefon till gsm-telefon. Det behövs bara 5 kbit/s. Det krävs inte heller särskilt mycket beräkningskraft och därmed batterikraft för att hantera tekniken – viktigt i mobiltelefoner.

Det där med pratande huvud är nyckeln. Ulrik Söderströms teknik utgår från att det enda intressanta är ansiktsuttrycket hos den som pratar.

Bakgrunden – glöm den. Rörliga bilder från barnens födelsdagskalas – glöm det. Snålvideon klarar bara en sak, nämligen ansiktsuttryck. Det är förändringarna i mimiken som överförs.

– Allt som överförs är ett antal tal, säger Ulrik Söderström.
Talen som överförs talar om för mottagaren att ditt ansiktsuttryck är, till exempel, ”50 procent ledsen, 20 procent förvånad, 30 procent glad”.

– Det finns bara sex grundläggande känslotillstånd enligt en psykologiprofessor, berättar Ulrik Söderström, men jag använder tio till tjugo bilder på olika miner.


Sex miner. Alla ansiktsuttryck är i grunden kombinationer av de här sex minerna. Ulrik Söderström demonstrerar.

Han skriver i sin avhandling att traditionell videokomprimering är ineffektiv när det gäller videokommunikation ansikte mot ansikte. Priset som vanlig videokomprimering, som mpeg-4, betalar för att klara alla slags bilder är att den inte är extremt bra på någon sort.

Vanlig videokomprimering delar in bildytan i block som komprimeras var för sig. Därför krävs det mycket beräkningskapacitet för att hantera rörelser när något flyttas från ett block till ett annat.

Men anta att vi bara ska hantera ansikten och att ansiktet är stilla, mitt i bilden.

– Jag offrar bakgrunden och utgår från ett ansikte med normaliserad position, säger Ulrik Söderström.

Munnens rörelser är det viktigaste när vi avläser våra medmänniskors sinnestillstånd. Näst viktigast är ögonen. Resten av ansiktet kan man nästan bortse ifrån. Vilket är precis vad Ulrik Söderströms teknik gör.

Om du någon gång i framtiden skulle skaffa en telefon med Ulrik Söderströms teknik skulle du först bli ombedd att ta ett antal bilder av dig själv. Se glad ut, se arg ut, se ledsen ut, se förvånad ut, se rädd ut och visa avsmak. När du sedan pratar i telefonens videokamera känner programmet igen ansiktsuttrycken. Programmet inriktar sig på de delar av bilden där munnen och ögonen brukar finnas och struntar i resten.

Kompisen som du vill videoprata med måste förstås ha samma program. Han måste också ha laddat ner dina självporträtt innan ni börjar videoprata. Det överförs alltså inga bilder, bara ett fåtal siffervärden 15 gånger per sekund. Det bör ge din kompis en bra bild av ditt sinnestillstånd, men kanske inte av hur du faktiskt ser ut:

– Du kanske tog bilderna för tre år sedan och sedan dess har du odlat skägg. Kompisen kommer att se dig utan skägg och med samma bakgrund för tre år sedan.

Ulrik Söderström tänker sig att tekniken är användbar för videokonferenser.

– Där är man ju bara intresserad av ansiktet och ansiktsuttrycket, bakgrunden är ointressant.

Han har också funderat på ifall tekniken kan användas för dövas teckenspråk.

– Det är mer krävande, säger han, eftersom handrörelser är så snabba. För ansiktsuttryck räcker det med 15 bilder i sekunden, men för teckenspråk krävs det ungefär 25 bilder i sekunden. Men det går att göra modeller av handrörelser också.

Måste man hålla telefonen mitt framför ansiktet när man talar?

– Nej, man kan bygga in kameran i ett headset. Den kan sitta vid sidan av ansiktet och ta bilder i profil. Det går lika bra att avläsa mimik i profil. Sedan visar programmet ansiktsrörelserna på ett ansikte rakt framifrån, säger Ulrik Söderström

Fakta

Metoden för komprimering av video som Ulrik Söderström utvecklat kallas för principal component analysis, pca. Tekniken känner igen förändringar i ansiktsuttryck och överför dem som siffervärden. Ansiktsuttrycket återskapas hos mottagaren som en kombination av redan nerladdade bilder.

Ulrik Söderström doktorerar vid institutionen för tillämpad fysik och elektronik vid Umeå universitet. Disputationen äger rum fredagen den 26 oktober 2008.

Krönikan

Outsourcing byter skepnad

CS dreglar över...

Mest läst just nu

Under snedstrecket

Nyheter


Den här artikeln har 27 kommentarer:

Okej, men varför - (KarlRoos) 2008-10-12 09:58

elände - (7®0//) 2008-10-12 10:29

Okej, men varför - (_EPA_) 2008-10-12 10:52

elände - (Holy crip, he's a Crapple! - Peter) 2008-10-12 11:15

elände - (xizor) 2008-10-12 12:22

grund idéen är gammal - (R_I_P) 2008-10-12 12:30

elände - (Allan Allansson) 2008-10-12 13:12

Okej, men varför - (jpb) 2008-10-12 13:35

Datumet - (Habijack) 2008-10-12 13:43

Okej, men varför - (pingvinäpplet) 2008-10-12 14:33

OBS! Denna artikel är mer än tio dygn gammal och är därför stängd för vidare debatt.

Hett på CS just nu

- Computer Sweden:

Kina försöker
tukta Google

(7 kommentarer)

- Computer Sweden:

Skivindustrins nya
taktik mot fildelare

(29 kommentarer)


- Computer Sweden:

Androidutvecklare
kan snart ta betalt

(9 kommentarer)


- Computer Sweden:

Pc-ras väcker frågetecken

(3 kommentarer)


- Computer Sweden:

Mobilindustrin siktar
in sig på Microsoft

(24 kommentarer)


- Computer Sweden:

Värsta näthaverierna 2008

- Computer Sweden:

Rekordtapp för Explorer

(72 kommentarer)


- Computer Sweden:

Bahnhof vill växa
i lågkonjunkturen

(9 kommentarer)


- Computer Sweden:

2008 skakade om
databasvärlden

(1 kommentar)


- Computer Sweden:

Nokiatelefoner kan
attackeras med sms

(9 kommentarer)


- Computer Sweden:

Gazakonflikten sprids online

(11 kommentarer)


- Computer Sweden:

I kväll smäller det

(21 kommentarer)


Affärsfokus

- Computer Sweden:

Strid på webben
om lokala nyheter

Folk

- Computer Sweden:

Han gör data synliga

(1 kommentar)


Dagens krönikor

- Computer Sweden:

Gör en tavla med ditt dna


- Computer Sweden:

Outsourcing byter skepnad


Opinion

- Computer Sweden:

It måste vara interaktiv


- Computer Sweden:

It-branschen, hjälp företag


- Computer Sweden:

Vi förväntar oss sänkta priser

(1 kommentar)


Mest läst just nu

Under snedstrecket

Missa inte

CS dreglar över ...

Glöm inte

Nominera till Guldmusen

Krönikan

Outsourcing byter skepnad

Vill du testa vår sajt?

Vimmel | Mer vimmel

Kunder, partner och leverantörer firade Caperios nya kontor på Blue Moon Bar i Uppsala.
Kunder, partner och leverantörer firade Caperios nya kontor på Blue Moon Bar i Uppsala. Se bildspel

CS teknikblogg

Dagens ord

"E-bok"

Opinion

Vi förväntar oss sänkta priser

Allt samlat

K Sören Pecén

Experterna svarar

Fyll på vår wiki

Tyck till om CS säkerhetsexperter

Storageworld

Expertbloggarna





Anders Liling bloggar om affärsmässig öppen källkod.

It i vården-bloggar

Nytt nyhetsbrev

Språksamt

Populärt på CS Karriär

RSS och nyhetsbrev

Fler nyheter

CS kompendium

CS kompendium om datasäkerhet

Partnerzon

Verksamhetskritiska system

Hetaste white papers just nu

Mest besökta platsannonserna

Utbildningsguide

Utbildningsguiden

Nytt från PDF-shopen

Lönebarometern

Diagram

CS läsarpanel

Hjälp oss! Få en prenumeration!

Senaste nytt från IT24.se