Pages

lauantai 30. lokakuuta 2010

Kotivideo mashupit - valittuja paloja ACM MM -konferenssista

Sekalaisista, laadultaan vaihtelevista, ja useiden käyttäjien samasta tilaisuudesta ottamista kotivideopätkistä voi saada aikaan toimivia ja mielenkiintoisia videomashuppeja. Eindhovenin Teknillisessä Yliopistossa tehdyssä väitöskirjatutkimuksessa kehitettiin ratkaisu tähän. Mashup tässä tarkoittaa ajallisesti jatkuvaa, ilman katkoksia olevaa, videomashuppia usean eri kuvaajan videoista. Kiinnostavaksi tutkimuksen tekee se, että kännykkäkameroilla kuvataan entistä enemmän videopätkiä ja tutkimuksessa käytettiin kännykkäkameramateriaalia aineistona.




Teknisesti yhdistämisen synkronoimisessa käytetään yksinkertaista periaatetta - käytetään videoiden audiota (audio fingerprint tai audio onset) synkronoimaan videopätkät ja valitaan tiettyjen periaatteiden (objektiivinen funktio, jossa parametrejä sekä vaatimuksia mashupille ja näiden maksimoiminen) mukaan eri kuvaajien videopätkiä mashuppiin. Audiona käytettiin tässä tapauksessa aina kunkin mashuppiin valitun videon audiota kunkin pätkän kohdalla.

Näytetyissä esimerkeissä käytettiin aineistona mm. YouTubessa olevia konserttivideotaltionteja. YouTubesta haettiin tietyn bändin tietty kappale tietystä konsertista - mashuppiin valittiin esimerkiksi neljän kuvaajan kännykkävideot, jotka kukin olivat eri mittaisia ja eri kulmista ja etäisyyksiltä kuvattuja. Näistä koostettiin automaattisesti eri näkökulmista videomashup.

Lopputulos oli hämmästyttävän hyvä - subjektiivisesti arvioituna selkeästi parempi ja mielenkiintoisempi kuin yksittäiset videopätkät. Audion laatu tietysti vaihtelee pätkissä, mutta audion osalta voitaisiin toisinaan löytää ja käyttää parempilaatuista materiaalia.

Ratkaisu voisi toimia kaveriporukan tapaamisissa, sukulaisjuhlien, uutistilanteiden tmv.yhteydessä, jossa jotain keskeistä tai mielenkiintoista tapahtumaa ovat kuvanneet useammat ihmiset. Synkronointiratkaisu kuitenkin keskeisesti riippuu mahdollisuudesta tunnistaa audiotrackista selkeät yhteneväisyydet. Tämä toimii helpommin, kun kyse on musiikista ja kohtuullisen tiiviistä tilasta, jossa etäisyys kuvaajien välillä on alle 300 metriä (vrt. viive). Todennäköisesti muun tyyppisessä audiossa tarvitaan signaalianalyysin osalta ainakin osin erilaisia ratkaisuja. Esitetty ratkaisu toimii kokonaisuutena ajallisesti jatkuvassa videomashupissa, joten automaattiseen muuhun videoyhdistelyyn tämä tutkimus ei tässä vaiheessa tuo ratkaisua. Konffassa oli muitakin aiheeseen liittyviä papereita.

Lisää tästä kyseisestä tutkimuksesta löytyy paperista:
Automatic Mashup Generation from Multiple-camera Concert Recordings by Prarthana Shrestha; Peter de With; Hans Weda; Mauro Barbieri; Emile Aarts, in Proc. ACM Multimedia 2010.

Koko väitöskirja:
http://alexandria.tue.nl/extra2/200613048.pdf

Konferenssiohjelma ja listat papereista:
http://www.acmmm10.org/program/technical-program/

Ei kommentteja:

Lähetä kommentti