Pages

torstai 28. lokakuuta 2010

Kuvan esteettisen laadun parantaminen - valittuja paloja ACM Multimedia -konferenssista

Firenzessä 25-28.10.2010 pidettävän ACM Multimedia -konferenssin isoina teemoina näkyvät kuvien ja videoiden geo-tägäyksen hyödyntäminen mm. turistien suositussovelluksissa; kuvien ja videoiden käsittely, editointi ja automaattiset korjaukset; isojen datasettien käsittely (mm. videot) ja anturitiedon hyödyntäminen. Tutkimuksen tekemisen kannalta uusia trendejä esityksissä olivat isojen julkisten "arkistojen" käyttäminen aineistona. Esimerkiksi Flickriä käytettiin monin eri tavoin - paitsi kuvia, myös niissä olevaa metatietoa. Tavoitteena postata lisää crowdsourcingin käyttämisestä tutkimuksen tekemisessä myöhemmin.

Blogaan muutamia valittuja paloja - tässä ensimmäinen.

Kuvan esteettisen laadun parantaminen

Bhattacharya et al. esittivät Best paper ehdokkaana olleen tutkimuksensa miten kuvan esteettistä laatua voidaan parantaa käyttämällä heidän määrittelemäänsä frameworkiä (teoreettinen kehys). Perusajatus on hämmästyttävän simppeli: käytetään kahta hyvin tunnettua visuaalisten taiteiden sääntöä eli ns. Rule of Thirds ja Golden ratio (divine proportion). Rule of thirds tarkoittaa käytännössä sitä, että kuva (valokuva, maalaus...) jaetaan yhdeksään yhtä suureen osaan jakamalla se kahdella yhtä kaukana toisistaan olevalla vaakaviivalla ja pystyviivalla. Kuvan elementit (talo, eläin, ihminen) sijoitetaan joko näille viivoille tai niiden leikkauspisteisiin. Golden ratio (divine proportion, kultainen leikkaus) puolestaan perustuu osien suhteeseen, määriteltynä matemaattisesti siten, että jana jaetaan kahtia niin, että lyhyemmän osan pituus (k) on suhteessa sama kuin pidemmän osan pituus (1,618k) suhteessa koko janaan. Esimerkiksi valokussa tätä käytetään jakamaan maan/veden suhdetta taivaaseen.




Tavoitteena tutkimuksessa oli käyttää näitä sääntöjä kuvan "parantamisessa" - käytännössä siirtää objektia kuvassa (ei siis croppaus, vaan objektin siirto!) tai muuttaa kultaista leikkausta esteettisesti paremmaksi. Näytti toimivan, pääosin myös ihmisarvioijien toimesta - mutta tämän käyttö jälkikäteen otettuun kuvaan käytännössä voi olla haasteellista hyväksyttävyyden kannalta ja myös epäeettistä, erityisesti esimerkiksi uutisjournalismissa. Toisaalta, tällainen olisi loistava apuväline kuvan ottamisessa amatöörikuvaajalle - kameran etsimessä näkyisi nuo viivat, joita voisi sitten käyttää ohjenuorana kuvan sommittelussa. Tämä voisi olla toimiva ratkaisu myös lukijareporttereille tukemaan kuvan ottoa - tai ainakin perussääntöjen kertominen auttaisi.

Mielenkiintoista on se, miten tällaisen menetelmän käyttö jälkikäteen jo kuvattuun kuvaan vaikuttaa ihmisten käsitykseen tapahtuneesta, ovatko he siitä tietoisia ja miten se muuttaa tapahtunutta todellisuutta esim. historian tai taiteen tutkimuksen näkökulmasta. Samoja mietteitä nousi useammankin esityksen kohdalla - kun muutamme mediaa - miten voimme enää jälkikäteen tietää mikä on "totta" ja tapahtunutta, mikä modifioitua ja millä tavalla. Näiden tietojen säilyttäminen materiaalissa on entistä tärkeämpää, mitä enemmän voidaan tehdä modifiointia - ja erityisesti, kun tehdään selkeästi manipulointia.

Videoihin liittyen esitettiin samansuuntaisia automaattiseen muokkaamiseen liittyviä tutkimuksia, mutta tässä vaiheessa yksinkertaisemmalla tasolla - esimerkiksi miten taataan kotivideoiden mielenkiintoisuus poistamalla alusta "tyhjää" ja keskittymällä clipissä varsinaiseen kuvattuun performanssiin (jossa dynaaminen liike edustalla ja staattinen "maailma" taustalla).

Esteettisen laadun parantamisesta löytyy lisää paperista:
A Coherent Framework for Photo-Quality Assessment and Enhancement based on Visual Aesthetics by Subhabrata Bhattacharya; Rahul Sukthankar; Mubarak Shah, in Proc. ACM MM 2010.

Konferenssiohjelma ja listat papereista:
http://www.acmmm10.org/program/technical-program/

Ei kommentteja:

Lähetä kommentti