
További Tech cikkek
A big data mostanában legalább olyan gyakran visszatérő kifejezés – sőt buzzword –, mint az internet of things, a gamification vagy a startup. Van még egy közös vonásuk: ezek már létező dolgok, csak a modern technikával újraértelmezik őket. Big data analízis = rengeteg információ + ezekben megfigyelhető minták, trendek és ismétlődések vizsgálata.
Graeme Noseworthy, az IBM szakértője ezeket a mintákat keresi – és meg is találja őket.
A big data analízis éppúgy használható az üzleti elemzés, mint a marketing területén: segíthet a cégeknek, hogy jobban megismerjék a vásárlóikat önálló személyként, így személyre szabott ajánlatokat tehetnek nekik, magyarázza Noseworthy.
Bár ez pont úgy hangzik, mint a szokásos vállalati bullshit, abban igaza van, hogy a marketing korábban inkább az új vásárlók megnyeréséről, a márka ismertségének terjesztéséről szólt. A big data elemzések ezzel szemben személyre szabott ajánlattételt, illetve a vásárlói csoportok jobb elkülönítését szolgálják, így növelve a reklám és az értékesítés hatékonyságát.
És hogy mire jó még? Például egy nagyobb viszonteladóláncnál sokat segíthet a raktárkészlet-felügyeletben, a lopások és visszaélések számának csökkentésében, vagy a folyamatok optimalizálásában - sorolja Noseworthy. Az analitika gyakorlatilag minden cégnél javíthatja az egyes folyamatok minőségét.
Nem kell találgatni, ha tudhatjuk is.
– összegzi Noseworthy a módszertan lényegét.
Filmekkel bizonyítottan működik

Noseworthy egyik legismertebb eredménye a big data elemzésben egy filmipari előrejelzési modell; ezzel megjósolható, hogy egy mozifilm hogy fog teljesíteni a nyitó hétvégén a pénztáraknál. Ebben több nagy, az Egyesült Államokban működő filmes cég is támogatta.
Egy mozifilm esetén csak általában találgatni lehet, hogy milyen eredménye lesz jegyeladásban. Egy sikervárományos filmre gyakran több százmillió, a reklámozására több tízmillió dollárt is költhetnek; az Avatarnál a gyártási költség állítólag több mint félmilliárd volt, és a reklámköltségek is túllépték a 350 millió dollárt. És egyszerűen nem lehetett előre tudni, hogy milyen lesz a film fogadtatása.
A big data analízis ebben segít: a fogyasztói szokások elemzésével például hamar kideríthető, hogy az Avatarnak Kaliforniában sok nézője lesz, míg New Englandben vagy Floridában kevesebb. Már ennek a felismerése is segíthet a marketingköltség optimalizálásában. De hogy épül föl egy ilyen modell? Noseworthy szerint az elemzésnél először is meg kell határozni, hogy
- pontosan mit szeretnénk megismerni (ebben az esetben: a film várható bevételeit a nyitó hétvégén);
- milyen kulcsfontosságú teljesítménymutatók (key performance indicator) határozzák meg a film népszerűségét, és hogy lehet ezeket mérni;
- milyen adatforrásokból szeretnénk dolgozni; ezek lehetnek külső, máshonnan elérhető adatok, vagy olyanok, amiket maga a megbízó cég adott.
A mozibevételes előrejelzési modellhez több mint 200, korábban megjelent film fogadtatását elemezték.
Minél több adatot gyűjtünk be, annál jobban megerősíthetjük a modellt.
– magyarázza Noseworthy.
A külső forrásokat nyilvános adatbázisokból szerezték, például az IMDB, a Moviereview vagy a Los Angeles Times filmes értékeléseiből. Ehhez hozzáadták a közösségi médiából érkező reakciókat és nézettségi adatokat: ilyen például a youtube-os trailermegtekintések száma, az előzetesek alá érkezett kommentek, vagy a filmmel kapcsolatos Twitter-bejegyzések. A mozik hirdetési modelljének és marketingstruktúrájának felismerése viszonylag egyszerű volt. Noseworthy szerint ezek mindig ugyanazt az ütemtervet követik:
- 12 héttel a film moziba kerülése előtt beindul a film reklámkampánya, jönnek az első kedvcsináló (teaser) videók.
- 8 héttel a megjelenés előtt sajtótájékoztatókat tartanak, a filmmel kapcsolatos információk feltűnnek a mainstream médiában.
- 6 héttel a debüt előtt jön a film hivatalos trailere.
- 2 héttel a megjelenés előtt a film szereplői tévéinterjúkat adnak.
- 1 héttel a bemutató előtt indul a visszaszámlálás a premierig.
Az IBM-es kutatók mindezt visszafejtették, és megállapították, hogy ezzel a módszerrel viszonylag könnyen és pontosan elkülöníthetők az egyes filmtípusok; a blockbuster sikerfilmek, a családi filmek és a romantikus filmek. Viszont, ha van elég adat, akár az is visszafejthető, hogy régiók és filmtípusok alapján melyik film milyen fogadtatásra számíthat.
A hiba előnnyé formálható
De vajon mindenre alkalmazható a modell? Noseworthy elismeri: van, ahol ez a modell megbicsaklik; példaként a live action kid movies (élőszereplős gyerekfilm) műfaját említi.
Míg az Avengersnél a közösségi médiában feltűnő reakciók, a területenként változó médiafogyasztási szokások és a hasonló filmek értékelései alapján lehet sejteni, hogy jól fog teljesíteni a kasszáknál, az Alvin és a mókusok már más eredményt fog hozni. Ennek is mérték a várható teljesítményét, de a Facebookon és a Twitteren negatív volt a fogadtatása – annak ellenére, hogy maga a film üzletileg sikeres volt. Hogy miért?
Az ilyen esetek viszont Noseworthy szerint nem gyengítik a modellt, hanem erősítik. Ha ismerik ezt a változót a képletben, a következő mérésnél ezt is figyelembe vehetik, így a hátrányból előnyt kovácsolhatnak. A mérések legalábbis ezt igazolják: minél több adatot használtak a modellhez, annál pontosabb lett a nyitó hétvégére vonatkozó becslés.

Ilyenkor persze felmerül a kérdés: honnan lehet tudni, hogy a hatalmas mennyiségű adatban nem csak véletlen mintákat ismernek föl, hanem olyan összefüggéseket, amiket az üzleti életben is hasznosítani lehet? Noseworthy szerint ezt csak a modellek tesztelése bizonyíthatja, de legalább ilyen fontos, hogy a megfelelő adatokat válogassuk ki. Megemlíti a GIGO (garbage in, garbage out) elvét is; a kifejezés azt jelenti, hogy használhatatlan adatokból csak értelmezhetetlen végeredmény születik. A tesztek az ilyet kiszűrik, és egyre közelebb kerülhet a kitűzött cél, ahogy
De ha az elérhető adatok mennyisége javítja az előrejelzés pontosságát, ez nem azt jelzi, hogy a big data elemzések legnagyobb nyertesei azok lesznek, akik a legtöbb adathoz férnek hozzá? Például a Google és a Facebook, akik csillió gigabájtnyi adat tetején üldögélnek. Mi lesz a kisebb cégekkel, akik nem férnek hozzá ennyi adathoz?
Az információt nemcsak alapegységekben, terabájtokban és petabájtokban lehet mérni; a big data részét képező információnak más tulajdonságai is vannak. A 3V (néha 4V) néven ismert definícióra hivatkozik, amik más és más tulajdonságaik szerint csoportosítják az adatot:
- Volume: az elérhető információ mennyisége.
- Velocity: ezek a nagy sebességgel mozgó adatok, például a megosztások a közösségi médiában, a facebookos-twitteres állapotfrissítések.
- Variety: ez az adattípusok sokféleségét mutatja. Értékes információt több forrásból lehet szerezni; például strukturált, szervezetlen, közösségi hálózatokról vagy médiaügynökségektől származó adatokból.
Noseworthy ekkor árulja el, hogy tulajdonképpen mi tekinthető big datának:
Ennek nem kell feltétlenül nagy mennyiségű adatnak lennie; egy áruházlánc adatforgalma például egy sima laptoppal is kezelhető. A Google-nek rengeteg adata van, de nem ez a lényeg, hanem az, hogy milyen kérdésre keresünk választ, és ehhez milyen típusú adatokat tudunk szerezni. A nyers adatmennyiséget nézve a Google előnyben van, de lehet, hogy egy kisebb kereskedőláncnak már annyi adat is sok, ami egy óriáscégnek gyakorlatilag semmi.

Éppen ezért fontos az adatok minőségének biztosítása. Nincs olyan architektúra, ami erre megoldást kínálna: az adatbányász (data scientist) feladata, hogy kiválogassa a szükséges információkat, amikhez hozzáférhet, és meghatározza, mi a mozgó és mi a nyugvó adat. Ahhoz például, hogy egy film sikerességét meg lehessen jósolni, nem kell mindent tudnunk a filmről, ami a közösségi médiában elhangzott róla, csak a releváns adatokat kell elkülöníteni.
Az adatok elemzése viszont szakértőt igényel. Egy szórakoztatóipari cégnek rengeteg adata lehet, de ők nem adatbányászok, így nem tudnak mit kezdeni ezekkel az információkkal. Noseworthy szerint az a legjobb, ha a laikusoknak adatvizualizációval mutatják be, hogy milyen fogadtatása lehet egy-egy terméknek. A szakértők többször bizonyított modelleket használnak, és olyan összefüggéseket is felismerhetnek, amit nyers formában szinte senki, de feldolgozott adatként már a kreatívok vagy a marketingesek is felhasználhatják.

Már holnap van
Hogy a big data nem vadonatúj dolog, azt Noseworthy is elismeri. A Mad Men tévésorozatot hozza föl példának, ahol a legújabb évad egyik epizódjában Ginsberg, a reklámügynökségi kreatív frászt kap attól, hogy az ügynökség számítógépet vásárol, és attól tart, hogy ez ki fogja szorítani a kreatívokat. Az az epizód 1969-ben játszódott, és akkor tényleg riasztó perspektívának tűnhetett az elgépesedés. Ehhez képest ma már minden irodában vagy tucatnyi számítógép van.
Ez nem a jövő; a marketinget és a reklámot már régóta próbálják közös platformra hozni az informatikával, csak most már sokkal gyorsabban csinálhatjuk. Ami akkor órákig, napokig tartott, azt ma már töredékmásodpercek alatt elvégezhetjük. Nagyon izgalmas időket élünk.

Az oldalról ajánljuk
- Futball
Újra volán mögé ült az élvonalbeli futballista, aki a súlyos autóbalesete után közel került a halálhoz
Hajszálon múlt a tragédia, miután decemberben felcsavarodott egy fára a Ferrarijával.
2 perce
- Kultúr
Mi van, ha a borzalom bennünk van, nem pedig odakint?
Az És miért, hogy az éjszaka lesújt, feldob és energetizál.
március 26., 07:45
- Külföld
Nem tartott sokáig a fekete-tengeri tűzszünet, több ukrán drón is behatolt az orosz területekre
A rijádi megállapodás ellenére csaptak le.
március 26., 08:34
- Külföld
Pataky Attila elmondta, mit gondol valójában Azahriah-ról
A rocker szerint a fiatal előadó nem figyelt a suliban, ezért keveri a diktatúrát és szabadságot.
március 26., 07:42
- Külföld
Légitámadást intéztek egy amerikai hadihajó ellen a jemeni húszik
A támadásokkal nem fognak felhagyni addig, amíg a gázai háború véget nem ér.
március 26., 08:58
- Külföld
Florida lazítana a gyerekmunkára vonatkozó törvényen
Ezzel szeretnék leváltani a papírokkal nem rendelkező munkavállalókat.
március 26., 08:15
- Külföld
Nem hagyja magára feleségét, J. D. Vance is Grönlandra látogat
A sziget biztonsági helyzetét vizsgálják.
március 26., 07:54
- Belföld
Meghalt Wachsler Tamás volt országgyűlési képviselő, a Kossuth tér megújításának irányítója
Az építész novemberben lett volna 60 éves.
március 26., 08:20
- Belföld
Nem ért haza az iskolából egy 17 éves budafoki lány
A rendőrség jelenleg is keresi az eltűnt diákot.
március 26., 07:50
- Külföld
Huszonkettőre emelkedett a dél-koreai erdőtűz halálos áldozatainak száma
Az oltást nehezíti az erős szél.
március 26., 06:45
- Külföld
Dániában a nők számára is bevezetik a sorkatonaságot
Az EU-ban eddig csak Svédországban volt hasonló.
március 26., 07:00
- Belföld
Steiner Kristóf: Nem hiszem, hogy ennek az országnak szüksége van rám
Hadházy Ákos: Követeljük, hogy ezt a mocskos törvényt visszavonják.
március 26., 09:23
- Tudomány
Magyarországon élő kannibál kígyót vizsgált egy új tanulmány
A rézsikló nem jelent fenyegetést a veszélyeztetett viperafajra.
március 26., 06:16
- Belföld
Törvényjavaslattal tiltaná ki a középületekről a szivárványos zászlókat Novák Előd
A Mi Hazánk Mozgalom korábbi próbálkozása nem járt sikerrel.
március 26., 07:16
- Belföld
Magyar Péter bizarr videóval küldött üzenetet kritikusainak
Vicces jelenet került ki az ellenzéki politikus közösségi oldalára.
március 26., 09:08
- Külföld
Nagyszabású hekkertámadás érte az egyik legnagyobb orosz vállalatot, teljes a káosz a cégnél
március 26., 06:12
- Forma-1
Döntött az F1-es Red Bull gyengélkedő pilótájának sorsáról
A címvédőnek sem tetszett az elhatározás.
március 26., 09:16
- Külföld
Donald Trump tanácsadója felelősséget vállalt a háborús tervek kiszivárogtatásáért
Nem csitul a botrány Mike Waltz körül.
március 26., 09:17
- Külföld
Scotland Yard: nem bűncselekmény okozta a Heathrow repülőteret megbénító tüzet
A Heathrow-t 18 órára lezárták, és 63 ezer környékbeli lakás is áram nélkül maradt.
március 26., 06:23
- Külföld
Folytatódnak a törökországi tüntetések, már 1400 embert tartóztattak le
Több jogvédő csoport és az ENSZ is elítélte a rendőrök erőszakos fellépését.
március 26., 06:39
- Belföld
Lázár János utódja szerint Makón a libák őrzését sem bíznák Magyar Péterre
„Komolyan aggódom Hódmezővásárhelyért, ahol évek óta a gyűlölet uralkodik.”
március 26., 06:22
- Külföld
„Az orosz propaganda megpróbálja kihasználni a magyar politikai helyzetet”
A VOX Ukrajina ügyvezető igazgatóhelyettese nyilatkozott az Indexnek.
március 26., 06:19
- Belföld
Ideiglenesen szünetel a szülészeti ellátás a kisbéri kórházban
A „személyi feltételek átmeneti hiánya” miatt.
március 26., 06:18
- Futball
Monumentális mészárlás a Monumentalban, Messi nélkül is szétszedték az ötszörös világbajnokot
Argentína már kijutott a jövő évi vb-re.
március 26., 06:30
- Belföld
Jókedvet és esernyőket bekészíteni, borongós–esős időjárással kell dacolnunk
Napsütésre csak az ország északi, északnyugati részén lehet számítani.
március 26., 06:26
- Cinematrix
Megérkezett az egyik legjobban várt Star Wars-sorozat új évadának kedvcsinálója
Az Andor második, egyben utolsó évada is bővelkedni fog az izgalmakban.
március 26., 06:21
- Belföld
Kamionról lehulló méretes jégtömbök okoztak kis híján balesetet az M7-es autópályán
Az eset könnyen okozhatott volna balesetet.
március 26., 06:19
- Belföld
Biztonsági őr akadályozta meg, hogy bejusson a rabbi a Kazinczy utcai zsinagógába
március 26., 08:46