Prepoznati vračajočega obiskovalca brez cookie-a

Od vseh rešitev, ki sem jih v zadnjih tednih videl na slovenskem spletu v zvezi s piškotki, mi je še najbolj blizu pristop, ki so ga izbrali pri slo-tech.com (vir: Slo-Tech skladen z ZEKom-1).

Odločili so se, da vse "sporne" piškotke odstranijo in s tem obiskovalcev ne nadlegujejo z nadležnimi obvestili. Kljub temu pa bodo obdržali Google Analytics (oz. bolj pravilno novi Universal Analytics) in sicer nekoliko preurejeno kodo, ki ne zabeleži nobenega piškotka v računalnik:

ga('create', 'UA-XXXXXXX', {'storage': 'none', 'clientId': 'XXXXXXXXXXX'});
ga('send', 'pageview', {'anonymizeIp': true});

S parametri so izklopili storage, morajo pa zaradi tega parameter clientId generirati sami. ClientId je ključen podatek, s katerim Analytics prepozna nove vs. vračajoče uporabnike in tukaj se mi poraja vprašanje - kateri podatek oz. kombinacijo podatkov uporabiti, da bi bila statistika čimbolj realna (IP, User Agent, ločljivost zaslona, ...)?

Naslednja stran prikazuje praktično vse informacije, ki jih je mogoče pridobiti od brskalnika: https://panopticlick.eff.org/

  • IP: večina obiskovalcev ima dinamično IP številko, ki se vsaj na nekaj tednov spreminja (T-2), če ne že dnevno (Siol)
  • User Agent: se spremeni z vsako nadgradnjo brskalnika na novo različico, nove različice pa so na voljo praktično vsak mesec (Firefox/Chrome...)
  • ... še kakšna ideja?

28 odgovorov

kelvan:
Pri kombinaciji IP naslova in UserAgenta upoštevaj še to, da recimo obiskovalci iz javne uprave (kar nam itak generira 50% prometa :) pridejo z istega IPja in z istim UserAgentom. Imel boš sicer približno pravo število obiskov, ampak izjemno veliko returning visitorjev.

A se sedaj že uradno ve, da za GA ni treba dajat opt-in?

Ja potem bo pač malo več returning visitors, kaj naj. Ne mislim delati ne opt ina ne opt outa zaradi analitycsa ;-)

1

ja sej se strinjam, imam iste pomisleke :)

Statistika mi na ta način odstopa za 1% glede na GA, kar mi je zelo sprejemljivo. Returning visitors pa "laže" malo bolj, v GA 20 %, zdaj 30 %. Ampak mislim, da to vse pač lahko sprejmem.

1

@jerry2: Torej si za ClientId vzel IP številko in User Agent ter ju zapakiral v hash obliko?

@urosbe: Ja tako nekako. Ne vem pa točno kako bi iz IP in user agenta dobil lep hash, ki bi imel vedno enako dolžino. Morda kdo pomaga? Naj uporabim md5?

Pa za registrirane sem zakodiral njihov ID, ki v tem primeru služi kot clientID in se tudi med brskalnikma ne spremeni. Tu je UA celo bolj natančen kot GA, ker to omogoča.

V zadnjih nekaj dneh imam na eni izmed straneh objavljeni dve kodi - Google Analytics in Universal Analytics. Da gre za odstopanje pri "returning visitors" mi je razumljivo, ampak meni se razlikuje tudi število obiskovalcev in ostale vrednosti.

Gledam npr. za obdobje 5.6.-6.6. in UA mi kaže 10 obiskovalcev več kot GA. Prav tako UA prikazuje nekoliko več ogledov strani, nekoliko krajši povprečni čas obiska in malenkost manjšo stopnjo obiskov ene strani. Odstopanje je sicer minimalno, tako da se ne obremenjujem kaj dost, me pa vseeno zanima, ali še kdo opaža kaj podobnega pri sebi?

Po slabem tednu dni lahko potrdim, da Universal Analytics prikazuje približno 6-7% več obiskovalcev, ogledov strani in podobnih podatkov. Po spletu sem bral, da podobno opažajo tudi nekateri drugi, ki imajo vzporedno nastavljeno GA in UA kodo. Nekateri razlog pripisujejo bistveno manjši js knjižnici, ki naj bi se posledično pri uporabnikih hitreje namestila.

Sem pa opazil, da Universal Analytics Ecommerce ne beleži podatka vir/medij oz. vsak nakup prepozna kot "(direct) / (none)". Stari GA profil lepo prikaže kateri nakupi so prišli preko referral strani, kateri preko organskega iskanja, medtem ko UA profil prikazuje kot da so nakup vsi kupci oddali kot direktni obiskovalci. Zanimivo je tudi to, da se to dogaja zgolj pri Ecommerce, medtem ko splošni pregled obiskovalcev lepo prikazuje podatke (približno enako kot stari GA profil).

Na to temo ne najdem na spletu prav nič uporabnega in me zanima ali je še kdo, ki uporablja Ecommerce tracking z novim Universal Analytics zasledil kaj podobnega?

1

@urosbe: sam sem pravkar testiral UA kodo na eni strani in v Real-Time statistiki opžam, da mi obiske beleži kot "direct", čeprav obiskovalec pride na stran preko katerega od iskalnikov. Se enako dogaja pri tebi?

UA prikazuje bistveno več obiska iz "direct", kljub temu pa še vedno beleži referenčnega in promet iskanja. Spodaj je primerjava za obdobje med 5.6.-10.6.

1

Če imaš registrirane userje, katerim dodeliš ClientID potem recimo UA kaže veliko bolj prav, ker ni odvisen od brskalnika, ampak od registriranega uporabnika. Pokaže pa seveda manj potem. Jaz imam reg. in nereg. userje in je tam nekje, malo izgubim pri reg. ker jih manjkrat šteje, malo pridobim ker kdo zamenja brskalnik ali IP ;-)