Prepoznati vračajočega obiskovalca brez cookie-a

Od vseh rešitev, ki sem jih v zadnjih tednih videl na slovenskem spletu v zvezi s piškotki, mi je še najbolj blizu pristop, ki so ga izbrali pri slo-tech.com (vir: Slo-Tech skladen z ZEKom-1).

Odločili so se, da vse "sporne" piškotke odstranijo in s tem obiskovalcev ne nadlegujejo z nadležnimi obvestili. Kljub temu pa bodo obdržali Google Analytics (oz. bolj pravilno novi Universal Analytics) in sicer nekoliko preurejeno kodo, ki ne zabeleži nobenega piškotka v računalnik:

ga('create', 'UA-XXXXXXX', {'storage': 'none', 'clientId': 'XXXXXXXXXXX'});
ga('send', 'pageview', {'anonymizeIp': true});

S parametri so izklopili storage, morajo pa zaradi tega parameter clientId generirati sami. ClientId je ključen podatek, s katerim Analytics prepozna nove vs. vračajoče uporabnike in tukaj se mi poraja vprašanje - kateri podatek oz. kombinacijo podatkov uporabiti, da bi bila statistika čimbolj realna (IP, User Agent, ločljivost zaslona, ...)?

Naslednja stran prikazuje praktično vse informacije, ki jih je mogoče pridobiti od brskalnika: https://panopticlick.eff.org/

  • IP: večina obiskovalcev ima dinamično IP številko, ki se vsaj na nekaj tednov spreminja (T-2), če ne že dnevno (Siol)
  • User Agent: se spremeni z vsako nadgradnjo brskalnika na novo različico, nove različice pa so na voljo praktično vsak mesec (Firefox/Chrome...)
  • ... še kakšna ideja?

28 odgovorov

iz tvoje tipkovnice v IP ušesa .... bojim pa se tega :

"Vse več se uporablja tudi prepoznava podpisa uporabnikove naprave oz. brskalnika (device/browser fingerprinting), ki sicer ne uporablja piškotkov, a lahko prepozna uporabnika. Tudi v slednjem primeru pridejo v poštev pravila o varovanju osebnih podatkov ter tako lahko tudi določbe nove zakonodaje"

Pa to ni noben osebni podatek če ti iz IP-ja in User Agenta dobiš ven nek hash in ga shraniš! In kdo in kako bo to dokazal, kako si postavil clientID? Informacijska pooblaščenko bodo podkovali, da gleda kolačke v brskalniku in to bo tudi delala po mojem.

Jaz mislim da je IP + User agent dovolj, iz tega narediš hash in imaš unique ID. Ok, boš imel drugič pač drug IP in drug brskalnik, malo bo odstopanja v statistiki, ampak si se pa rešil kolačka. Za reg. uporabnike lahko imaš pa vedno iz vseh naprav enak ID, kar pri Google Analytics nisi mogel.

In zakaj bi uporabil le to dvoje? Iz preprostega razloga. Ker lahko to dobiš server side, ni treba v javascriptu, torej ti brez sodne odredbe ne morejo dokazati, kaj uporabljaš da identificiraš uporabnika.

1

@jerry2: Tudi sam razmišljam enako kar se tiče izvajanja nadzora, zato pa tudi iščem alternativo, kako bi mi uspelo obdržati vsaj statistiko obiskanosti.

Nekako nepredstavljivo je, da moram strankam razložiti, da bodo ostale brez statistike. Gre za tromestno število spletnih mest, ki jih moramo do 15.6. prilagoditi, da bodo ustrezali novem zakonu in ne bi rad sedaj prišel do prehitrega zaključka in bomo nato naknadno še enkrat prilagajali in posodabljali vse te projekte.

Piškotkov nikoli nismo zlorabljali v nobene zle namene in me tudi ne moti, da v rešitvah, kjer se uporablja košarica, prijava uporabnika, obiskovalca povprašamo ali želi, da uporabimo piškotke, da mu ne bo potrebno ob naslednjem obisku ponovno polniti košarice ali vpisovati e-mail naslova pri prijavi. Če nam ne zaupa, pač tega ne bo dovolil in za mene to zadostuje.

Jaz imam za stranke obvezno registracijo, tako so pač želele takrat. Saj kolaček za registracijo je nujen in spada med izjeme, tako da ni treba popupa zaradi njega. Najbolj sporna sta GA in oglasi. Ampak predelujem OpenX da ne bo postavljal kolačkov. Pač ne bodo oglasi servirano na tisti način, da naj ne prikaže več kot enega od iste akcije, kaj me briga. Ampak če za oglas ne shranim kolačka, bodo birokrati zadovoljni.

Mimogrede, popraviti oz. pripraviti moram tudi vse za DDV nov, kar je sicer spet svojega denarja neumnosti vredno, ampak vsaj vem kako moram in kaj moram...

Živjo.

Brez piškotka povratnega obiskovalca preprosto ni možno prepoznati razen, da
- uporablja statistični ip naslov
- ni zaprl brskalnika in še vedno laufa "session"
- s pomočjo registracije ter prijave (to je najbolj učinkovit način za identifikacijo uporabnika), saj računalnik je lahko tudi v skupni uporabi npr. šole, knjižnice ipd.

Tehnično gledano ni možno, a za potrebe analize je dovolj blizu, da so rezultati nekako spodobni ;-)

faca: od vseh naštetih je možna le tretja varianta s prijavo. Pa še ta je bolj približna...

  • 'statistični' IP ( :P ) ni ok, ker imaš lahko za routerjem 50 ljudi, ti boš pa videl 1 IP
  • session ima timeout (.NET = 20 minut, PHP mislim da 24 minut - govorim za privzete vrednosti), tako da ti tudi to ne pomaga preveč

jerry: "kolaček" :D

Pri kombinaciji IP naslova in UserAgenta upoštevaj še to, da recimo obiskovalci iz javne uprave (kar nam itak generira 50% prometa :) pridejo z istega IPja in z istim UserAgentom. Imel boš sicer približno pravo število obiskov, ampak izjemno veliko returning visitorjev.

A se sedaj že uradno ve, da za GA ni treba dajat opt-in?

@Spartacus: in kaj imajo veze privzete vrednosti... razen ce jih ne mores spreminjat, potem je tvoj point invalid...

obstaja se HTML5 storageEngine... ampak to je (zakonsko gledano) isto kot cookie...

kot je nekdo ze na zacetku povedal... prva opcija z IPjem bi bila se dokaj ok, ce je IP staticen in seveda ce v hash zlepis se User agent... zavedati se pa je potrebno, da imas v nekaterih podjetij na 10ih racunalnikih, ki so povezani na isti modem... enak OS in enak browser (zaradi vzdrzevanja)... tak da statistike nebi bile vedno realne

Mešetar:
@Spartacus: in kaj imajo veze privzete vrednosti... razen ce jih ne mores spreminjat, potem je tvoj point invalid...

Seveda lahko nastavljaš timeout (oz. expiration). Ampak, ti bi userju omogočil, da ima lahko 1 mesec odprt session? Resno?

Mogoče se pa kaj novega naučim, pa bova z LukaTCE elite sysadmina :)

2