Prodam email liste... ipd.
12 naročnikov
12 naročnikov
Trenutno pišem oz. imam že tako rekoč delujoč multithreading crawler (na 30 sekund prebrska okrog 1000 različnih spletnih strani /verjetno se da to še dosti izboljšati/), ki pobira emaile iz slovenskih spletnih strani. Za glavni vir uporablja iskalnike kot so najdi.si, google.com in podobne. Princip je v tem, da crawler pošlje ključno besedo na iskalnik, za katero bi si nekdo želel emaile. Nato prebrska vse linke, ki jih iskalniki podajo. Poveže se na spletne strani in pobere kontaktne emaile z njih. Seveda tu ne gre le za emaile, možnosti je več kot dovolj, za kar bi crawlerja lahko uporabljali. Zanima me, če je kdo interesiran za take email liste po kategorijah/ključnih besedah. Seveda me ne zanima v kakšne namene potrebujete te emaile, niti me ne zanima kaj boste s temi listami naredili, komu bi pa mogoče prišle prav.
Pravi razlog zakaj sem se spravil pisat tega crawlerja je v bistvu le to, da malce potreniram niti (threadi), poleg tega pa da testiram kje so meje zmožnosti različnih strežnikov, kako hitro in koliko strani lahko procesirajo.
35 odgovorov
Bl4ckB1rD:
Trenutno pišem oz. imam že tako rekoč delujoč multithreading crawler (na 30 sekund prebrska okrog 1000 različnih spletnih strani /verjetno se da to še dosti izboljšati/), ki pobira emaile iz slovenskih spletnih strani. Za glavni vir uporablja iskalnike kot so najdi.si, google.com in podobne. Princip je v tem, da crawler pošlje ključno besedo na iskalnik, za katero bi si nekdo želel emaile. Nato prebrska vse linke, ki jih iskalniki podajo. Poveže se na spletne strani in pobere kontaktne emaile z njih. Seveda tu ne gre le za emaile, možnosti je več kot dovolj, za kar bi crawlerja lahko uporabljali. Zanima me, če je kdo interesiran za take email liste po kategorijah/ključnih besedah. Seveda me ne zanima v kakšne namene potrebujete te emaile, niti me ne zanima kaj boste s temi listami naredili, komu bi pa mogoče prišle prav.Pravi razlog zakaj sem se spravil pisat tega crawlerja je v bistvu le to, da malce potreniram niti (threadi), poleg tega pa da testiram kje so meje zmožnosti različnih strežnikov, kako hitro in koliko strani lahko procesirajo.
5 minut dela/crawler!
najdi.si izpiše okrog 1000 strani na ključno besedo gore, google okrog 990, verjetno je kar nekaj le-teh podvojenih, tako da jih 1000 verjetno ne-bi nabral skupaj. Verjetno bi moral še kako ključno besedo si izmisliti poleg gore, da bi jih nabral 1000. Recimo planinec, planinarjenje, gorska koča ipd. Če bi upošteval še te pa bi se kaj hitro nabralo. Standard je da iz okrog 700-1000 linkov (strani) pride ven okrog 250-300 različnih emailov.
Bl4ckB1rD:
standard je da iz okrog 700-1000 linkov (strani) pride ven okrog 250-300 različnih emailov.
Kakšen standard?
Bl4ckB1rD:
najdi.si izpiše okrog 1000 strani na ključno besedo gore, google okrog 990, verjetno je kar nekaj le-teh podvojenih, tako da jih 1000 verjetno ne-bi nabral skupaj. Verjetno bi moral še kako ključno besedo si izmisliti poleg gore, da bi jih nabral 1000. Recimo planinec, planinarjenje, gorska koča ipd. Če bi upošteval še te pa bi se kaj hitro nabralo. Standard je da iz okrog 700-1000 linkov (strani) pride ven okrog 250-300 različnih emailov.
no na googlu boš ti dobil v 5 minutah luft zato k te google zablokira za 24 ur ko pride preveč requestov v določenem času. Od takrat naprej moraš vtopkavat kodo za vsako iskanje
Vzameš en proxy, naložiš na free hosting in narediš naprimer for zanko pa je :)
A te bodo tožli ker nekdo drug dela reklamo zate? My ass.
Jaz vsaj 10x na dan zadanem na lotu in kam naj se grem jokat... brezveze.
Kar se tiče iskalnikov je itak tko tko, do določene mere so rezultati emailov še relevantni, po toliko in toliko podstraneh pa so rezultati lahko že zelo narobni... To je sedaj tvoja stvar koliko v globino hočeš. V takem primeru je bolje zamenjati keyword. Sploh se je pa bolje na najdi.si orientirat, ker je le bolj relevanten za slovenski trg.
Glede spama, saj sem rekel, načeloma ne podpiram da bi se sedaj te liste abusalo. Mislim pa da načeloma ni take sile če gre za enkratno obvestilo ali kaj podobnega. Nenazadnje podoben spam prejmemo vsi na svoj email, pa ne gremo direkt prijavljat vsakega ki nam ga je poslal... Ena varijanta je tudi izbiranje bolj ne-veščih potencialnih kandidatov na public emailih ali kaj podobnega. Ti se najmanj pritožujejo :) Druga varianta je tudi da dodaš link "unsubscribe" zaradi lepšega v footer emaila, se pravi si ponudil možnost da se dotičnega ne obvešča več... Mislim da je ta stvar celo legalna v tem primeru. Možno pa je, da se motim. Skratka ravno kastrirali vas ne bodo, glede na to, da bi poslali recimo na le nekaj 10k emailov ste zelo mala ribica. Če pa je učinek le 1% imate že 100 novih aktivnih uporabnikov... Seveda je ta 1% bolj namenjen za tujino, v Sloveniji bi bil procent verjetno drastično večji.
Podajam le ideje, ne nagovarjam k temu. V razmislek.