Web scraping

Web scraping nazivaju još i Web harvesting, ili Web data extraction. Na našem jeziku, to je proces izvlačenja velike količine nestruktuiranih informacija sa jednog ili više web sajtova, najčešće u HTML formatu, i njihove transformacije u oblik pogodan za čuvanje u centralnoj bazi podataka i analizu.

Firme ili državne institucijeKada se realizuje IT projekat, bez obzira da li je u pitanju jednostavan registar poslovnih partnera, medijski web portal ili složeni poslovno informacioni sistem, veoma bitan segment koji se često zanemaruje je popunjavanje baze podataka sadržajem.

Naši programi za web scraping takve poslove obavljaju za delić vremena koje je potrebno za unos podataka kada to rade ljudi, mogućnost greške je svedena na minimum eliminisanjem ljudskog faktora, a naručiocu posla donosi neverovatnu uštedu u ljudskim resursima, vremenu i novcu.

Privatni naručiociBanalan primer su besplatni forumi. Često se dešava da online zajednica preraste njihova ograničenja, ali vlasnici nisu u mogućnosti da svoj forum prebace na drugu platformu i/ili hosting jer im nije dozvoljen pristup bazi podataka. Slična je situacija sa nalozima za hosting slika, facebook nalozima itd.

U takvoj situaciji možemo pomoći našom tehnologijom za web scraping, koja u kratkom vremenskom roku može da pokupi sadržaj npr. foruma i isti automatski pripremi za prebacivanje na neku drugu platformu.