Cum să salvezi site-uri întregi

17.04.2009
Cum să salvezi site-uri întregi
De ce sa salvezi website-uri; aplicatia HTTrack

Ca orice paranoic care se respectă, după ce mi-am tras două yale la uşă şi mi-am instalat un detector de microfoane, panicat fiind de faptul ca www-ul ar putea să crape într-o zi, am hotărât să fac o copie numai a mea a unei bucăţi de Internet.

Ei bine, versiunea softcore e alta: multe dintre siturile pe care găseam informaţii foarte utile – chestii valabile timp îndelungat, resurse de cunoaştere la care apelezi când ai nevoie – au sucombat integral ori parţial în cei 10 ani de când am coborât din copac în faţa monitorului. Până să o păţesc, pur şi simplu adăugam linkurile interesante în lista de "favorite". Astfel, cutia mea craniană a hotărât să cerceteze cum s-ar putea salva pe hard disk întregi site-uri, uşor şi automatizat, ca mai apoi, deschizându-le offline să le vadă la fel de accesibile ca şi în versiunile lor online.

Înainte de a trece la prezentarea soluţiilor descoperite, trec punctual motivaţiile posibile pentru apelarea la aşa-numitele aplicaţii web-spider sau web-copier:

  • ai un site al tău şi vrei să-l distribui pe un CD sau stick USB unor persoane care n-au conexiune la net; persoanele respective îl vor accesa de pe mediul de stocare cu ajutorul browserului, indiferent de sistemul de operare şi fără să instaleze vreun soft suplimentar
  • te urci în trenurile de dat în hepatită marca CFR ori în avion, te aşteaptă drum lung şi laptopul ţi-e alături; cu ocazia asta ai vreme să browsezi site-urile copiate în prealabil pe hard disc ca să eviţi plictisul ori vizionarea incomodă a unui film
  • hopaaa: downloadezi automat şi fără să mai pierzi vremea agitând mausul de pe site-uri cu conţinut protejat de tipul "plăteşti 1 dolar şi ai la dispoziţie o zi ca să iei cât poţi duce"
  • lasă imprimanta să se odihnească pentru zile mai negre, salvând pe HDD siturile cu documentaţie ce te priveşte
  • fă o copie a sitului până nu-l bagă domnul Lucifer în faliment sau până ce nu-i schimbă obiectul de activitate; sigur ai găsit pe net un blog interesant cu multe reţete de gătit, cu poze ce-ţi oferă idei de amenajare a locuinţei, cu scheme şi figuri de judo, sănătate, citate celebre, un site cu tutoriale despre cum să devii Superman sau Traian Băsescu, cum să procreezi fete de succesuri în afaceri din vânzări anterioare 🙂
  • plus backup (accesibil fără complicaţii – baze de date, php and stuff) periodic al site-urilor tale în vederea utilizării ca probă în cazul unor procese ce ţin de drepturile de autor – deşi nu ştiu în ce măsură e valabil d.p.d.v. juridic, în România

HTTrack

HTTrack Webcopier
 Pe vremea când m-am interesat pentru prima dată de o aplicaţie care să salveze site-uri întregi care mai apoi să poată fi accesate offline la fel cum o faci direct de pe net am găsit ca soluţie "mondială" numitul HTTrack. Chiar şi după doi ani de când îl folosesc, fireşte doi ani în care soft-ul s-a mai dezvoltat, rămâne în "pole position-ul" personal, în ciuda testării recente a altor aplicaţii similare, dar comerciale.
Nu numai că este un program gratuit, capabil să ruleze atât instalat în "Program Files" cât şi de pe stick de memorie USB, dar este disponibil pentru orice sistem de operare popular: Windows (95/98/NT/2000/XP), Mac OSX sau Linux.
La instalare ai posibilitatea de a alege limba română. Permite salvarea integrală sau parţială a unui site. Poate fi configurat în fel şi chip, dar asta presupune cotrobăirea help-ului şi cunoştinţe mai avansate. Cu toate setările pe default, nu am întâmpinat probleme în descărcarea site-urilor care m-au interesat. Totuşi, HTTrack nu se înţelege perfect cu anumite site-uri flash, cele ce utilizează intensiv  fişiere Java şi Javascript, respectiv cu cele bazate pe script CGI complex (exemplu concret, go4it.ro – eh, am comis-o!).

Urmărește Go4IT.ro pe Google News