Computer, Programming
Unsa ang usa ka crawler? crawler nga himan "Yandex" ug sa Google
Matag adlaw diha sa Internet adunay usa ka dako nga kantidad sa bag-o nga mga materyales sa paghimo sa usa ka website updated sa daan nga mga panid sa web, upload litrato ug video. Kon wala matago gikan search maquina dili makaplagan diha sa World Wide Web, walay bisan kinsa sa niini nga mga dokumento. Alternatibo sama sa robotic mga programa sa bisan unsa nga panahon wala maglungtad. Unsa ang usa ka search robot, nganong gikinahanglan ninyo kini ug sa unsa nga paagi sa pag-operate?
Unsa ang usa ka search robot
Crawler site (search engine) - kini mao ang usa ka automatic nga programa nga mao ang makahimo sa pagbisita sa mga minilyon nga mga panid sa web, sa madali pagnabigar pinaagi sa internet nga walay bisan unsa nga interbensyon operator. Bots kanunay scan luna sa World Wide Web, pagpangita sa bag-ong mga panid sa web ug regular nga magadu-aw na-index. Ang ubang mga ngalan alang sa web crawlers kaka, crawlers, bots.
Ngano nga ang search engine kaka
Ang nag-unang gimbuhaton nga sa pagbuhat sa search engine sa kaka - mga panid sa web indeks, ingon man usab sa text, mga larawan, audio ug video files nga anaa sa ibabaw nila. Bots check mga pakisayran, samin sites (kopya) ug updates. Ang mga robot usab sa pagbuhat sa HTML-code kontrol alang pagsubay sa mga sumbanan sa World Organization, nga og ug nagpatuman teknolohiya nga mga sukdanan alang sa World Wide Web.
Unsa ang sa pag-index, ug nganong kini gikinahanglan
Ang pag-indeks - mao, sa pagkatinuod, mao ang proseso sa pagbisita sa usa ka partikular nga panid sa web sa search maquina. Ang programa mianinaw sa teksto sa niini nga site, mga larawan, video, outbound sumpay, nan ang panid makita diha sa mga resulta sa pagpangita. Sa pipila ka mga kaso, ang site dili awtomatikong scan, nan kini mahimo nga gidugang ngadto sa search engine sa kamut Webmaster. Kasagaran, kini mahitabo sa wala sa gawas nga sumpay ngadto sa usa ka partikular nga (sa kanunay bag-o pa lamang gibuhat sa) panid.
Sa unsa nga paagi sa pagpangita engine kaka
Ang matag search engine adunay iyang kaugalingon nga bot uban sa search robot Google mahimo vary kamahinungdanon sumala sa mekanismo sa mga buhat sa usa ka susama nga programa, "Yandex" o sa uban nga mga sistema.
Sa kinatibuk-an, usa ka robot sa pagtrabaho nga baruganan mao ang sama sa mosunod: sa programa "moabot" sa site ug sa gawas sumpay gikan sa nag-unang pahina, "mabasa nga" Web kapanguhaan (lakip na ang mga sa pagtan-aw sa ibabaw nga dili makakita sa user sa). Boat mao ang unsaon sa navigate tali sa mga panid sa usa ka site ug mobalhin sa uban.
Ang programa mopili nga site sa indeks? More sa kasagaran kay sa dili "mapandol" sa kaka nagsugod sa mga dapit nga balita o mayor nga resource direktoryo ug aggregators uban sa dako nga pakisayran gibug-aton. Crawler padayon mianinaw sa mga panid usa sa usa, sa rate ug pagkamakanunayon sa pag-indeks sa mosunod nga mga hinungdan:
- Internal: perelinovka (internal links sa taliwala sa mga panid sa sa mao gihapon nga kapanguhaan), gidak-on site, ang husto nga code, user-friendly ug sa ingon sa;
- Sa gawas: ang kinatibuk-ang paghisgot gibug-aton, nga mosangpot ngadto sa sa site.
Ang unang butang nga sa search robot pagpangita sa bisan unsa nga website pinaagi sa robots.txt. Dugang pa nga kapanguhaan sa pag-index mao ang gihimo base sa impormasyon nga nadawat kini gikan sa dokumento niini. Ang kining payl adunay piho nga mga panudlo alang sa "kaka" nga mahimo sa pagdugang sa mga kahigayonan sa pagbisita panid pinaagi sa search maquina, ug, sa ingon, aron sa pagkab-ot sa usa ka sayo nga hit site sa "Yandex" o Google.
Program analogs crawlers
Kasagaran ang termino nga "search robot" ang naglibog sa intelihente, user o autonomous ahente, "hulmigas" o "ulod". Nalingaw mahinungdanon nga mga kalainan lang kon itandi sa mga ahente, sa uban nga mga depinisyon nagtumong sa susama nga matang sa robot.
Pananglitan, ahente mahimong:
- intellectual: ang programa, nga mibalhin gikan sa site ngadto sa site, nga bulag sa paghukom sa unsa nga paagi sa pag-mopadayon; sila dili kaayo komon diha sa Internet;
- Autonomous: Kini nga mga ahente sa pagtabang sa user sa sa pagpili sa usa ka produkto, search, o sa pagsulat mga porma, ang mao nga-gitawag nga pagsala, nga mga gagmay sa nga may kalabutan sa mga programa sa network;.
- user: ang programa makaamot sa user interaction uban sa World Wide Web, usa ka browser (alang sa panig-ingnan, Opera, IE, Google Chrome, License), mga mensahero (viber, Telegram) o mga programa sa e-mail (MS Panglantaw ug Qualcomm).
"Hulmigas" ug "ulod" mas susama sa search engine "kaka". Ang unang porma sa taliwala sa usa ka network ug sa kanunay makig sama niini olmigas kolonya, "ulod" mao ang makahimo sa pagkopya sa sa ubang mga bahin sa mao usab nga ingon sa mga sumbanan nga crawler.
Matang sa search engine robots
Ila tali sa daghan nga mga matang sa mga crawlers. Depende sa katuyoan sa programa, sila:
- "Samin" - doble nga browse website.
- Mobile - focus sa mobile bersiyon sa mga panid sa web.
- Dali - ayo bag-ong impormasyon sa madali pinaagi sa pagtan-aw sa mga pinaka-ulahing mga updates.
- Reference - pakisayran index,-ihap sa ilang mga numero.
- Tig-indeks sa lain-laing mga matang sa sulod - piho nga mga programa alang sa teksto, audio, video, mga larawan.
- "Spyware" - sa pagtan-aw alang sa mga panid nga wala pa gipakita sa search engine.
- "Balalatok" - matag mobisita sa mga dapit sa pagsusi sa ilang mga kalabutan ug efficiency.
- National - basabasa sa Web mga kapanguhaan nga nahimutang sa usa sa mga kabilin nga yuta (pananglitan, .mobi, o .kz .ua).
- Global - index sa tanan nga mga national nga mga dapit.
Robot mayor nga search engine
Adunay usab sa pipila ka mga search engine kaka. Sa teoriya, ang ilang kagamitan, katuyoan mahimong vary kaylap, apan diha sa buhat sa mga programa sa mao ang hapit susama. Ang nag-unang kalainan pag-indeks mga panid sa web robot duha ka mayor nga mga search engine sama sa mosunod:
- Ang stringency sa pagsulay. Kini mao ang nagtuo nga ang mekanismo sa crawler "Yandex" medyo istrikto banabana sa site alang sa pagsunod sa mga sumbanan sa World Wide Web.
- Pagpreserba sa sa integridad sa mga site. Ang Google crawler indeks sa tibuok site (lakip na ang media sulod), "Yandex" mahimo usab nga sa pagtan-aw sulod selectively.
- Speed pagsulay sa bag-ong panid. midugang Google bag-ong kapanguhaan sa mga resulta sa pagpangita sa sulod sa pipila ka adlaw, sa kaso sa "pinaagi sa Yandex" proseso aron sa pagkuha sa duha ka semana o labaw pa.
- Ang frequency sa pag-indeks. Crawler "Yandex" check alang sa mga update kaduha sa usa ka semana, ug sa Google - usa sa matag 14 ka adlaw.
Internet, siyempre, dili limitado sa sa duha ka mga search maquina. Ang ubang mga search maquina sa ilang mga robot nga mosunod sa ilang kaugalingon nga mga lantugi sa pag-indeks. Dugang pa, adunay mga pipila ka mga "kaka" nga gidisenyo dili mayor nga mga kapanguhaan search, ug tagsa-tagsa nga mga team o Webmasters.
komon nga sayop nga mga ideya
Sukwahi sa popular nga pagtuo, "kaka" dili pagproseso sa mga impormasyon. Ang programa lamang nanaw ug tindahan mga panid sa web ug dugang pagproseso nagkinahanglan sa usa ka bug-os nga lain-laing mga robot.
Usab, sa daghan nga mga tiggamit nagtuo nga ang search engine kaka adunay usa ka negatibo nga epekto ug "makadaot" Internet. Sa pagkatinuod, pipila ka bersiyon sa "kaka" mahimong kamahinungdanon overload sa server. Adunay usab usa ka tawo nga butang - sa Webmaster, nga nagbuhat sa programa, makahimo og mga sayop sa robot kontorno. Apan ang kadaghanan sa mga kasamtangan nga mga programa sa mga maayo ang gidesinyo ug sa propesyonal nga nakahimo, ug sa bisan unsa nga pagpakita, paggutla mga problema dayon gikuha.
Sa unsa nga paagi sa pagdumala sa indexing
Search engine robot mao ang automated mga programa, apan ang indexing proseso mahimong partially gikontrolar sa Webmasters. Kini sa hilabihan gayud makatabang sa gawas ug sa internal nga pagkamalaumon sa kapanguhaan. Dugang pa, nga imong mahimo sa kamut makadugang sa usa ka bag-o nga site ngadto sa usa ka search engine: dako nga mga kapanguhaan nga adunay usa ka espesyal nga porma sa mga panid Web registration.
Similar articles
Trending Now