Semalt: Google Chrome Plugin менен веб-маалыматтарды алуу

Эгер сиз Google Chrome Браузерин тармакка чыгуу үчүн колдонгон болсоңуз, анда сүйүктүү веб-баракчаларыңыздан маалыматтарды алуу үчүн браузер плагини бар. Google Chrome Scraper бул динамикалык жана статикалык веб-сайттардан маалыматтарды алуу үчүн колдонулган программа. Бул Chrome плагин сүйүктүү веб баракчаңыздын мазмунун кырып салып, Google Документтерде сактоого мүмкүндүк берет.

Google Chrome Желе скрабы

Google Chrome Желе скрепери - бул сайттардан жана баракчалардан маалыматтарды алып турган серепчи кеңейтүүсү. Бул кеңейтүү менен сиз күнү бою сайттардан мазмунду көчүрүп алуу үчүн жүздөгөн жумушчуларга муктаж эмессиз. Chrome браузериңизге орнотулгандан кийин, максаттуу-мазмунун тандап, веб-скреперге калганын кылуу керек.

Эгер сизде кодировкалоо билими жок болсо, анда бул мыкты веб-скрепер. Google Chrome Scraper кичинекей жана ири масштабдуу кыртыш үчүн сунушталат. Ал баалуу маалыматтардан жана атаандаштыкка каршы чалгындоо маалыматтарына айландырылышы мүмкүн болгон маалыматтардан турат. Бул кеңейтүү менен, бардык максаттуу сүрөттөрүңүздү жана каталогдоруңузду оңой чыгарып, CouchDB же электрондук жадыбалдарга экспорттоого болот.

Баштоо жөнүндө көрсөтмөлөр

Веб-баракчаларды браузер плагининин жардамы менен кыркуу - бул өзүңүздүн милдетиңиз, аны компьютериңизде тез эле аткара аласыз. Бул жерде баштоого жардам берген акыркы көрсөтмө бар:

  • Google Chrome браузериңизди иштетип, "Chrome Желе дүкөнүн" чыкылдатыңыз.
  • Браузериңиздин кеңейтүүлөрүн ачыңыз жана "Scraper" издеңиз.
  • Экраныңызда көрсөтүлгөн "Chrome-га кошуу" опциясын чыкылдатыңыз
  • Тазалоо үчүн веб-сайтты же веб-баракчаны ачыңыз жана алына турган маалыматты баса белгилеп коюңуз. Элементти оң баскыч менен чыкылдатып, "Скрепке окшош" баскычын чыкылдатыңыз.
  • Экранда кыргыч консолу пайда болот. Веб скрепердин консолу алынган маалыматтарды камтыйт.
  • Бул этапта, кырылган мазмунуңузду каякта сактоону чечсеңиз болот. Мисалы, "Google Документтерге сактоо" баскычын чыкылдатып, мазмунду Google Документтерге сактап койсоңуз болот.

"Кыргыч" бул динамикалык веб-баракчалардан жана сайттардан пайдалуу маалыматтарды чыгарган автоматташтырылган скрипт. Желе кыргыч куралдарынан айырмаланып, Google Chrome веб-скрепери JavaScript менен түзүлгөн маалыматтарды кыргышы мүмкүн. Chrome скрепер плагининин аткарган башка милдеттерине төмөнкүлөр кирет:

  • Маалымат жүктөө үчүн мазмун баскычтарын чыкылдатуу;
  • AJAX жардамы менен маалымат жүктөгөн пагинация баскычтарын чыкылдатуу;
  • Көбүрөөк мазмун жүктөө үчүн веб-баракчаларды жылдырып;
  • Веб баракчасына динамикалык мазмун жүктөлөт деп күтүп жатабыз;

Веб-баракчадан маалыматтарды кыркып алгандан кийин, сиз маалыматты үтүр менен бөлүнгөн маанилерде (CSV) жүктөп алсаңыз же CouchDBде сактап койсоңуз болот. Google Chrome Желе скрепери менен, маалыматтарды чыгаруу, план түзүү же экспорттоо боюнча иштөөнүн кажети жок.