Semalt: Mashhur yozib bo'lmaydigan veb-saytlar

O'zingiz xohlagan ma'lumotni qirib tashlash uchun siz mukammal dasturlash qobiliyatiga ega bo'lishingiz kerak. Shu bilan bir qatorda, ma'lum bir formatda ma'lumotlarni o'qish, tuzish va qirqish uchun mo'ljallangan veb-ma'lumotlarni yig'ish vositalaridan foydalanishingiz mumkin. Biroq, ba'zi veb-saytlar blokirovka qilinmaydi, ya'ni ular qirib tashlashga qarshi texnikani ishlatadilar yoki ularning belgilarini doimiy ravishda o'zgartiradilar. Masalan, LinkedIn, Alibaba va Facebook kirish ma'lumotlarini talab qiladi, CAPTCHA-ga kirishni taklif qiladi va foydalanuvchilarning himoyasi va maxfiyligini ta'minlash uchun IP-manzillarni bloklaydi.

1. Facebook:

Facebook butun dunyo bo'ylab 20 milliondan ortiq faol foydalanuvchilarga ega bo'lgan eng mashhur ijtimoiy tarmoqlardan biridir. Facebook-dan shaxsiy ma'lumotlarni olishni maqsad qilgan ko'plab dasturlar va ma'lumotlarni skrining dasturlari mavjud. Afsuski, aksariyat vositalar bizga aniq va o'qiladigan ma'lumotlarni taqdim etmaydi. Facebook spammerlar va xakerlarga o'z foydalanuvchilari haqida ma'lumot to'plashni qiyinlashtirdi. Buni faqat Python kabi HTML-tahlilchi yordamida olish mumkin, ammo veb-ustalar va freelancerlarning aksariyati Python asoslarini hatto bilishmaydi. Yaqinda ushbu ijtimoiy tarmoq veb-saytidan muhim ma'lumotlarni olish uchun Facebook kazıyıcı ishga tushirildi. Facebook kazıyıcı yordamida siz faqatgina Facebook foydalanuvchilarining ismlari va elektron pochta manzillarini to'plashingiz mumkin. Ammo agar siz chuqur ma'lumotlarni yig'moqchi bo'lsangiz, ushbu vositadan yoki boshqa shunga o'xshash kazıyıcılardan foydalana olmaysiz.

2. LinkedIn:

LinkedIn - bu ijtimoiy tarmoqning boshqa veb-sayti, uni qirib tashlashning iloji yo'q. Biroq, siz qisman ma'lumotni bir nechta veb-sahifalardan chiqarib olishingiz mumkin, ammo ma'lumotlarning aksariyati mavjud emas. Siz faqatgina Import.io yoki Kimono Labs-dan foydalangan holda LinkedIn-ning umumiy profilidagi ma'lumotlarni qirib tashlashingiz mumkin. LinkedInning kuchli xavfsizlik choralari tufayli sotuvchilar qirib tashlash xizmatlaridan foydalana olmaydilar. Biroq, ular jamoat profillarini qirib tashlashga yordam beradigan qo'rg'oshin ekstraktorini ishlatishni boshladilar. Ushbu vosita faqat profil havolalarini, ismlarni va elektron pochta manzillarini qirib tashlashi mumkin. Agar siz Skype identifikatorini, Yahoo Messenger ID-ni, to'liq manzilingizni va foydalanuvchining Twitter-ning identifikatorini olishni istasangiz, LinkedIn sizga buni qilishga ruxsat bermaydi.

3. Alibaba:

Alibaba - bu Internet orqali biznesdan iste'molchilarga xizmat ko'rsatadigan texnologiya konglomerati. Afsuski, ushbu veb-saytdan ma'lumotlarni qirib tashlashning imkoni yo'q. Amazon va eBay-dan farqli o'laroq, Alibaba o'z foydalanuvchilariga o'z mahsulotlari, rasmlari, tavsiflari va narxlari to'g'risida ma'lumot olishni qiyinlashtirdi. 2015 yilda Alibaba-dan ma'lumotlarni osongina qirqib tashlashi mumkin bo'lgan bir qator vositalar ommaga tanishtirildi. Aksariyat vositalar to'lanadi va startaplarning taxminlariga javob bermaydi. Alibaba butun dunyoda keng qamrovli biznesni yuritadi va xaridorlarni etkazib beruvchilar bilan bog'laydi. Shu bilan birga, bu ularning maxfiyligini ta'minlaydi va hech kim ma'lumotlarni qirib tashlashiga yo'l qo'ymaydi. 2017 yil oktabr holatiga ko'ra, Alibaba o'z platformasida har oy 500 milliondan ortiq faol foydalanuvchilarga ega. Alibaba hatto bulutli daromadlarning o'sishi bo'yicha Amazon, Google va Microsoft kabi yirik bulut pleyerlaridan ustun keldi. U etkazib beruvchilarning maxfiyligini ta'minlash uchun eng yaxshi strategiyalarni amalga oshirdi va bir necha soniya ichida barcha shubhali IP manzillarni bloklaydi.