Граббинг процесс сканирования информации
22 012 просмотровГраббинг – это сканирование каких-либо ресурсов и получение с них нужной информации. В применении к интернету это чаще всего сканирование сайтов и скачивание с них информации.
Эта информация может быть самой разнообразной – программы, фильмы, музыка, архивы и всякая другая информация, интересная пользователям интернета.
Приветствую Вас на страницах моего сайта inetmkt.ru.
Решил продолжить тему, начатую в прошлой статье, посвященной процессу парсинга. И рассказать Вам о еще об одном очень похожем процессе, термине-синониме – граббинге.
Этот термин произошел от английского слова “grab”, что в переводе обозначает использовать, перехватывать. В большинстве случаев этот процесс автоматизирован, для этого используется соответствующее программное обеспечение. Эти программы называются грабберами.
Если честно признаться, то у меня этот термин поначалу ассоциировался с граблями, ведь корни слов очень похожи. разобравшись понял, что общее начало в них все же заложено.
Сканирование информации другими словами можно выразить, как прочесывание. А грабли тоже очень хороши в этом деле. Но к граблям мы вернемся в конце статьи, а сейчас попробуем разобраться с граббингом.
При использовании этого процесса есть серьезная этическая подоплека. Хорошо это или плохо? И мне кажется, что по большому счету это не хорошо. Ведь использовать чужой труд без согласования это плохо.
Однако стоить заметить, что в некоторых случаях это бывает оправданным. Например у Вас сайт на экономическую тематику и Вы среди прочей информации предоставляете своим посетителям текущие курсы валют. Или у вас новостной сайт по определенной тематике и желательно выдавать новости как можно быстрее. Вот для таких и схожих с этими ситуациями пременение грабберов и парсеров может быть оправданным.
Это будет наиболее оптимальным решением в данном случае. Еще бы не забывать давать ссылку на первоисточник и тогда все будут довольны. И посетитель получил полную, свежую и достоверную информацию, и обладатель первоисточника получил ссылку на свой ресурс и автор материала, проделав хорошую работу.
При сравнении терминов граббинг и парсинг, приходишь к выводу. Что процесс парсинга и применение парсеров будет несколько шире своего синонима. Ведь принципы парсинга применяются в таких программных разработках, как переводчики с одного языка на другой или в трансляторах языков программирования и здесь термин граббинг ну совершенно не подходит.
Если быть более конкретным, то граббинг сайтов это сбор информации по определенным параметрам с определенных сайтов. Это может помочь при каких-либо статистических исследованиях или при создании тематических баз данных. Причем процесс этот довольно кропотливый и требует затрат как временных, так и моральных. Особенно при нестабильной работе интернета.
Люди, специализирующиеся по этой теме очень неплохие программисты. Для написания программы-граббов чаще всего используют язык C#, несколько реже PHP или другие языки программирования. В среднем цена программы для сканирования одного сайта составляет 25$.
Если Вас интересуют программы парсеры, то могу порекомендовать наиболее достойный вариант. Это программа Datacol5 — действительно профессиональный многофункциональный парсер.
И что же нам делать, если наш сайт подвергается этому процессу? Чаще всего утечка информации может быть с RSS-источников, но не только. Мне в голову приходит только один толковый совет. Создавайте статьи и грамотно их перелинкуйте, чтобы ссылки были органично связаны с текстом.
В этом случае, если Ваша статья попала на чужой ресурс, ссылки с него все равно приведут посетителя к Вам, да и поисковые системы учтут эту ссылочку. Вот такой простой, но работающий прием.
И напоследок Вам расскажу о таком явлении как граббинг спутникового канала. К интернету это имеет косвенное отношение, но в последнее время получило очень широкое распространение и среди участников называется «спутниковая рыбалка». Люди сканируют спутниковые каналы и качают все, что их там интересует. А это фильмы, музыка, программы… Для этого используется соответствующее спутниковое оборудование и программное обеспечение.
А вот что говорит народ про граббинг:
Не по Ксеньке Граббер.
~ Ермак про граббинг
С Граббером рай в шалаше.
~ >Ленин про грабинг
Криблинг, Краблинг, Граббинг
В конце позволю себе вернуться к теме граблей, я натолкнулся на забавную картинку и решил ее выложить для Вас, улыбнитесь и будьте здоровы.
Вот собственно и все на сегодня по этой теме, желаю всем успехов.
Новое словечко — расширяем словарный запас 🙂 Спасибо!
Спасибо интересная статья и поучительная.
Встречала это понятие на фрилансере.ру Теперь понятно о чем идет речь. Статья веселой получилось,здорово 🙂 мне так кажется!
Не хотелось бы, чтобы этот грабинг забрался на мой сайт.
Грабли реально внушили понимание проблемы.
Даже не слышала о граббинге и парсинге — пополняю лексикон.
Добрый день. Много слышал про граббинг, но мало что об этом понимал. Увлекательная статья. Продвижения вашему проекту. Заходите в гости.
раньше пользовался аудиограббером, а сейчас надобность в них полностью отпала. вся инфа есть в интернете, в любом качестве и свободном доступе
Спасибо за интересную и познавательную статью. Удачи Вам
Сегодня день прошел не зря. Узнала то, чего не знала раньше. Конечно же, никогда не пользовалась. Но теперь хоть не буду чувствовать себя неловко, если услышу этот термин. Буду знать, о чем речь
Спасибо вам за то , что узнала о граббинг и что это сканирование каких-либо ресурсов. Приятно когда узнаешь что-то новое новое.
Слово само за себя говорит, точно и практически дословно характеризует сам процесс
Это слово очень ассоциируется с грабежом. У нас появляется все больше и больше терминов из других языков, что и не запомнишь всего.
На чужом горбу долеко не уедешь, не стоит воровать информацию, уникальная статья написаная самостоятельно, но неважно, лучше украденой, в том числе и для поисковых машин.
К стате в тексте в некоторых местах пропущены буквы — нужна проверка.
Спасибо, посмотрю, исправлю.
Иногда (а в последнее время довольно часто)в Яндекс-метрике вижу переходы с поисковиков. Время нахождения на сайте от 0 до 5 секунд. Может быть, это «ОНО»? Читала где-то, что это боты сканируют на предмет информации и «тырят» контент. Не хотелось бы. Сайту всего два с небольшим месяца, статей и так мало.
С термином была знакома, но не так подробно, спасибо просветили.
Большое спасибо за такую ценную информацию!
Гм. Да grab и грабли — похожие слова и по звучанию, и по смыслу 🙂
Познавательно. Спасибо за статью.
Полезная и познавательная статья, честно говоря, до прочтения это было для меня китайской грамотой..
А еще бывают CD грабберы — копировалщики музыки с аудио CD, так как напрямую скопировать музыку с аудио CD не получится. Одна прога так и называется — CD Grabber
АНБ пользуется парсерами? Аудиопарсеры. Символьные парсеры. Сноуден применяет парсеры? Шпионские это штучки. Уважительный вопрос к Юрию. Просвети. За возлюбленной проследить с помощью парсера. Оно не лишне. Нет такой рыбки, чтобы воды не замутила.