Граббинг - синоним парсинга

Граббинг – это сканирование каких-либо ресурсов и получение с них нужной информации. В применении к интернету это чаще всего сканирование сайтов и скачивание с них информации.

Эта информация может быть самой разнообразной – программы, фильмы, музыка, архивы и всякая другая информация, интересная пользователям интернета.

Приветствую Вас на страницах моего сайта inetmkt.ru.

Решил продолжить тему, начатую в прошлой статье, посвященной процессу парсинга. И рассказать Вам о еще об одном очень похожем процессе,  термине-синониме – граббинге.

Этот термин произошел от английского слова “grab”, что в переводе обозначает использовать, перехватывать. В большинстве случаев этот процесс автоматизирован, для этого используется соответствующее программное обеспечение. Эти программы называются грабберами.

Это граблиЕсли честно признаться, то у меня этот термин поначалу ассоциировался с граблями, ведь корни слов очень похожи. разобравшись понял, что общее начало в них все же заложено.

Сканирование информации другими словами можно выразить, как прочесывание. А грабли тоже очень хороши в этом деле. Но к граблям мы вернемся в конце статьи, а сейчас попробуем разобраться с граббингом.

При использовании этого процесса есть серьезная этическая подоплека. Хорошо это или плохо? И мне кажется, что по большому счету это не  хорошо. Ведь использовать чужой труд без согласования это плохо.

Однако стоить заметить, что в некоторых случаях это бывает оправданным. Например у Вас сайт на экономическую тематику и Вы среди прочей информации предоставляете своим посетителям текущие курсы валют. Или у вас новостной сайт по определенной тематике и желательно выдавать новости как можно быстрее. Вот для таких и схожих с этими ситуациями пременение грабберов и парсеров может быть оправданным.

Это будет наиболее оптимальным решением в данном случае. Еще бы не забывать давать ссылку на первоисточник и тогда все будут довольны. И посетитель получил полную, свежую и достоверную информацию, и обладатель первоисточника  получил ссылку на свой ресурс и автор материала, проделав хорошую работу.

При сравнении терминов граббинг и парсинг, приходишь к выводу. Что процесс парсинга и применение парсеров будет несколько шире своего синонима. Ведь принципы парсинга применяются в таких программных разработках, как переводчики с одного языка на другой или в трансляторах языков программирования и здесь термин граббинг ну совершенно не подходит.

Если быть более конкретным, то граббинг сайтов это сбор информации по определенным параметрам с определенных сайтов. Это может помочь при каких-либо статистических исследованиях или при создании тематических баз данных. Причем процесс этот довольно кропотливый и требует затрат как временных, так и моральных. Особенно при нестабильной работе интернета.

Люди, специализирующиеся по этой теме очень неплохие программисты. Для написания  программы-граббов чаще всего  используют язык C#,  несколько реже PHP или другие языки программирования. В среднем цена программы для сканирования одного сайта составляет 25$.

Если Вас интересуют программы парсеры, то могу порекомендовать наиболее достойный вариант. Это программа Datacol5 – действительно профессиональный многофункциональный парсер.




И что же нам делать, если наш сайт подвергается этому процессу? Чаще всего утечка информации может быть с RSS-источников, но не только. Мне в голову приходит только один толковый совет. Создавайте статьи и грамотно их перелинкуйте, чтобы ссылки были органично связаны с текстом.

В этом случае,  если Ваша статья попала на чужой ресурс, ссылки с него все равно приведут посетителя к Вам, да и поисковые системы учтут эту ссылочку. Вот такой простой, но работающий прием.

И напоследок Вам расскажу о таком явлении как граббинг спутникового канала. К интернету это имеет косвенное отношение, но в последнее время получило очень широкое распространение и среди участников называется «спутниковая рыбалка». Люди сканируют спутниковые каналы и качают все, что их там интересует. А это фильмы, музыка, программы… Для этого используется соответствующее спутниковое оборудование и программное обеспечение.

А вот что говорит народ про граббинг:

Не по Ксеньке Граббер.
~ Ермак про граббинг
С Граббером рай в шалаше.
~ >Ленин про грабинг
Криблинг, Краблинг, Граббинг

Крутой и настойчивый граббер

Крутой граббер

В конце позволю себе вернуться к теме граблей, я натолкнулся на забавную картинку и решил ее выложить для Вас, улыбнитесь и будьте здоровы.

Вот собственно и все на сегодня по этой теме, желаю всем успехов.

 

Комментарии (23) на “Граббинг процесс сканирования информации”

  • Оксана пишет:

    Новое словечко – расширяем словарный запас :) Спасибо!

  • Люба пишет:

    Спасибо интересная статья и поучительная.

  • Тоня пишет:

    Встречала это понятие на фрилансере.ру Теперь понятно о чем идет речь. Статья веселой получилось,здорово :-) мне так кажется!

  • Екатерина пишет:

    Не хотелось бы, чтобы этот грабинг забрался на мой сайт.

  • Сергей пишет:

    Грабли реально внушили понимание проблемы.

  • Галина пишет:

    Даже не слышала о граббинге и парсинге – пополняю лексикон.

  • Дмитрий пишет:

    Добрый день. Много слышал про граббинг, но мало что об этом понимал. Увлекательная статья. Продвижения вашему проекту. Заходите в гости.

  • TarasBen пишет:

    раньше пользовался аудиограббером, а сейчас надобность в них полностью отпала. вся инфа есть в интернете, в любом качестве и свободном доступе

  • Сергей пишет:

    Спасибо за интересную и познавательную статью. Удачи Вам

  • Алена пишет:

    Сегодня день прошел не зря. Узнала то, чего не знала раньше. Конечно же, никогда не пользовалась. Но теперь хоть не буду чувствовать себя неловко, если услышу этот термин. Буду знать, о чем речь

  • Александра пишет:

    Спасибо вам за то , что узнала о граббинг и что это сканирование каких-либо ресурсов. Приятно когда узнаешь что-то новое новое.

  • Игорь пишет:

    Слово само за себя говорит, точно и практически дословно характеризует сам процесс

  • Максим пишет:

    Это слово очень ассоциируется с грабежом. У нас появляется все больше и больше терминов из других языков, что и не запомнишь всего.

  • dmitoks пишет:

    На чужом горбу долеко не уедешь, не стоит воровать информацию, уникальная статья написаная самостоятельно, но неважно, лучше украденой, в том числе и для поисковых машин.
    К стате в тексте в некоторых местах пропущены буквы – нужна проверка.

  • Ирина пишет:

    Иногда (а в последнее время довольно часто)в Яндекс-метрике вижу переходы с поисковиков. Время нахождения на сайте от 0 до 5 секунд. Может быть, это “ОНО”? Читала где-то, что это боты сканируют на предмет информации и “тырят” контент. Не хотелось бы. Сайту всего два с небольшим месяца, статей и так мало.

  • Светлана. пишет:

    С термином была знакома, но не так подробно, спасибо просветили.

  • Владимир пишет:

    Большое спасибо за такую ценную информацию!

  • ivvva пишет:

    Гм. Да grab и грабли – похожие слова и по звучанию, и по смыслу :)

  • Анна пишет:

    Познавательно. Спасибо за статью.

  • Сергей пишет:

    Полезная и познавательная статья, честно говоря, до прочтения это было для меня китайской грамотой..

  • Кулинар Хренов пишет:

    А еще бывают CD грабберы – копировалщики музыки с аудио CD, так как напрямую скопировать музыку с аудио CD не получится. Одна прога так и называется – CD Grabber

  • Гносеоник пишет:

    АНБ пользуется парсерами? Аудиопарсеры. Символьные парсеры. Сноуден применяет парсеры? Шпионские это штучки. Уважительный вопрос к Юрию. Просвети. За возлюбленной проследить с помощью парсера. Оно не лишне. Нет такой рыбки, чтобы воды не замутила.

Оставить комментарий

Популярные записи