Telegram

Является ли парсинг/скраппинг необходимым злом? Необходим ли юридический запрет на данное действие?...

Изображение из Telegram
Является ли парсинг/скраппинг необходимым злом? Необходим ли юридический запрет на данное действие? В большинстве случаев данные, которые публикуются компаниями на сайтах, являются публичными. Однако у каждого сайта есть лицензия на данные, договор на их разглашение, а также правила обработки персональных данных. Кроме того, в соответствии с законодательством есть законы, например, статья 1229 ГК РФ.

Представим, что какой-то сервис не предоставляет официальный интерфейс API и сам старается защититься от автоматического парсинга данных, особенно если это государственное учреждение. Получается некая бесконечная борьба. Можно подумать, что, раз они защищаются от спама, то они стараются убрать лишнюю нагрузку на серверы.

На мой взгляд, хороший компромисс - это публикация наборов данных (датасетов). Например, так, как это делает ФНС с ФИАСом (ГАР). Это позволяет снизить нагрузку на серверные методы, которые работают с БД, особенно если там присутствует фильтрация и сортировка. Бизнес может обрабатывать данные непосредственно у себя и уже работать с ними.

Однако реалии в стране идут по другому пути...
[Подробнее в статье](https://tochno.st/materials/otkrytykh-dannykh-v-rossii-stanovitsya-vse-mensheda)