Умный парсинг с аналитикой и визуализацией.
Решение сложных бизнес-задач по поиску, сбору и анализу данных из открытых источников и документов
Поиск незаконного контента, нарушений патентов, прав на интеллектуальную собственность.
Мониторинг динамики и анализ рынков, цен. Парсинг маркетплейсов. Конкурентный анализ.
Бизнес-решения по сбору и анализу данных
Автоматизация процессов поиска, сбора и анализа текстовых данных
Классификация и анализ неструктурированных данных, сайтов
Поиск смыслов в анализируемых текстовых данных
Набор обученных нейросетевых моделей и алгоритмов для типовых задач
Набор готовых парсеров и коннекторов к источникам данных
Интеллектуальная автоматизация
Актуальные отчёты в удобном формате
Мы предлагаем услуги по поиску, сбору и анализу данных из интернета, корпоративных источников и документов для формирования информационной базы об объекте поиска.
Как эксперты в области поиска и анализа данных, мы располагаем солидным портфелем из более, чем 50 успешных решений для крупных компаний, в числе которых банки, органы власти и управления, известные производственные и ИТ-компании.
Источники парсинга











Технолологии: Peraspera Data Hunter
Платформа для автоматизации и управления поиском, сбором и анализом данных в интернете и корпоративных источниках, основные функции которой:
Поиск и сбор данных
Интеграция данных
Потоковая обработка данных
Хранение данных
Визуальная аналитика
Реестровая запись №18120 от 29.06.2023 в Реестре российского ПО.
Свидетельство о госрегистрации №2022682815 от 28.11.2022 в Реестре программ для ЭВМ.
Страница платформы: eclsoft.ru/products/data-hunter
Производительность
Количество запросов к 1 ресурсу: сайты, домен вместе с поддоменами: 2 запроса в секунду
Количество запросов к 1 ресурсу: анонимизация и обход блокировок: 1 запрос за 5 секунд
Количество запросов к социальным сетям: 5 запросов в секунду
Количество запросов за 24 часа: 12 миллионов
Количество загруженных страниц за 24 часа: 8 миллионов
Объём загруженных данных за 24 часа / за 1 секунду: 1.071 Тб / 12.3 Мб
Одновременное количество запрашиваемых ресурсов: 80
Занимаемая полоса канала: 200 Мбит/сек, в пике 400
Показатели могут масштабироваться в зависимости от потребностей и целей проекта
Кейсы
Обеспечение безопасности
Федеральные регуляторы
Умный парсинг: Федеральные регуляторы
Задачи |
Результаты |
Противодействие нелегальной деятельности на финансовом и страховом рынке |
● Выявлено более 10500 субъектов за 2022 и 2023 гг |
Обеспечение контроля исполнения Федерального Закона о блокировке незаконного контента |
● Выявлено более 500 запрещенных ресурсов |
Прогнозирование вероятности наступления нестабильного состояния банка |
● Достигнута точность прогнозирования финансового состояния банка от 70% до 90% |
Мониторинг рынка криптовалют |
● Выявлены первоисточники новостей, сформированы цепочки изменений трактовки новостей |
Обеспечение безопасности
Финансовый сектор
Умный парсинг: Финансовый сектор
Задачи |
Результаты |
Поиск аккаунтов и цифровых следов должников в соцсетях |
● Выявлено 4200 должников в соцсетях VK и Одноклассники |
Формирование социально-экономического портрета должников |
Получены следующие данные о должниках: |
Категоризация должников с целью оценки перспективности портфеля должников |
● Сформирована модель категоризации должников по группам: «объём долга» и «сложность поиска» |
Мониторинг СМИ и соцсетей
Социальный сектор
Умный парсинг: Социальный сектор
Задачи |
Результаты |
Анализ проводимых активностей |
● Оказана существенная помощь по пресечению деятельности социальной «группы смерти» «Синий кит»
● Снижена эффективность деятельности социальных групп, направленных на подростковый экстремизм и деструктивное поведение (борьба с течением “АУЕ”) ● Приняты меры для борьбы с подрывом государственных устоев и репутации образов национальных героев |
● Выявление лидеров мнений |
|
Анализ и прогноз успешности мероприятий |
|
Консолидация тематической информации – облако слов, ТОП обсуждений и просмотров |
|
Оценка тональности публикаций и комментариев |
Управление отраслью, городом, регионом, компанией
Госсектор: цифровой двойник территории
Умный парсинг: Государственный сектор
Задачи |
Результаты |
Управление недвижимостью |
● Уменьшено число учреждений в 3.5 раза |
Нецелевое использование муниципальной недвижимости |
● Выявлено 15% объектов недвижимости нецелевого использования |
Мониторинг финансовой активности |
● Достигнуты финансовые KPI за 2 года |
● Мониторинг благоустройства и комфорта |
● Оптимизация объектов исследования |
Управление производством и корзиной потребителя
Товары широкого потребления
Умный парсинг: Товары широкого потребления
Задачи |
Результаты |
Масштабирование продаж: выявление потенциальных рынков сбыта |
● Обработано ~ 1 500 000 торговых точек по России и Белоруссии |
Расчет потенциала торговых точек для увеличения продаж и расширения ассортимента |
|
Увеличение розничных продаж за счет учета динамики изменения во времени платежеспособного спроса потребителя |
● Бесконтактная социология
● Мониторинг качества ведения образовательной деятельности
● Экспресс скоринг качества ведения образовательной деятельности (ССУЗ)
Кадры и образование
● Мониторинг, анализ, прогноз мощностей теплогенерации
● Анализ эффективности объектов муниципальной недвижимости с поиском аномалий и зависимостей
Энергетика
● Анализ производственной устойчивости заёмщиков – юрлиц
● Анализ эффективности мероприятий по выделению субсидий и предоставлению налоговых льгот
Сельское хохяйство
Как мы работаем
Этап 1: Консалтинг
Выявление и формализация тематических потребностей, определение временных, функциональных границ и объёмов проекта
Выявление и исследование источников, содержащих тематические данные, создание краулера — поискового робота
Исследование семантики: итерационное изменение слов и словарных фраз до получения необходимого результата
Формирование и исследование аналитических гипотез, как набора единичных и взаимоувязанных алгоритмов обработки данных
Настройка инструментов поиска, сбора, хранения, обработки и визуализации данных в целях подготовки сервиса к эксплуатации
Обучение сотрудников Заказчика в соответствии с ролевым составом платформы Peraspera Data Hunter
Этап 2: Эксплуатация
Техническая поддержка, исправление ошибок, расширение функциональности платформы Peraspera Data Hunter
Адаптация краулеров, алгоритмов обработки, средств обхода блокировок под динамические изменения в источниках данных
Законность парсинга
В соответствии с действующим законодательством РФ разрешено всё, что не запрещено Законом. Парсинг сайтов является законным, если не происходит нарушений запретов, установленных законодательством РФ.
Организация вправе осуществлять автоматизированный сбор информации в открытом доступе на сайтах в сети интернет при соблюдении условий:
Информация находится в открытом доступе и не защищается законодательством об авторских и смежных правах.
Автоматизированный сбор осуществляется законными способами.
Автоматизированный сбор информации не приводит к нарушению работы сайтов.
Автоматизированный сбор информации не приводит к ограничению конкуренции.