Новости по тегу "парсинг"
Подборка публикаций, содержащих тег "парсинг". Актуальные темы и важные события.

Почему простой парсер не всегда решает задачу: мой опыт интеграции спортивных API
В рамках собственной системы спортивной аналитики я хотел получить real-time доступ к данным о движении коэффициентов — в частности, с платформы...

Парсинг российских СМИ
В эпоху больших языковых моделей полноценный сбор информации с сайтов все еще не самый очевидный сценарий, требующий учета многих мелких деталей,...

Прокси для парсинга: от теории к практике — архитектуры, алгоритмы, подводные камни
При масштабном веб‑парсинге прокси — это не просто «много дополнительных IP адресов»: это ключевой компонент, позволяющий обходить защиты сайтов и...

Запускаем личный АИ-инфоконвейер: как я строю систему смыслового мониторинга с YAML и GPT
Мне приходится тратить много времени на мониторинг арбитража, госзакупок и других документов: PDF на сотни страниц, новости с «водой», RSS при...

Использование ffmpeg в n8n
Обычно, когда речь заходит про автоматизацию с n8n, мы представляем что-то простое: формы, письма, таблички, API-запросы. И все довольно удобно —...

200 000+ снимков мусора: что мы узнали о датасетах
В нашей работе хватает безумных задач. Мы создали первого в России цифрового PR-менеджера, разрабатывали виртуальную примерочную и делали много...

Как мы научили нейросеть узнавать 10 000 лошадей «в лицо» и чуть не сошли с ума
В нашей работе хватает безумных задач. Мы собирали датасеты с уличными драками, где сами вживались в роль дебоширов перед камерами, и делали много...

Парсим YouTube на Python как для взрослых: отказоустойчивый скрипт с ротацией ключей
Путь разработчика парсеров тернист и сложен, сперва ты пытаешься обойти официальные ограничения, потому что так проще, так нету квот и разных...

Сверхспособность LLM в понимании документа, сконвертированного в текст с ошибками — или почему наш RAG работает
Недавно я столкнулся с интересным поведением языковой модели, которое меня по-настоящему удивило, и хочу поделиться этим наблюдением с...

[Перевод] Прогрессивный JSON
Вы знаете, что такое прогрессивный JPEG? Можете почитать хорошее объяснение. Идея заключается в том, что вместо загрузки изображения сверху вниз...

Разработка Telegram-бота для мониторинга цен на Авито: пошаговое руководство
Привет, Хабр! Сегодня я расскажу о том, как я разработал Telegram-бота для мониторинга цен на Авито. Бот умеет отслеживать изменения цен в...

Обратная сторона Babel: как микроскопические языки помогают в изучении больших
В этой статье рассказывается, как крошечные, экспериментальные языки программирования, размером порой меньше 100 строк, могут неожиданным образом...