Новости по тегу "парсинг"

Подборка публикаций, содержащих тег "парсинг". Актуальные темы и важные события.

Нет изображения

Почему простой парсер не всегда решает задачу: мой опыт интеграции спортивных API

В рамках собственной системы спортивной аналитики я хотел получить real-time доступ к данным о движении коэффициентов — в частности, с платформы...

23.07.2025 12:36
5
Нет изображения

Парсинг российских СМИ

В эпоху больших языковых моделей полноценный сбор информации с сайтов все еще не самый очевидный сценарий, требующий учета многих мелких деталей,...

23.07.2025 06:16
3
Нет изображения

Прокси для парсинга: от теории к практике — архитектуры, алгоритмы, подводные камни

При масштабном веб‑парсинге прокси — это не просто «много дополнительных IP адресов»: это ключевой компонент, позволяющий обходить защиты сайтов и...

22.07.2025 12:37
3
Нет изображения

Запускаем личный АИ-инфоконвейер: как я строю систему смыслового мониторинга с YAML и GPT

Мне приходится тратить много времени на мониторинг арбитража, госзакупок и других документов: PDF на сотни страниц, новости с «водой», RSS при...

15.07.2025 12:16
8
Нет изображения

Использование ffmpeg в n8n

Обычно, когда речь заходит про автоматизацию с n8n, мы представляем что-то простое: формы, письма, таблички, API-запросы. И все довольно удобно —...

11.07.2025 13:00
6
Нет изображения

200 000+ снимков мусора: что мы узнали о датасетах

В нашей работе хватает безумных задач. Мы создали первого в России цифрового PR-менеджера, разрабатывали виртуальную примерочную и делали много...

03.07.2025 13:38
11
Нет изображения

Как мы научили нейросеть узнавать 10 000 лошадей «в лицо» и чуть не сошли с ума

В нашей работе хватает безумных задач. Мы собирали датасеты с уличными драками, где сами вживались в роль дебоширов перед камерами, и делали много...

02.07.2025 14:18
13
Нет изображения

Парсим YouTube на Python как для взрослых: отказоустойчивый скрипт с ротацией ключей

Путь разработчика парсеров тернист и сложен, сперва ты пытаешься обойти официальные ограничения, потому что так проще, так нету квот и разных...

06.06.2025 05:56
14
Нет изображения

Сверхспособность LLM в понимании документа, сконвертированного в текст с ошибками — или почему наш RAG работает

Недавно я столкнулся с интересным поведением языковой модели, которое меня по-настоящему удивило, и хочу поделиться этим наблюдением с...

05.06.2025 09:01
20
Нет изображения

[Перевод] Прогрессивный JSON

Вы знаете, что такое прогрессивный JPEG? Можете почитать хорошее объяснение. Идея заключается в том, что вместо загрузки изображения сверху вниз...

04.06.2025 13:39
21
Нет изображения

Разработка Telegram-бота для мониторинга цен на Авито: пошаговое руководство

Привет, Хабр! Сегодня я расскажу о том, как я разработал Telegram-бота для мониторинга цен на Авито. Бот умеет отслеживать изменения цен в...

26.05.2025 10:25
19
Нет изображения

Обратная сторона Babel: как микроскопические языки помогают в изучении больших

В этой статье рассказывается, как крошечные, экспериментальные языки программирования, размером порой меньше 100 строк, могут неожиданным образом...

19.05.2025 18:15
18