Новости по тегу "RL"
Подборка публикаций, содержащих тег "RL". Актуальные темы и важные события.

Особенности подачи входных данных при фаззинге в режиме Persistent Mode на примере Libfuzzer + CURL
Фаззинг — один из самых эффективных инструментов для поиска ошибок и уязвимостей. Но если взять готовый движок вроде LibFuzzer и попробовать...

Безопасно делимся экраном на Hyprland
Мы все были в ситуации, когда нужно показать экран с множеством окон, и требуется несколько минут перед нажатием кнопки «Поделиться экраном»,...

[Перевод] Выбросить нельзя, переобозначить. Или как дообучать LLM даже на ошибках и без RLHF
Что если ошибочные ответы модели — не мусор, а ценный обучающий материал? В данной статье мы разберём метод Hindsight Instruction Relabeling...

103 Early Hints в NGINX: как выжать бесплатный прирост LCP без переписывания бэкенда
Привет, Хабр! Вы, наверно, привыкли к стандартным HTTP-ответам – 200, 301, 404, 500 и т. д. А тут подкрался новый статус 103 – Early Hints. Это...

Построение потока данных в облаке с использованием serverless сервисов
Привет!У бизнеса на практике часто встречается задача построить полноценную аналитику, используя данных из excel, csv файлов. Разнообразие...

Кейс: Как я, саунд-дизайнер без знаний кода, за 7 месяцев запустил SaaS-библиотеку звуков с помощью ИИ
Привет! Меня зовут Илья Шмяк, я саунд-дизайнер. Моя работа — создавать звук для игр, кино, брендов. Я не программист, но у меня была гипотеза:...

[Перевод] 1 минута интеграции методом Верле́
Метод Верле́ — один из самых элегантных и простых численных способов решать уравнения движения. Его можно встретить и в молекулярной физики, и в...

«Красный шелк» выйдет в китайский прокат в начале сентября
Российско-китайский ретро-детектив «Красный шелк» выйдет на экраны в Китае 6 сентября. Проект создан в рамках перекрестных годов культуры Китая и...

Немецкие нацисты в своём репертуаре: в зоопарке Лейпцига убили новорожденных тигрят..
В зоопарке Лейпцига усыпили новорожденных детёнышей краснокнижного амурского тигра. Тигрица Юшка отказалась выкармливать малышей.Взять...

[Перевод] Программа «Hello World» на машинном коде под DOS
Как-то раз я послушал следующее интересное выступление (по-немецки):https://media.ccc.de/v/ds24-394-linux-hello-world-nur-mit-einem-hex-editorВ...

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум
Аналитический центр red_mad_robot продолжает разбирать исследования японской лаборатории Sakana AI — в прошлый раз это была архитектура CTM,...

Column Level Security (CLS) в Apache Superset. Jinja + Handlebars
🔒 Column Level Security (CLS) в Apache Superset: защита данных на уровне столбцовУзнайте, как гибко ограничивать доступ к конфиденциальным данным...