Новости по тегу "RL"
Подборка публикаций, содержащих тег "RL". Актуальные темы и важные события.
Ретро-детектив «Красный шелк» бьет рекорды в Китае: прокат продлен на месяц
Российско-китайский художественный фильм «Красный шелк» демонстрирует исключительные результаты в кинопрокате Китайской Народной Республики,...
Особенности подачи входных данных при фаззинге в режиме Persistent Mode на примере Libfuzzer + CURL
Фаззинг — один из самых эффективных инструментов для поиска ошибок и уязвимостей. Но если взять готовый движок вроде LibFuzzer и попробовать...
Безопасно делимся экраном на Hyprland
Мы все были в ситуации, когда нужно показать экран с множеством окон, и требуется несколько минут перед нажатием кнопки «Поделиться экраном»,...
[Перевод] Выбросить нельзя, переобозначить. Или как дообучать LLM даже на ошибках и без RLHF
Что если ошибочные ответы модели — не мусор, а ценный обучающий материал? В данной статье мы разберём метод Hindsight Instruction Relabeling...
103 Early Hints в NGINX: как выжать бесплатный прирост LCP без переписывания бэкенда
Привет, Хабр! Вы, наверно, привыкли к стандартным HTTP-ответам – 200, 301, 404, 500 и т. д. А тут подкрался новый статус 103 – Early Hints. Это...
Построение потока данных в облаке с использованием serverless сервисов
Привет!У бизнеса на практике часто встречается задача построить полноценную аналитику, используя данных из excel, csv файлов. Разнообразие...
Кейс: Как я, саунд-дизайнер без знаний кода, за 7 месяцев запустил SaaS-библиотеку звуков с помощью ИИ
Привет! Меня зовут Илья Шмяк, я саунд-дизайнер. Моя работа — создавать звук для игр, кино, брендов. Я не программист, но у меня была гипотеза:...
[Перевод] 1 минута интеграции методом Верле́
Метод Верле́ — один из самых элегантных и простых численных способов решать уравнения движения. Его можно встретить и в молекулярной физики, и в...
«Красный шелк» выйдет в китайский прокат в начале сентября
Российско-китайский ретро-детектив «Красный шелк» выйдет на экраны в Китае 6 сентября. Проект создан в рамках перекрестных годов культуры Китая и...
Немецкие нацисты в своём репертуаре: в зоопарке Лейпцига убили новорожденных тигрят..
В зоопарке Лейпцига усыпили новорожденных детёнышей краснокнижного амурского тигра. Тигрица Юшка отказалась выкармливать малышей.Взять...
[Перевод] Программа «Hello World» на машинном коде под DOS
Как-то раз я послушал следующее интересное выступление (по-немецки):https://media.ccc.de/v/ds24-394-linux-hello-world-nur-mit-einem-hex-editorВ...
Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум
Аналитический центр red_mad_robot продолжает разбирать исследования японской лаборатории Sakana AI — в прошлый раз это была архитектура CTM,...