Новости по тегу "LLaMA"
Подборка публикаций, содержащих тег "LLaMA". Актуальные темы и важные события.

Установил DeepSeek 1.5B на слабое железо, пока остывал мой борщ
DeepSeek 1.5B — маленький, но шустрый собрат больших языковых моделей. Работает локально, не требует железа на киловатт. Внутри — инструкция по...

Пишем (и используем) ИИ-агент на Gradle и Ollama
Справедливое желание автоматизировать всё подряд заставляет чуть иначе взглянуть на использование языковых моделей для написания кода.В этой...

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса
Ян Лекун, один из крёстных отцов современного ИИ, в своём твиттере резко критикует корпоративных исследователей ИИ, которые ведут проприетарные...

Почему GPT-чаты не крякают?
Эхо от кряканья лучше всего слышно в ситуации, когда утка и человек находятся рядом со стеной, хорошо отражающей звуки. [ Первомай ]

MLSecOps: защита машинного обучения в эпоху киберугроз
MLSecOps: защита машинного обучения в эпоху киберугрозНа днях исследователь Цзянь Чжоу сообщил о критической уязвимости (CVE-2025-32434),...

Как запустить локально LLM, если ее веса не помещаются в [видео]память
Некоторые люди предпочитают пользоваться не только облачными сервисами, но и запускать LLM у себя дома. Например, так можно запустить дообученные...

Больше 5090 — больше проблем? Тестируем связку из двух GPU NVIDIA
В предыдущей статье мы рассказывали, как тестировали сервер с одной RTX 5090. Теперь же мы решили установить в сервер две видеокарты RTX 5090. И...

Автодополнение кода своими руками (Docker Ollama + JetBrains IDE)
Я: хочу автодополнение кодаТакже я: у нас уже есть автодополнение кода домаАвтодополнение кода дома:Привет, Хабр! Я Саша, разработчик из Cloud4Y....

Dockerfile, только для LLM
При разработке агентов я часто сталкивался с необходимостью настройки и оптимизации моделей для дальнейшей передачи разработчикам. Помимо этого,...

Как обучить русскоязычную модель рассуждений — LRM?
Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии...