История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

Доброго времени суток, «Хабр»!

В предыдущей части мы рассмотрели историю языковых моделей от робких шагов Маркова до долгой краткосрочной памяти. Сегодня мы продолжим, пройдемся по ключевым архитектурам последних лет и разберём, как модели научились интерпретировать контекст, предсказывать и даже спорить логически.

Пристегните токены — вход в зону трансформаций!

Читать далее

📌 Похожие новости

Нет изображения

Уникальный гаджет с двумя процессорами: как китайский стартап совместил телефон и нетбук в одном корпусе?

Уже три года я рассказываю в своём блоге о ремонте, моддинге и программировании для диковинных...

30.08.2025 14:05
Нет изображения

Как служба поддержки ЮMoney научилась общаться с пользователями из разных стран, не зная их языка

Привет, Хабр. Мы – Даша (инженер машинного обучения) и Наташа (ведущий аналитик в ЮMoney). В этой...

28.08.2025 13:45
Нет изображения

Кофе — мой type, музыка — мой out: строим NERвный-пайплайн на продуктовых запросах

Привет, Хабр! На связи команда Ad-Hoc аналитики X5 Tech. В этой статье расскажем, как мы научили...

28.08.2025 13:37
Нет изображения

В поисках алгоритма интеллекта — тезисы и комментарии. Часть 1

В августе выходит моя книга по эпистемологии и философии науки “Пролегомены ко всякому знанию”. В...

05.08.2025 16:08
Нет изображения

Путешествие одного промпта: Что на самом деле происходит под капотом у LLM?

Загадка работы LLM: что происходит, когда вы нажимаете Enter? Разбираем пошагово путь вашего...

29.07.2025 07:00
Нет изображения

15 примеров применения Natural Language Processing

Машинное обучение — это технология искусственного интеллекта, используемая для распознавания...

25.07.2025 11:00