Эта книга рассказывает о моделях большого языка (LLM), которые значительно изменили способы обработки и генерации информации машинами. Она помогает понять, как эти модели развивались, начиная с основ машинного обучения, и как они влияют на белые воротнички в профессиях, аналогично тому, как когда-то персональные компьютеры изменили рынок труда.
Книга объясняет внутреннюю структуру языковых моделей, начиная с простых методов на основе подсчета и заканчивая современными архитектурами, такими как трансформеры. Автор подробно объясняет математические основы, сопровождая теоретические концепции рабочими примерами кода на Python.

Основные моменты книги:
- Понимание математических основ с интуитивными объяснениями.
- Полные реализации на Python с использованием PyTorch.
- Постепенное изучение от простых моделей до трансформеров.
- Ноутбуки Jupyter для каждого раздела.
- Методы эффективной настройки моделей и создания запросов.
Для кого эта книга? Книга предназначена для лидов, разработчиков программного обеспечения, специалистов по данным и инженеров машинного обучения, которым важно как теоретическое понимание, так и практические навыки работы с языковыми моделями.
Источник: ru.scribd.com