The Hundred-Page Language Models Book

17.02.2025

Эта книга рассказывает о моделях большого языка (LLM), которые значительно изменили способы обработки и генерации информации машинами. Она помогает понять, как эти модели развивались, начиная с основ машинного обучения, и как они влияют на белые воротнички в профессиях, аналогично тому, как когда-то персональные компьютеры изменили рынок труда.

Книга объясняет внутреннюю структуру языковых моделей, начиная с простых методов на основе подсчета и заканчивая современными архитектурами, такими как трансформеры. Автор подробно объясняет математические основы, сопровождая теоретические концепции рабочими примерами кода на Python.

Основные моменты книги:

Понимание математических основ с интуитивными объяснениями.
Полные реализации на Python с использованием PyTorch.
Постепенное изучение от простых моделей до трансформеров.
Ноутбуки Jupyter для каждого раздела.
Методы эффективной настройки моделей и создания запросов.

Для кого эта книга? Книга предназначена для лидов, разработчиков программного обеспечения, специалистов по данным и инженеров машинного обучения, которым важно как теоретическое понимание, так и практические навыки работы с языковыми моделями.

Источник: ru.scribd.com