The Hundred-Page Language Models Book

Эта книга рассказывает о моделях большого языка (LLM), которые значительно изменили способы обработки и генерации информации машинами. Она помогает понять, как эти модели развивались, начиная с основ машинного обучения, и как они влияют на белые воротнички в профессиях, аналогично тому, как когда-то персональные компьютеры изменили рынок труда.

Книга объясняет внутреннюю структуру языковых моделей, начиная с простых методов на основе подсчета и заканчивая современными архитектурами, такими как трансформеры. Автор подробно объясняет математические основы, сопровождая теоретические концепции рабочими примерами кода на Python.

Основные моменты книги:

  • Понимание математических основ с интуитивными объяснениями.
  • Полные реализации на Python с использованием PyTorch.
  • Постепенное изучение от простых моделей до трансформеров.
  • Ноутбуки Jupyter для каждого раздела.
  • Методы эффективной настройки моделей и создания запросов.

Для кого эта книга? Книга предназначена для лидов, разработчиков программного обеспечения, специалистов по данным и инженеров машинного обучения, которым важно как теоретическое понимание, так и практические навыки работы с языковыми моделями.

Источник: ru.scribd.com