NLP Course documentation

Введение

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Введение

Добро пожаловать на курс от Hugging Face! Это введение поможет настроить рабочее окружение. Если вы только начинаете курс, мы рекомендуем сначала заглянуть в Главу 1, затем вернуться и настроить среду, чтобы попробовать запустить код самостоятельно.

Все библиотеки, которые мы будем использовать в этом курсе, доступны в качестве Python-пакетов. В этом уроке мы покажем, как установить окружение и необходимые библиотеки.

Мы рассмотрим два пути настройки окружения: с использованием Google Colab и виртуального окружения Python. Можно выбрать любой из вариантов, исходя из собственных предпочтений. Если вы начинающий, то лучше начать с Google Colab.

Если вы пользуетесь операционной системой Windows, то мы рекомендуем сразу использовать Google Colab, т.к. мы не будем рассматривать эту операционную систему в качестве платформы для работы. Если вы используете Linux или MacOS, то можно воспользоваться любым из описанных здесь подходов.

Для прохождения курса вам понадобится аккаунт на Hugging Face, бесплатно можно зарегистрироваться здесь: создать учетную запись.

Использование Colab

Использование Colab – самый простой вариант: просто загрузите блокнот в браузере и приступайте к работе!

Если вы не знакомы с Google Colab, то мы рекомендуем начать с изучения Введения. Colab позволяет использовать более мощную аппаратную базу (GPU - видеокарты, TPU - тензорные процессоры) и он бесплатен для небольших нагрузок.

Как только вы освоитесь в Colab, создайте новый блокнот:

An empty colab notebook

Следующий шаг - установка библиотек, которые мы будем использовать в курсе. В качестве менеджера пакетов будет использоваться pip. Для запуска системной команды в ячейке блокнота необходимо в самом начале дописать символ !. Библиотеку 🤗 Transformers можно установить так:

!pip install transformers

Вы можете удостовериться, что библиотека установилась, просто сделав ее импорт:

import transformers
A gif showing the result of the two commands above: installation and import

Это установка самой базовой версии 🤗 Transformers. В частности, никаких библиотек машинного обучения (например, PyTorch или TensorFloat) установлено не будет. Так как мы будем использовать множество различных возможностей библиотеки 🤗 Transformers, мы рекомендуем установить версию для разработчиков, в состав которой сразу входят все необходимые зависимости:

!pip install transformers[sentencepiece]

Это займет определенное время, но сразу после установки вы будете готовы двигаться дальше!

Использование виртуального окружения Python

Если вы хотите использовать виртуальное окружение Python, сначала необходимо установить Python. Мы рекомендуем использовать эти инструкции для установки.

После установки Python у вас появится возможность запускать Python-команды в терминале. Прежде чем переходить дальше, запустите в терминале команду python --version. В результате должна быть распечатана версия Python, доступная для работы.

Когда вы запускаете Python-команду в терминале (например, python --version), эту команду обрабатывает основной Python-интерпретатор вашей системы. Мы не рекомендуем устанавливать в его окружение дополнительные библиотеки, лучше для каждого проекта создавать отдельное виртуальное окружение. Каждый проект будет обладать собственными зависимостями и пакетами, если проекты будут в разных окружениях, то вам меньше придется следить за совместимостью библиотек.

В Python такой подход можно реализовать с помощью разных библиотек, а подробнее об окружениях можно почитать тут. Каждое окружение будет содержать в себе необходимую версию языка и набор библиотек. Все эти окружения изолированы друг от друга. Среди самых популярных инструментов для работы с виртуальными окружениями можно отметить venv.

Для начала создайте папку в домашней директории, в которой будут храниться ваши файлы курса (ее можно назвать произвольным именем, например, transformers-course):

mkdir ~/transformers-course
cd ~/transformers-course

Находясь в директории transformers-course, создайте виртуальное окружение с использованием venv:

python -m venv .env

Теперь в папке должна появиться директория с именем .env:

ls -a
.      ..    .env

Переключаться между окружениями можно с помощью команд activate и deactivate:

# Активировать виртуальное окружение
source .env/bin/activate

# Деактивировать окружение
source .env/bin/deactivate

Вы можете убедиться, что окружение активировано с помощью команды which python: если ее результат указывает на виртуальное окружение, значит, вы успешно активировали его!

which python
/home/<user>/transformers-course/.env/bin/python

Установка зависимостей

Как и в предыдущем разделе, посвященном Google Colab, вам необходимо установить библиотеку 🤗 Transformers(желательно, версию для разработчиков) с помощью менеджера pip:

pip install "transformers[sentencepiece]"

Теперь все установлено! Двигаемся дальше!