Як налаштувати GPU для роботи з моделями LLM

Налаштування GPU для роботи з великими мовними моделями (LLM) вимагає врахування багатьох факторів, таких як сумісність обладнання, встановлення драйверів, налаштування програмного забезпечення та оптимізація середовища. У цій статті ми розглянемо крок за кроком, як підготувати GPU для ефективної роботи з моделями LLM.

1. Вибір відповідного GPU

Перед початком налаштування важливо вибрати відповідне GPU. Моделі LLM вимагають багато пам’яті GPU (VRAM) і обчислювальної потужності. Найпопулярніші опції:

NVIDIA A100 – ідеальний для великих моделей з великою кількістю параметрів.
NVIDIA RTX 3090/4090 – добрий вибір для менших моделей і експериментів.
AMD MI200 – альтернатива для NVIDIA, але вимагає додаткових кроків у налаштуванні.

2. Встановлення драйверів GPU

Для карт NVIDIA

Завантаження драйверів:
- Відвідайте сторінку NVIDIA Driver Downloads.
- Виберіть модель графічної карти та операційну систему.

Встановлення драйверів:

sudo apt update
sudo apt install -y nvidia-driver-535
sudo reboot

Перевірка встановлення:
```
nvidia-smi
```

Для карт AMD

Завантаження драйверів:
- Відвідайте сторінку AMD Driver Support.
- Виберіть модель графічної карти та операційну систему.

Встановлення драйверів:

sudo apt update
sudo apt install -y rocm-opencl-runtime
sudo reboot

Перевірка встановлення:
```
rocminfo
```

3. Встановлення CUDA та cuDNN

Встановлення CUDA

Завантаження CUDA:
- Відвідайте сторінку CUDA Toolkit Archive.
- Виберіть відповідну версію для вашої системи.

Встановлення CUDA:

sudo dpkg -i cuda-repo-<distro>_<version>_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/3bf863cc.pub
sudo apt update
sudo apt install -y cuda

Додавання CUDA до змінної PATH:

echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

Встановлення cuDNN

Завантаження cuDNN:
- Зареєструйтеся на сторінці NVIDIA cuDNN.
- Завантажте відповідну версію для вашої системи.

Встановлення cuDNN:

sudo dpkg -i cudnn-local-repo-<distro>_<version>_amd64.deb
sudo apt update
sudo apt install -y libcudnn8

4. Налаштування програмного середовища

Встановлення Python та бібліотек

Встановлення Python:

sudo apt update
sudo apt install -y python3 python3-pip python3-venv

Створення віртуального середовища:
```
python3 -m venv llm-env
source llm-env/bin/activate
```

Встановлення бібліотек:

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118
pip install transformers datasets accelerate

5. Налаштування моделі LLM

Приклад налаштування моделі з бібліотекою Transformers

from transformers import AutoModelForCausalLM, AutoTokenizer

# Завантаження моделі та токенізатора
model_name = "bigscience/bloom"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")

# Підготовка входу
input_text = "Як налаштувати GPU для роботи з моделями LLM?"
inputs = tokenizer(input_text, return_tensors="pt").to("cuda")

# Генерація відповіді
outputs = model.generate(**inputs, max_length=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

6. Оптимізація продуктивності

Використання бібліотеки Accelerate

Бібліотека Accelerate дозволяє легко масштабувати моделі на кількох GPU.

from accelerate import Accelerator

accelerator = Accelerator()
model, optimizer = accelerator.prepare(model, optimizer)

Використання DeepSpeed

DeepSpeed – це інструмент для оптимізації великих моделей.

deepspeed --num_gpus=4 train.py

Підсумок

Налаштування GPU для роботи з моделями LLM вимагає врахування багатьох факторів, таких як вибір відповідного обладнання, встановлення драйверів, налаштування програмного забезпечення та оптимізація середовища. Дякуючи цій статті, ви повинні бути здатні підготувати своє GPU до ефективної роботи з великими мовними моделями.