Чудо 3

Какой компьютер нужен для нейросети: понятный гид по железу

28 марта 2026 г. · 10 мин чтения

Выбор железаКонфигурацииLLM

Вы решили запустить нейросеть у себя — в офисе или дома. Открыли статью, а там VRAM, TFLOPS, Q4_K_M и прочие заклинания. Эта статья объясняет всё то же самое, но человеческим языком.


Нейросеть — это программа. Ей нужен компьютер

Когда вы пользуетесь ChatGPT, нейросеть работает на серверах OpenAI. Вы отправляете текст туда, получаете ответ обратно. Это удобно, но ваши данные уходят на чужие серверы.

Локальная нейросеть — та же программа, только работает на вашем компьютере. Данные никуда не уходят. Но для этого компьютер должен быть достаточно мощным.

Главный вопрос: какой именно?


Единственная характеристика, которая решает всё

Не процессор. Не оперативная память. Не диск.

Видеопамять — вот что определяет, какую нейросеть вы сможете запустить.

Видеопамять (VRAM) — это память на видеокарте. Нейросеть при работе должна целиком загрузиться в эту память. Если не помещается — либо работает в 10–20 раз медленнее, либо не запускается вовсе.

Аналогия: VRAM — это рабочий стол. Нейросеть — стопка документов. Если стол маленький, а стопка большая — придётся постоянно бегать к шкафу за нужной страницей. Работать можно, но медленно.


Нейросети бывают разных размеров

Размер нейросети измеряется в миллиардах параметров (B). Чем больше параметров — тем умнее модель, но тем больше видеопамяти ей нужно.

Размер моделиЧто умеетСколько видеопамяти нужно
7–8BОтвечает на вопросы, пишет тексты, простой анализ документов5–6 ГБ
14BСложнее рассуждает, лучше работает с кодом8–9 ГБ
32BАудит договоров, глубокая аналитика, сложная логика18–20 ГБ
70BПрофессиональный уровень, сопоставимый с облачными моделями42–43 ГБ

Все цифры — для сжатых моделей (об этом ниже). Без сжатия нужно в 3 раза больше памяти.


Сжатие: как большая модель помещается в маленькую видеокарту

В полном виде модель на 70 миллиардов параметров занимает 140 ГБ. Ни одна офисная видеокарта столько не имеет.

Решение — сжатие (квантизация). Это как JPEG для фотографий: файл становится в 3 раза меньше, а разница в качестве почти незаметна.

Степень сжатияЧто происходитПотеря качества
Без сжатия (FP16)Полный размер, максимальное качество0%
Среднее (Q8)Размер уменьшается вдвоеменее 1%
Стандартное (Q4_K_M)Размер уменьшается в 3 разаоколо 5%

Q4_K_M — стандарт для локального запуска. При сжатии 70B-модель уменьшается со 140 ГБ до 43 ГБ, а 7B — с 14 ГБ до 5 ГБ. Потеря качества в 5% на практике незаметна: модель так же отвечает на вопросы, анализирует документы, пишет тексты.


Ещё один расход памяти, о котором забывают

Нейросеть запоминает контекст разговора — всё, что вы ей сказали в текущем диалоге. Эта «краткосрочная память» тоже занимает видеопамять, и тем больше, чем длиннее разговор.

Для модели 7B каждая тысяча слов в диалоге — примерно +0,1 ГБ. Звучит немного, но при работе с большими документами (10–30 страниц) набегает 2–4 ГБ сверх самой модели.

Совет: при выборе видеокарты закладывайте запас в 3–5 ГБ сверх размера модели.


Четыре направления: от тихого офисного до серверного

Apple Silicon — от 265 200 ₽

Чипы Apple M4 / M4 Pro / M4 Max с unified memory 16–128 ГБ. Тихие, компактные, ставятся на стол. Потребляют от 20 Вт.

Что можно запустить:

Для кого: малый офис на 3–5 человек, работа без шума.

Компактные Windows и DGX — от 328 800 ₽

AMD Ryzen AI Max+ с 128 ГБ unified memory или NVIDIA DGX Spark. Компактный корпус, но серьёзная мощность.

Что можно запустить:

Для кого: IT-отделы, разработчики, аналитики.

GPU-станции — от 399 167 ₽

Дискретные видеокарты NVIDIA RTX 5060 Ti, 5080, 5090. От 16 до 64 ГБ видеопамяти. Формат Mid-Tower — помещаются под стол или в серверную.

Что можно запустить:

Для кого: юридические фирмы, банки, команды 5–20 человек.

ЛЕВИАФАН — от 3 500 000 ₽

4× RTX 5090 = 128 ГБ видеопамяти. Threadripper PRO, 256 ГБ RAM. Запускает модель на 405B параметров целиком на GPU.

Для кого: крупные компании, R&D-центры, команды 20–50+ человек.


Можно ли без видеокарты?

Да, но медленно. Нейросеть может работать на обычном процессоре — просто в 5–15 раз медленнее.

Где работает модельСкорость (модель 7B)
На процессоре (CPU)8–18 слов/сек
На видеокарте (GPU)27–150 слов/сек

Процессор подходит для фоновых задач — когда не нужен мгновенный ответ. Для живого диалога или работы нескольких человек одновременно нужна видеокарта.


Частые ошибки

Выбирать видеокарту по игровым обзорам. Для нейросетей важен объём памяти, а не скорость в играх. Карта с 16 ГБ памяти и средней скоростью лучше, чем карта с 12 ГБ и высокой.

Пытаться запустить большую модель на маленькой карте. Модель 32B занимает 19 ГБ — не поместится в видеокарту с 12 ГБ. Проверяйте таблицу выше перед покупкой.

Покупать AMD вместо NVIDIA. Программное обеспечение для нейросетей в 2026 году работает стабильно только на видеокартах NVIDIA и на компьютерах Apple. У AMD с этим пока проблемы.

Экономить на диске. Модель 14B весит 8–9 ГБ. С обычного жёсткого диска она загружается 3–5 минут, с SSD — 15 секунд.

Забывать про оперативную память. Минимум 32 ГБ. Если планируете запускать большие модели с частичной загрузкой в оперативную память — 64 ГБ.


Главное


Какую конфигурацию выбрать

Не хотите разбираться в комплектующих — мы уже всё подобрали и настроили.

ЗадачаКонфигурация Чудо 3Цена с предустановкой
Тихий офисный ассистент, 7–8BM4 Entryот 265 200 ₽
RAG по документам, 14BMac Studio 64GBот 547 800 ₽
Аналитика, 30–34B2× RTX 5060 Tiот 399 167 ₽
Корпоративный уровень, 70B2× RTX 5090от 1 357 305 ₽
R&D, 405BЛЕВИАФАНот 3 500 000 ₽

Все 16 конфигураций — в каталоге. Скрипт для своего железа — установочный скрипт за 3 000 ₽.