В последние несколько лет технология машинного обучения у всех на слуху. Впрочем, интерес к ней стал несколько ослабевать… пока китайские разработчики не выложили в свободный доступ свою нейросеть DeepSeek. После этого в крупнейших IT-компаниях начался сущий кошмар, который стоил их акционерам миллиарды долларов. Я решил не отставать от трендов и протестировал возможности DeepSeek в типичных офисных задачах. Теперь делюсь с вами всеми выводами и наблюдениями.
Оглавление:
1. В чем феномен нейросети DeepSeek
2. Как начать пользоваться DeepSeek на ПК и телефоне
3. Как продуктивно работать в приложении DeepSeek
4. Чем отличается от своих западных конкурентов
5. Что в итоге: плюсы и минусы
В чем феномен нейросети DeepSeek
У значительной части людей опыт общения с нейросетями сводится к «нашел прикольный сервис → ввел текстовый запрос → посмеялся над проклятой картинкой».
Более продвинутые пользователи научились составлять промты и овладели базовыми навыками графического дизайна. В результате они получили бесконечный и дешевый источник весьма качественных иллюстраций. Также ИИ показывает неплохие результаты при генерации текстов, клипов, музыкальных треков, программного кода.
Однако мало кто знает, что стоит за этой простотой для конечного пользователя.
Если опустить технические подробности, нейронная сеть создает контент по аналогии. На этапе обучения ей «скармливают» тот же тип данных, с которым придется работать в дальнейшем: изображения, тексты, музыку, видео и т. д. ИИ анализирует эту информацию, разбивает ее на фрагменты и распределяет по характерным признакам.
Когда поступает запрос, нейронка компонует подходящие кусочки из своей базы данных и выдает в качестве результата. Соответственно, чем больше информации было загружено в ходе обучения ИИ, тем качественнее и точнее результаты генерации. И тут мы подходим к первому вопросу: где взять исходные сведения для обучения?
Компании, которые занимаются технологией машинного обучения, стараются не афишировать, какая информация используется для первичной настройки и откуда она берется. Однако, если прочитать лицензионные соглашения, то во многих из них упоминается: разработчики вправе собирать, анализировать и передавать партнерам данные, которые связаны с эксплуатацией соответствующего софта или железа.
Эксперты отмечают: пользовательская информация стала новым ресурсом, а цена на нее даже выше, чем на полезные ископаемые. Следовательно, хорошее образование для ИИ — это очень дорого.
Любая нейросеть — это крайне сложная математическая модель. Над ее созданием трудятся лучшие специалисты. Чтобы гениальный математик или программист занимался именно нейронками, а не ушел в доставку еды, его нужно замотивировать: комфортным рабочим местом, высокой зарплатой, разными бонусами. Поэтому штат хороших специалистов — это очень дорого.
Наконец, в процессе работы матмодели выполняется огромный объем вычислений. Разворачивать нейросеть на старом ноутбуке не имеет смысла. Даже от компьютера, собранного из топовых комплектующих, будет мало толку. В качестве примера можно глянуть статью Tom’s Hardware. Авторы протестировали потребительские видеокарты при генерации картинок в Stable Diffusion. Лидер рейтинга — NVIDIA RTX 4090 (около 250 000 руб.), смог выдавать за минуту по 75 картинок с разрешением 512х512 пикселей. При увеличении размера до 768х768 «производительность» упала до почти 30 картинок. Можно предположить, что при соответствующей настройке единственную картинку в 720р придется ждать около минуты.
В облачных сервисах и крупных офисах запросы на генерацию поступают сразу от нескольких пользователей. Однако они не готовы тратить много времени на ожидание. На помощь приходят производители железа. Они предлагают специальное оборудование, которое оптимизировано для работы с ИИ. Например, у NVIDIA это графический ускоритель H100 для серверов и дата-центров. У покупки или аренды специализированного оснащения всего один недостаток — это очень дорого.
До недавнего времени рынок пришел в некое равновесное состояние. Разработчики и производители радовались доходам от подписок и заказов от корпоративных клиентов. Пользователи постепенно приспосабливались к новой реальности. Всё изменилось, когда появилась компания DeepSeek — создатель одноименной нейросети.
Как оказалось, продвинутые технологии способны выпускать не только гигантские корпорации. Формально DeepSeek — это стартап, основанный в середине 2023 года. Фактически у компании чуть более долгая история.
В начале 2016 года появился другой стартап — High-Flyer. Он добился успеха при адаптации машинного обучения для биржевой торговли. Далее было решено, что исследовательской работой займется вновь образованная DeepSeek, тогда как финансовые операции и торговля на бирже останется за High-Flyer.
Стандартная модель для стартапов — предложить интересную концепцию или прототип технологии. Затем получить финансирование и потихоньку доделывать финальный продукт, который выйдет когда-нибудь (или не выйдет никогда).
DeepSeek поступила совершенно иначе. Она быстро выпустила на рынок полностью работоспособное и готовое решение.
На этом сюрпризы не закончились. ИИ от китайского стартапа оптимизирован гораздо лучше конкурентов. При обработке данных она производит существенно меньший объем вычислений, чем конкурент. Следовательно, сокращаются расходы на закупку оборудования, аренду помещений, оплату электричества и труда обслуживающего персонала. Более того, исходный код модели открытый и находится в свободном доступе. Рынок сделал закономерный вывод: не обязательно переплачивать за современную технологию, и акции американских компаний полетели вниз.
Что умеет DeepSeek
Китайская нейросеть — это чат-бот, или AI-ассистент. Она генерирует ответы на письменные вопросы и поддерживает диалог. На первый взгляд, отличия от американского аналога ChatGPT минимальные.
Интерфейс онлайн-версии на английском, но система поддерживает русский. Перехитрить машину и заставить делать что-то еще, кроме текстов, не получится. Генерация картинок пока доступна только в десктопной и самостоятельно модифицированной сборке нейросети.
Опция поиска в интернете доступна не всегда. Временами ИИ жалуется на технические проблемы и сообщает, что сервис временно недоступен.
Другая функция — извлечение текста из изображений. Изначально может показаться, что это продвинутый аналог OCR — оптического распознавания символов. В действительности, если не указать никакой запрос, а просто прикрепить графический файл (всего можно отправлять до 50 файлов по 100 МБ каждый), нейронка выполнит детальный анализ содержания. Причем по умолчанию ответ будет относительно коротким и на английском. Если же активировать модель R1, ИИ сделает пересказ и напишет развернутую статью на русском.
Я конкретизировал задачу и попросил извлечь текст. ИИ сначала объяснил, чего я от него хочу. Затем — все-таки предоставил ожидаемый результат.
Заметны некоторые неточности. Алгоритм проигнорировал знаки ударения в оригинале. Возможно, решил, что это пятна на бумаге. Также неправильно распознал отдельные слова: «кнёзи» вместо «князи» или «отдайгивал» вместо «отдвигивал». Впрочем, по предыдущему опыту, специализированный софт для OCR справляется гораздо хуже. Я намеренно выбрал «специфическую» книгу и фотографировал страницу не слишком аккуратно. Подозреваю, с исходником попроще проблем у нейросети будет еще меньше.
Можно придумать и другие сценарии. Например, решение математических задач. С этим ИИ тоже справился.
В некоторых ответах попадаются странные приписки, похожие на теги разметки или фрагменты кода. Поэтому напрямую копировать результаты в домашку не стоит. Сначала хотя бы перечитайте содержание и удалите лишние 😃
На каких моделях обучается
DeepSeek использует собственные языковые модели. Сейчас доступны две: V3 — режим по умолчанию, и R1 — активируется вручную отдельной опцией.
По официальным заявлениям, для обучения используются свои данные (вероятно, в том числе из накопленного багажа Higher-Flyer) и информация из свободных источников, например, из открытых репозиториев GitHub.
Какие языки понимает
«Родными» являются китайский и английский. В ходе моих экспериментов в браузерной и мобильной версиях я не заметил каких-либо проблем с пониманием русского языка и с генерацией ответов на нем.
По официальной документации, модуль DeepSeek-Coder (отвечает за написание программного кода) поддерживает почти 340 языков программирования. В их числе широко распространенные C++, C#, JavaScript, PHP и Python. Мои навыки программирования невелики. Поэтому я не могу оценить, насколько хорошо и корректно нейросеть пишет код.
Для кого может подойти
Первый и наиболее очевидный вариант — обычные люди. Нейросеть станет для них личным помощником в повседневных делах.
ИИ пригодится офисным служащим. Он неплохо анализирует информацию и выдает краткие пересказы. Чтобы не тратить время на длинные письма и многостраничные документы, можно попросить нейронку передать суть. Также можно генерировать собственные письма и прочий текстовый контент.
Режим программирования позволяет разработчикам автоматизировать написание кода. Способность анализировать поможет деконструировать сложные алгоритмы и непонятные технические задания.
Математический функционал превращает ИИ в продвинутый калькулятор. Он будет полезен инженерам и научным сотрудникам.
Сколько стоит
Мобильная, браузерная и десктопная версия полностью бесплатные. В них нет рекламы, подписок, встроенных покупок и ограничений на количество запросов.
Монетизация действует, когда система встраивается в сторонний софт и использует облачную инфраструктуру DeepSeek. Цена начинается от $0,07 за 1 млн токенов (минимальная единица текста, которую воспринимает модель).
Как начать пользоваться DeepSeek на ПК и телефоне
С онлайн-версией все просто.
- Переходим на официальный сайт.
- Жмем «Start now».
- Регистрируемся.
- И пользуемся.
На мобильных устройствах все так же просто.
- На сайте нейронки наводим курсор на «Get DeepSeek App» или на «Get App», после того как войдем в учетную запись.
- Сканируем QR-код и переходим в мобильный стор. Либо сразу открываем его, находим приложение по названию и устанавливаем.
- Регистрируемся или входим в аккаунт.
- Приступаем к работе. На всякий случай — несколько дополнительных опций открываются, если нажать на значок плюса.
Переходим к сложному сценарию — локальной установке. Напоминаю то, о чем говорил в самом начале. Запуск любой нейронки — крайне ресурсоемкая задача. Не имеет смысла разворачивать систему на слабых и устаревших конфигурациях. Часть нагрузки ложится на видеокарту. Поддерживаются продукты NVIDIA и AMD, а также свежая, но пока экзотическая платформа Huawei Ascend.
- Переходим на сайт Ollama — это фреймворк, или, проще говоря, среда, в которой будет запускаться языковая модель. Также можно воспользоваться LM Studio. Дальнейшие шаги я распишу на примере работы Ollama в Windows 11.
- Скачиваем и устанавливаем дистрибутив для нужной ОС.
- Теперь нужно проверить, установился ли фреймворк. Кликаем правой кнопкой мыши по «Пуску» и открываем «Терминал».
- Вводим в командную строку «ollama». Если установка прошла успешно и фреймворк работает, отразится его список команд.
- Возвращаемся на главную Ollama. Переходим по ссылке «DeepSeek-R1».
- Отобразится список доступных моделей. Они оптимизированы под определенный объем видеопамяти. Самый доступный вариант — «1.5b». Когда память видеоадаптера закончится, недостаток будет компенсироваться за счет оперативной (более медленной). Если и она подойдет к концу, настанет очередь накопителя (совсем медленный). Выбираем подходящую сборку.
- Копируем появившуюся команду.
- Возвращаемся в Терминал, вставляем и запускаем скопированную команду. Дожидаемся, пока скачаются пакеты.
- Если все пройдет успешно, появится сообщение «success».
- Работа с ИИ ведется через Терминал. Графического интерфейса в этом случае нет. Вводить первые запросы можно сразу после установки. При следующих сеансах сначала надо отправить команду «ollama run %название модели%». Т. е. для примера на скринах это «ollama run deepseek-r1:1.5b».
Пробуем уже знакомый запрос.
Результат совершенно не впечатляет. Это издержки самой «бюджетной» сборки. Версия 14b справилась значительно лучше.
Однако даже такой простой запрос обрабатывался долго в 14b. Слова появлялись на экране, будто их неторопливо печатали двумя пальцами. При этом нейронка израсходовала почти все 8 ГБ моей RTX 4060 и в среднем на 75% нагружала 32-х поточный Ryzen 9 5950x. На более слабых конфигурациях придется ждать дольше.
Чтобы у локальной модели все-таки появился графический интерфейс, можно поставить расширение для Chrome.
ИМЕЙТЕ В ВИДУ: это только визуальная оболочка. Ничего не будет работать, если до этого вы не установите на компьютер фреймворк и языковые модели. Т. е. пока не выполните шаги, описанные выше.
- Переходим на страницу Page Assist в Магазине расширений Chrome и устанавливаем плагин.
- Жмем по значку плагина справа от адресной строки.
- По умолчанию интерфейс на английском. Поэтому переходим в настройки расширения для смены локализации.
- В разделе «General Settings» переключаем «Speech Recognition Language» на «Русский», а «Language» — на «Russian».
- Возвращаемся на основной экран.
- Выбираем модель из списка установленных.
- Вводим запросы (теперь их также можно надиктовывать через микрофон) и дожидаемся результатов.
Как продуктивно работать в приложении DeepSeek
Теперь проверим, как нейросеть справляется с конкретными рабочими задачами.
Для рутинных дел
ИИ может заменить поисковые системы: найти нужную информацию и передать ее в кратком и понятном виде.
Для подготовки рабочих текстов
Нейросеть быстро напишет текст для документа, поста в соцсетях, служебного письма или других задач. Она не умеет создавать готовые файлы и ручное редактирование в ней недоступно. Поэтому желательно держать под рукой стороннюю программу, например, PDF Commander. В этом редакторе легко внести нужные правки в результат генерации, создать красивое оформление, а затем сохранить в подходящем формате.
Для креатива
Поэзия не особо дается DeepSeek, но с рекламными слоганами она справляется лучше.
Для бизнеса
Искусственный интеллект способен заменить сценариста рекламных видео или взять на себя подготовку контент-планов.
Чем отличается от своих западных конкурентов
Прежде я пользовался и другими нейронками. Поэтому быстро заметил, чем китайское решение отличается от передовых технологий западных компаний.
- Монетизация. Новинка не ограничивает количество бесплатных запросов. Тарификация действует только для компаний, если они решат интегрировать искусственный интеллект в свой софт, но не захотят запускать его на собственных серверах.
- Процесс генерации. Нейросеть следит за контекстом диалога и фактически эмулирует мышление человека. Когда она генерирует ответы, можно увидеть анализ задачи и поиск вариантов с пояснениями, почему они выбраны именно они, а не другие.
- Новая архитектура. Это точно не форк и не еще одна сборка стороннего опенсорсного решения.
- Стоимость обучения. При локальной установке вы получаете готовые языковые модели. Не нужно тренировать ИИ на собственных данных.
- Одинаковый функционал. Мобильные приложения полностью идентичны браузерной версии. У западных решений постоянно наблюдается перекос в пользу той или иной платформы.
Что в итоге: плюсы и минусы
Вы узнали, как начать пользоваться DeepSeek R1 в России, и увидели примеры ее работы. Из положительных моментов отмечу:
- Доступность в РФ. Часть западных технологических компаний ушла с нашего рынка и закрыла доступ к своему ПО из России. Китайский стартап никакие ограничения не вводил.
- Открытый исходный код. Специалисты могут произвольно настраивать нейронную сеть и модифицировать систему.
- Бесплатность. Не нужно оформлять подписку и смотреть рекламу. Требуется только регистрация. Платные опции актуальны лишь для некоторых организаций.
- Качественная работа. ИИ неплохо генерирует тексты, решает задачи программирования и даже успешно заменяет ПО для OCR.
- Удобный интерфейс. В веб-версии и программе для смартфонов легко разобраться, благодаря простому и понятному виду.
Не обошлось и без недостатков:
- Ограниченный функционал. ИИ разрабатывался для только обработки текстов. Он не умеет создавать картинки, музыку и видео, управлять какими-либо устройствами.
- Особенности локальной версии. Приемлемые результаты обеспечивают только модели с высокими системными требованиями. Работа с нейронкой в этом случае ведется через командную строку или плагин, что неудобно.