Модели — локальные LLM для бизнеса

DeepSeek

до 671B (MoE)

Сложный анализ договоров, юридических и финансовых документов, рассуждения по многошаговым задачам.

Юристы, финансы, аналитика

Qwen

0.5B–72B

Универсальный корпоративный ассистент с отличным русским языком. Базовая модель для большинства внедрений.

Универсальный корпоративный ИИ

Llama

8B–405B

Гибкая модель с большой экосистемой. Хорошо дообучается под отрасль.

Кастомизация под отрасль

Mistral

7B–123B

Быстрые ответы при ограниченном железе, чистая коммерческая лицензия.

Скорость на среднем железе

Gemma

2B–27B

Запуск на слабом железе и ноутбуках, лёгкие ассистенты.

Минимальное оборудование

Phi

3.8B–14B

Высокое качество ответов при малом размере. Идеальна для рабочих станций.

Качество на малом железе

Command R

35B–104B

Поиск по большой базе документов с точными ссылками на источники.

RAG и базы знаний

Granite

2B–34B

Регулируемые отрасли, где важно происхождение обучающих данных.

Комплаенс и регуляторика

Aya

8B–35B

Работа с документами на множестве языков, международные компании.

Многоязычные документы

Nemotron

4B–340B

Крупные внедрения на GPU-кластерах NVIDIA.

Enterprise-кластеры

Yi

6B–34B

Обработка очень длинных документов и больших контекстов целиком.

Длинные документы

Mixtral

8x7B / 8x22B

Высокая скорость при хорошем качестве за счёт архитектуры MoE.

Баланс цена/качество

Codestral

22B

Помощь разработчикам, анализ репозиториев, ревью кода.

Разработка и DevOps

Qwen Coder

1.5B–32B

Автодополнение кода и техническая документация для IT-команд.

IT-команды

DeepSeek Coder

1.3B–33B

Анализ кодовых баз и генерация кода в изолированном контуре.

Закрытая разработка

StarCoder

3B–15B

Работа с большими репозиториями и легаси-кодом.

Репозитории кода

Whisper

tiny–large-v3

Расшифровка звонков колл-центра, совещаний, диктовки — локально.

Расшифровка речи

BGE

embedding

Векторизация документов для точного поиска внутри RAG.

Поисковый слой RAG

Jina Embeddings

embedding

Эмбеддинги длинных документов для базы знаний.

Эмбеддинги длинных текстов

Nomic Embed

embedding

Открытый поисковый слой для векторной базы Qdrant.

Открытый поиск

Шаг 1 — вход

Не нашли нужное направление?

Опишите задачу — подберём конфигурацию и пришлём архитектуру за 24 часа.

Архитектура вашей AI-системы за 24 часа
Расчёт оборудования и моделей под ваши данные
Без передачи документов наружу — NDA по умолчанию