ML Kit и Core ML: ИИ на устройстве

ML Kit и Core ML — фреймворки Google и Apple, которые выполняют модели машинного обучения прямо на смартфоне, без отправки данных на сервер. Они распознают текст, лица, объекты и речь за миллисекунды, работают офлайн, не требуют оплаты облачных API, а персональные данные пользователя физически не покидают устройство.

Зачем переносить ИИ с сервера на устройство

Классическая схема «приложение → API в облаке → ответ» имеет три слабых места: задержку сети, цену за каждый запрос и передачу персональных данных третьей стороне. On-device подход убирает все три. Модель лежит внутри приложения или догружается один раз, инференс выполняется на нейропроцессоре телефона (Neural Engine у Apple, NNAPI/TPU-блоки у Android-флагманов), и каждый следующий запрос стоит ноль тенге.

Для казахстанского рынка это особенно ощутимо. Закон «О персональных данных» требует внимательного отношения к трансграничной передаче, а пользователи за пределами Алматы и Астаны нередко сидят на нестабильном мобильном интернете. Сканер документов, который работает в лифте, в метро и в селе без 4G, — это не маркетинговая фраза, а прямое следствие архитектуры. Подробный разбор того, куда движется AI в мобильных приложениях в 2026 году, мы публиковали отдельно — on-device-инференс там среди главных направлений.

Важно понимать границу: on-device ИИ — это про быстрые специализированные задачи (зрение, текст, классификация). Большие генеративные сценарии вроде полноценного диалогового ассистента по-прежнему живут в облаке — как устроен ИИ-чат в мобильном приложении, мы разбирали в соседней статье. Сильные продукты обычно комбинируют оба подхода.

ML Kit: готовый ИИ от Google для Android и iOS

ML Kit — это набор готовых SDK, которые подключаются к проекту за часы, а не недели. Google уже обучил модели, сжал их под мобильные процессоры и отдаёт бесплатно, причём библиотека кроссплатформенная: один и тот же API работает на Android и iOS.

Что ML Kit умеет «из коробки»

Распознавание текста (OCR) — латиница, кириллица, китайский и ещё десятки скриптов. База для сканеров удостоверений, накладных, чеков.
Сканирование штрих- и QR-кодов — все основные форматы, стабильно ловит код под углом и при плохом свете.
Детекция лиц — координаты, контуры, наклон головы, открыты ли глаза. Основа для масок, проверки селфи, контроля присутствия.
Распознавание и трекинг объектов — поиск товара по фото, подсчёт предметов в кадре.
Перевод текста — 50+ языков офлайн, словари по ~30 МБ на пару.
Сегментация селфи — отделение человека от фона без зелёного экрана.

Если готовых моделей мало, ML Kit запускает кастомные модели TensorFlow Lite: обучаете нейросеть под свою задачу — например, классификацию дефектов продукции — и кладёте её в то же API.

Core ML: максимум из железа Apple

Core ML — нативный слой машинного обучения в iOS, iPadOS, watchOS и macOS. В отличие от ML Kit это не набор готовых сценариев, а среда исполнения: вы конвертируете любую обученную модель (PyTorch, TensorFlow, scikit-learn) в формат .mlmodel, а система сама решает, на чём её считать — CPU, GPU или Neural Engine.

Поверх Core ML Apple даёт прикладные фреймворки, закрывающие типовые задачи без обучения собственных моделей:

Vision — OCR (с поддержкой кириллицы), детекция лиц и поз, сегментация, поиск похожих изображений;
Natural Language — определение языка, токенизация, тональность, именованные сущности;
Speech / SoundAnalysis — офлайн-распознавание речи и классификация звуков;
Create ML — обучение моделей на Mac без Python: классификатор изображений тренируется буквально перетаскиванием папок с примерами.

Главный козырь Core ML — производительность. Модель, скомпилированная под Neural Engine, на iPhone последних поколений обрабатывает кадр камеры быстрее, чем уходит сетевой пакет до ближайшего дата-центра. Для AR-примерок, live-фильтров и анализа видео в реальном времени это единственный рабочий вариант. Этими же инструментами пользуемся мы в разработке мобильных приложений, когда продукту нужны функции компьютерного зрения без серверной инфраструктуры.

ML Kit или Core ML: что выбрать бизнесу

Короткий ответ: это не конкуренты, а инструменты разного уровня. ML Kit — быстрый старт и кроссплатформенность, Core ML — глубина и скорость на технике Apple. В проектах под обе платформы они часто живут вместе.

Критерий	ML Kit	Core ML
Платформы	Android + iOS	Только экосистема Apple
Готовые сценарии	12+ SDK «из коробки»	Через Vision / NL / Speech
Кастомные модели	TensorFlow Lite	Любые через конвертацию в .mlmodel
Использование нейрочипа	Зависит от устройства	Полный доступ к Neural Engine
Стоимость инференса	0 ₸, без лимитов	0 ₸, без лимитов
Работа офлайн	Да (on-device API)	Да, всегда
Типовой срок интеграции	1–3 недели на функцию	2–6 недель на функцию

Практическое правило, которым руководствуемся мы: если задача закрывается готовым API ML Kit — берём его на обеих платформах и экономим бюджет клиента. Если нужна максимальная точность, своя модель или тяжёлая работа с видео на iPhone — подключаем Core ML и Vision на iOS, а на Android ту же модель запускаем через TensorFlow Lite.

Приватность: главный аргумент on-device подхода

Когда фото удостоверения, голос или медицинские показатели обрабатываются на устройстве, у компании исчезает целый класс рисков. Нечего перехватывать в канале связи, нечего терять при взломе сервера, не нужно объяснять регулятору, в какой юрисдикции крутится облачный API.

Для каких отраслей в Казахстане это критично:

Финтех и МФО — проверка документов и селфи при онбординге без выгрузки биометрии наружу;
Медицина — анализ фото кожи, подсчёт пульса по камере: данные о здоровье не покидают телефон пациента;
Госсектор и B2G — требования по локализации данных закрываются по определению;
Ритейл и логистика — сканирование тысяч накладных в день без оплаты облачного OCR за каждый документ.

Есть и продуктовый эффект: формулировка «данные не покидают ваше устройство» повышает конверсию в установку, а privacy-метки приложения в сторах выглядят чище — меньше категорий собираемых данных, меньше вопросов на модерации.

Сколько стоит внедрение on-device AI в Казахстане

Вилки актуальны для рынка КЗ на 2026 год и зависят от сложности сценария, требований к точности и того, встраиваем мы функцию в существующее приложение или строим продукт с нуля.

Задача	Стоимость	Срок
Сканер документов / OCR-модуль в готовое приложение	от 900 000 ₸	2–3 недели
Сканер штрих-кодов с привязкой к учётной системе	от 700 000 ₸	1–2 недели
Детекция лица + проверка живости для онбординга	от 1 800 000 ₸	3–5 недель
Сегментация / виртуальная примерка по фото	от 2 200 000 ₸	4–6 недель
Конвертация и оптимизация вашей модели под Core ML / TFLite	от 1 200 000 ₸	2–4 недели
Приложение с on-device AI под ключ (iOS + Android)	от 6 500 000 ₸	от 10 недель

Заметная статья экономии — операционные расходы. Облачный OCR при потоке в десятки тысяч документов в месяц съедает сотни тысяч тенге ежемесячно; on-device-распознавание после внедрения не стоит ничего, сколько бы пользователей ни сканировало. Чем выше нагрузка, тем быстрее окупается разница в цене разработки.

Точная смета зависит от вашей задачи — присылайте описание, посчитаем за 24 часа. Команда разработки мобильных приложений в Алматы работает с рынками Казахстана, ОАЭ и Таиланда с 2007 года, за плечами 300+ проектов.

Когда on-device не подходит и как строить гибрид

Честный разбор ограничений, чтобы вы не заложили в продукт ложные ожидания:

Генеративные задачи. Полноценные LLM-диалоги, генерация изображений и длинных текстов пока требуют облака — мобильные нейрочипы тянут лишь компактные модели.
Размер приложения. Каждая модель — это мегабайты в дистрибутиве. Решается отложенной загрузкой моделей после установки.
Старые устройства. На бюджетных Android-телефонах без NPU инференс заметно медленнее — нужен фолбэк или упрощённая модель.
Обновление моделей. Улучшили точность — нужно доставить новую модель пользователям: через обновление приложения или загрузку с CDN.

Рабочая гибридная схема выглядит так: быстрые и чувствительные к приватности операции (распознавание, классификация, проверка документов) выполняются на устройстве, а тяжёлая аналитика и генеративные функции уходят на сервер — туда передаётся уже обезличенный результат, а не сырые данные. Так продукт получает и скорость, и приватность, и интеллект облачных моделей.

Частые вопросы

ML Kit действительно бесплатный?

Да, все on-device API ML Kit бесплатны без лимитов на количество запросов — вы платите только за разработку и интеграцию. У Google есть отдельные облачные API (Cloud Vision и другие) с тарификацией за запрос, но это другой продукт. Core ML и фреймворки Apple также не тарифицируются: они часть операционной системы.

Насколько точен on-device OCR для казахского языка?

Кириллица распознаётся уверенно и в ML Kit, и в Vision у Apple, включая казахские специфические буквы в большинстве сценариев. Для документов со сложной вёрсткой или рукописным текстом мы проводим тест на реальных образцах клиента до старта проекта и при необходимости дообучаем кастомную модель — это надёжнее любых обещаний «из коробки».

Можно ли добавить on-device ИИ в уже работающее приложение?

Да, это типовая задача. ML Kit и Core ML подключаются как обычные библиотеки в нативные проекты, а также во Flutter и React Native через плагины. Встраивание одной функции — например, сканера документов — занимает от двух недель и не требует переписывать приложение. Сначала мы делаем аудит архитектуры, затем называем точный срок и смету.

Что выбрать для Flutter-приложения?

Для Flutter существуют официальные и поддерживаемые сообществом плагины ML Kit, закрывающие OCR, штрих-коды, лица и сегментацию сразу на двух платформах — это самый экономный путь. Если на iOS нужна максимальная производительность, отдельные модули пишутся нативно на Core ML и подключаются к Flutter через platform channels.

Безопасно ли хранить модель внутри приложения — её не украдут?

Риск извлечения модели из пакета приложения существует, как и для любого кода. На практике он снижается обфускацией, шифрованием файла модели с расшифровкой в рантайме и доставкой модели с сервера после авторизации. Для большинства бизнес-задач ценность представляет не сама модель, а данные и процесс её обучения, которые остаются у вас.

Зачем переносить ИИ с сервера на устройство

ML Kit: готовый ИИ от Google для Android и iOS

Что ML Kit умеет «из коробки»

Core ML: максимум из железа Apple

ML Kit или Core ML: что выбрать бизнесу

Приватность: главный аргумент on-device подхода

Сколько стоит внедрение on-device AI в Казахстане

Когда on-device не подходит и как строить гибрид

Частые вопросы

ML Kit действительно бесплатный?

Насколько точен on-device OCR для казахского языка?

Можно ли добавить on-device ИИ в уже работающее приложение?

Что выбрать для Flutter-приложения?

Безопасно ли хранить модель внутри приложения — её не украдут?

Читайте также

Монетизация мобильного приложения: подписки, реклама или freemium

Метрики успеха MVP: что измерять после запуска

A/B-тестирование в мобильном приложении: что тестировать, инструменты и ошибки

Программа лояльности в мобильном приложении: баллы, кэшбэк и уровни для бизнеса в Казахстане

Казахский язык в мобильном приложении: зачем нужна локализация, как её сделать и сколько это стоит

API для мобильного приложения: REST или GraphQL

Давайте обсудимваш проект

Быстрая заявка

Давайте обсудим
ваш проект