← Все статьи
AIпродуктввод

Голосовой ввод еды: когда он быстрее фото и текста

MICO Team15 апреля 2026 г.

Голосовой ввод еды: когда он быстрее фото и текста

Фото — главный способ ввода в MICO, но не единственный. У каждого метода свой сценарий, и голос часто оказывается самым быстрым. Разбираем, когда имеет смысл говорить, а не снимать.

Когда голос быстрее фото

Фото требует, чтобы еда была перед тобой, на тарелке, в хорошем свете. Голос работает всегда и везде:

  • В машине — перекусил бутербродом за рулём, продиктовал на светофоре
  • На ходу — съел банан по дороге, сказал в наушники
  • В гостях — неловко фотографировать чужую еду, но можно тихо надиктовать
  • В столовой/кафе — блюдо уже съедено, фото не поможет

Средняя скорость ввода голосом — 6-8 секунд на приём пищи. Фото — 10-12 секунд с учётом ракурса. Текст — 30-60 секунд.

Как правильно диктовать

MICO понимает разговорный язык, а не жёсткий формат. Эти фразы работают одинаково хорошо:

  • "Съел две котлеты с пюре и огурец"
  • "На обед борщ, хлеб, куриная ножка"
  • "Кофе с молоком и круассан"

Ключевые моменты:

  • Количество можно приблизительно — "пару котлет", "немного риса"
  • Размеры можно в привычных единицах — "тарелка", "стакан", "ложка"
  • Несколько блюд через союз — "и", "с", перечисление

Модель сама раскладывает фразу на компоненты и оценивает калории.

Когда голос не работает

Есть три сценария, где лучше переключиться:

  • Шумное место — распознавание падает в открытом офисе или ресторане
  • Точная граммовка — если нужно ровно 150 г, а не "порция", надо ввести вручную
  • Упакованные продукты — быстрее отсканировать штрихкод

Также голос бесполезен для блюд со скрытыми ингредиентами. "Пельмени" — модель оценит, а вот "бабушкины пельмени с особой начинкой" — уже нет.

Фишка: голосовая правка фото

Самый быстрый способ ввода — комбинация. Снимаешь тарелку, MICO распознаёт основные компоненты, а потом добавляешь голосом то, что не видно:

  • "Добавь ложку сметаны"
  • "Это было жарено на масле, не варёное"
  • "Порция была больше, грамм 300"

Такой флоу занимает 10-15 секунд и даёт максимальную точность.

Приватность

Частый вопрос — куда уходит запись. Распознавание речи происходит на устройстве, аудио не уходит на сервер. На сервер уходит только расшифрованный текст для расчёта калорий.

Итог

Голос — не замена фото, а дополнение. Для еды дома с тарелки быстрее фото. Для еды на ходу, в гостях, в машине — голос. А для максимальной точности — фото плюс голосовая правка.

Попробуй MICO первым

AI-трекер калорий с персональным коучем. Бесплатный ранний доступ.

Попасть в waitlist
Голосовой ввод еды: когда он быстрее фото и текста — Блог MICO