Голосовой ввод еды: когда он быстрее фото и текста
Голосовой ввод еды: когда он быстрее фото и текста
Фото — главный способ ввода в MICO, но не единственный. У каждого метода свой сценарий, и голос часто оказывается самым быстрым. Разбираем, когда имеет смысл говорить, а не снимать.
Когда голос быстрее фото
Фото требует, чтобы еда была перед тобой, на тарелке, в хорошем свете. Голос работает всегда и везде:
- В машине — перекусил бутербродом за рулём, продиктовал на светофоре
- На ходу — съел банан по дороге, сказал в наушники
- В гостях — неловко фотографировать чужую еду, но можно тихо надиктовать
- В столовой/кафе — блюдо уже съедено, фото не поможет
Средняя скорость ввода голосом — 6-8 секунд на приём пищи. Фото — 10-12 секунд с учётом ракурса. Текст — 30-60 секунд.
Как правильно диктовать
MICO понимает разговорный язык, а не жёсткий формат. Эти фразы работают одинаково хорошо:
- "Съел две котлеты с пюре и огурец"
- "На обед борщ, хлеб, куриная ножка"
- "Кофе с молоком и круассан"
Ключевые моменты:
- Количество можно приблизительно — "пару котлет", "немного риса"
- Размеры можно в привычных единицах — "тарелка", "стакан", "ложка"
- Несколько блюд через союз — "и", "с", перечисление
Модель сама раскладывает фразу на компоненты и оценивает калории.
Когда голос не работает
Есть три сценария, где лучше переключиться:
- Шумное место — распознавание падает в открытом офисе или ресторане
- Точная граммовка — если нужно ровно 150 г, а не "порция", надо ввести вручную
- Упакованные продукты — быстрее отсканировать штрихкод
Также голос бесполезен для блюд со скрытыми ингредиентами. "Пельмени" — модель оценит, а вот "бабушкины пельмени с особой начинкой" — уже нет.
Фишка: голосовая правка фото
Самый быстрый способ ввода — комбинация. Снимаешь тарелку, MICO распознаёт основные компоненты, а потом добавляешь голосом то, что не видно:
- "Добавь ложку сметаны"
- "Это было жарено на масле, не варёное"
- "Порция была больше, грамм 300"
Такой флоу занимает 10-15 секунд и даёт максимальную точность.
Приватность
Частый вопрос — куда уходит запись. Распознавание речи происходит на устройстве, аудио не уходит на сервер. На сервер уходит только расшифрованный текст для расчёта калорий.
Итог
Голос — не замена фото, а дополнение. Для еды дома с тарелки быстрее фото. Для еды на ходу, в гостях, в машине — голос. А для максимальной точности — фото плюс голосовая правка.
Попробуй MICO первым
AI-трекер калорий с персональным коучем. Бесплатный ранний доступ.
Попасть в waitlist