Поиск

Рекомендовать

Календарь

Ноябрь 2018
ПнВтСрЧтПтСбВс
   1234
567891011
12131415161718
19202122232425
2627282930  

Кто на сайте?

Сейчас на сайте находятся:
 2 гостей 

Счетчик

Сегодня11
Вчера37
За эту неделю187
За этот месяц92
Всего104851
Главная Автоматика Контроллеры Arduino Управление нагрузкой голосом
Баннер

Управление нагрузкой голосом

aidioOffХочу рассказать об одной своей разработке, а именно об управлением нагрузкой голосовыми командами, что я сделал и почему радость от быстрых результатов также быстро прошла. Система позволяет много что сделать сильно не напрягая мозг. В видео, которое размещено ниже, показаны ее первоначальные возможности, и для расширения этих возможностей нет ограничений каких то сложностей, но... Я не буду в этой статье давать файлы на скачивание, не потому что жалко. Дней через 5-7, после того как я снял это видео система вдруг перестала принимать команды с сотового телефона. С компьютера работала без проблем, и сейчас работает, но с телефона отказывалась. Почему то с телефона из всей команды стало распознаваться только первое слово. Остальные просто обрубались, как будто и небыло.

Я начал искать проблему. Ошибка в коде исключалась сразу. Нет, я не такой программист, который кодит без ошибок, просто код не менялся, система работала до определенного времени, и потом вдруг не стала дружить с телефоном. Вообщем интернет был основательно перелопачен. Появился результат, который не обрадовал.

 

Здесь я немного расскажу о принципе действия этой системы. Как и и говорил, при ее создании извилины напрягать сильно не пришлось, в основном для реализации функций распознавания голоса перевода текста в речь, использовался всем знакомый язык программирования - "копировать-вставить". Для этих целей использовал Api Google. Вообщем был создан сайт, который с помощью Api разпознавал речь, переводил в текст, текст парсился, в результате программа узнавала что от ней требуется, выполняла требуемое действие и попутно произносила комментарии своих действий. Этот сайт можно загрузить как с комьютера, так и с телефона. Единственное условие - для работы голосовых функций нужен браузер Google. Другие не умеют... Это первое ограничение, с которым я столкнулся, и которое меня вообщем нисколько не расстроило. В своем андроиде я использовал хром, как и  в компьютере.

Второе ограничение, которое уже немного стало приносить неудобство при работе с телефоном: Выяснелось, что в целях экономии трафика и других соображений, телефон не может проиграть звук, пока пользоваель не ткнет пальцем кнопку. Правда тыкать нужно было только один раз, потом телефон как бы понимал, и следующие фразы произносил без пинков. Меня это устроило, так как не всегда и не везде нужно чтобы окружающие слышали что сообщает тебе телефон. Вот теперь мы и подошли к тому, на чем отстановились.

Что же я сделал чтобы команды с телефона начали распознаваться полностью, а не только первое слово? Да ничего! Информации в сети не нашел никакой, кроме той, что в комментариях к некоторым программам для андроидов, использующих голос появились примерно такие записи - "почему то перестла работать функция голоса". И тут до меня дошло, я не виноват! Это все Google! Я вспомнил, что когда то на таком же принципе делал онлайн-переводчик (примерно такой, как недано выпустил Google, и я подозреваю, они у меня его стырили :-) ! ). Я сделал его давно, и благополучно забыл о нем. Я проверил его работу на компе, работает без проблем. Запустил на телефоне, и опа! Распознает только первое слово!

Вся эйфория прошла... Я понял, что надеяться на Api, котрое могут в любое время поменять, мягко говоря не желательно. Да, конечно на компе работает, но весь смак был в работе с телефона...

Теперь я думаю понятно почему я не выложил исходники.

Но я все таки решил эту проблему! Точнее все выше описанные проблемы решены. Правда пришлось изменить всю структуру программы, и разделить ее на две части. Первая часть для компьютера, осталась той, что была сделана изначально, вторую часть для телефона пришлось писать заново, под андроид. Об этом как нибудь я напишу в следующе статье. Сейчас же скажу, что для телефона я сделал программу на ai2.appinventor.mit.edu. Интересное программирование, ни одной строчки кода! Сначала думал хрень какая то, оказывается ошибся. Даже очень понравилось! Перед ее использованием, были протестированы другие подобные сервисы и IDE, около десятка, но этот вариант мне понравился больше всего. Работает быстро, файлы генерируются небольшого размера - 3-7 мгб (в delphi xe например пустой .apk - от 30мгб). Но что мне больше всего понравилось - возможность использования мультимедиа, датчико телефона и других функций. У других сервисов основное направление больше на внешний вид. Но это мое мнение, и оно никому не навязывается.

Вообщем вот такая получилась история. Если у кого будут вопросы, пишите в комментариях, отвечу. 

 

 

Комментарии  

 
0 #1 arbuzmaster 13.06.2015 20:42
на androide тоже можно в автомате воспроизводить audio Нужно ковырять в chrome://flags вот это - функцию управления жестами , у себя делал и работало.
А вот скрипт google voice recognition http://www.ab-log.ru/forum/viewtopic.php?f=1&t=17&hilit=%D0%B6%D0%B5%D1%81%D1%82%D0%B0%D0%BC%D0%B8&start=300#p13275 работает как на компе так и на телефоне с android только в Chrome Удачи!!
Цитировать
 

Добавить комментарий


Защитный код
Обновить