Разпознаване на изображения с добавката CloudVision за NVDA

С развитието на изкуствения интелект се появяват все повече услуги за анализ на изображения и извличане на текст от тях. Тъй като в социалните мрежи се публикува все повече графично съдържание, потребителите с нарушено зрение имат нужда от софтуер, който да описва различните снимки в интернет.

Добавката CloudVision за NVDA може да прави доста подробен анализ на изображения, да извлича текста от тях и да го превежда на избран от потребителя език. Бихте могли директно да изтеглите CloudVision от nvda-addons.org.

След като инсталирате добавката, фокусирайте се върху някоя снимка в интернет и натиснете клавишната комбинация NVDA+Control+I. Ще започнете да чувате звуков сигнал. Това означава, че изображението се анализира. Процесът може да отнеме повече от 10 секунди.

Когато разпознаването завърши, NVDA ще докладва различни детайли за фокусираното изображение. Те включват предмети, обстановка, хора, текст (ако е открит такъв). Изкуственият интелект дори се опитва да определи приблизителната възраст на хората от дадена снимка. До колко може да се разчита на това е друг въпрос. Ако задържите клавишите NVDA+Control и натиснете буквата I два пъти, анализът на изображение ще се покаже в отделен прозорец. От него можете да копирате текста.

CloudVision има някои опции, които бихте могли да намерите в менюто на NVDA, „Настройки“, „CloudVision settings“. Ето кои са те:

  • „Play sound during recognition“ – Възпроизвеждане на звуков сигнал по време на разпознаването;
  • „Recognize text“ – Извличане на текст (ако бъде открит такъв);
  • „Recognize images“ – Съобщаване на детайли за изображението например предмети, хора и така нататък;
  • „Read QR / bar code“ – Разчитане на QR и бар кодове;
  • „Translate text“ – Превод на разпознатия текст;
  • „Select image description language“ – Избор на език, на който ще бъде докладван анализът на изображение.

Ако сте включили опцията за превод и като език е зададен български, извлеченият текст също ще бъде превеждан на този език. Тъй като за функционалността се използва автоматичен (машинен) превод, не бива да се очаква перфектно звучащ анализ на изображения. Но все пак тази възможност би улеснила потребителите, които не владеят достатъчно добре английски или попадат на снимки с текст на друг чужд език.

Очаквайте още интересни материали тук, както и на страницата ни във Facebook. Можете да разгледате и продуктите в нашия електронен магазин.

Сподели