Този сайт използва бисквитки (cookies). Ако желаете можете да научите повече тук. Разбрах

Новини Технологии

AI на Microsoft рисува обекти на база текстови описания

Рисуващият бот е способен да "си представи" какво имате предвид и след това да създадете доста точна рисунка

от , 19 януари 2018 0 2953 прочитания,

Google може да научи изкуствен интелект (AI) как да прави дудъл, но създаването на нещо по-сложно все още е трудна задача за един компютър. Представете си да помолите компютъра си да нарисува "жълта птица с черни крила и къса човка". Определено звучи трудно за изпълнение. Изследователи от Microsoft обаче разработват технология, базирана на AI, която да прави точно това – да генерира изображения на базата на текстови описания с изненадващо голяма точност, обявиха от компанията. При това системата не намира съществуващо изображение, а създава реален чертеж.

"Ако влезете в търсачката Bing и търсите птица, вие получавате нейна снимка. Но в нашия проект снимките се създават от компютъра, пиксел по пиксел, от нулата. Тези птици може и да не съществуват в реалния свят - те са само аспект от представата на компютрите за това как изглеждат птиците", разкри ръководителят на екипа Сяодонг Хе.

 

Прочетете още: Microsoft: Развитието на изкуствения интелект изисква нови регулации

1

 

Въпреки че сегашната форма на тази технология за рисуване не е перфектна, не е трудно да си представим бъдеще, в което тя би могла да функционира дори като асистент по скицирането на художници и интериорни дизайнери или инструмент за усъвършенстване на снимки въз основа на гласови команди. Според екипа на Microsoft разработката може да стигне и по-далеч, като започне да създава анимационни филми, генерирани от писмен скрипт.

Екипът започва изследванията си в сферите на компютърното зрение и естествената езикова обработка с CaptionBot - система за автоматично надписване на снимки - след което създава софтуер, който отговоря на въпроси, свързани с дадено изображение, наречен SeeingAI (той може да бъде използван и от незрящи хора). Настоящата технология се състои от две части – Generative Adversarial Network (GAN), която генерира изображенията, и дискриминатор, който оценява качеството на генерираните изображения.

В процеса на разработка рисуващият бот е трениран върху двойки картинка-надпис, които обучават AI да прави връзка между думи и образи. Екипът също така е създал математическо представяне на мисловната дейност, която всички ние извършваме, когато си представяме картини по сложни описания - червено крило, остър клюн, жълто крило. "Вниманието е човешка концепция. Използваме математика, за да я превърнем в изчислителен модел”, обявиха от екипа на Microsoft.

КОМЕНТАРИ ОТ  

Полезни страници
    За нас | Аудитория | Реклама | Контакти | Общи условия |
    Действителни собственици на настоящото издание са Иво Георгиев Прокопиев и Теодор Иванов Захов