ИИ Microsoft научился решать визуальные головоломки и проходить тесты IQ
С распознаванием изображений у ИИ тоже все неплохо.
Кстати, на сайте читать удобнее
Сотрудники исследовательского подразделения Microsoft рассказали о создании нейросети Kosmos-1, специализирующейся на обработке графических изображений. Нейросеть может проанализировать изображение и распознать не только объекты на нем, но и суть картинки.
К примеру, Kosmos-1 способен понять, какое время показывают часы со стрелкой на фотографии и может решить пример, изображенный на картинке. Нейросеть может давать ответы и на более сложные вопросы: она может понять, что мальчик на фотографии плачет, потому что его самокат сломался.
Кроме того, нейросеть умеет решать визуальные головоломки вроде тех, что предлагают в тестах на IQ. Как отмечают в Microsoft, пока о стопроцентно верном прохождении тестов речь не идет: точность ИИ составляет порядка 22-26%.
Впрочем, если выбирать ответы случайно, то точность будет на уровне 17%.
Для обучения нейросети исследователи использовали датасет на 800 гигабайт, в который входят данные, собранные в интернете. После первичного обучения модель прошла ряд тестов, с помощью которых исследователи оценивали ее способность описывать изображения и понимать язык.
По оценке исследователей, во многих аспектах Kosmos-1 оказалась эффективнее, чем существующие модели, выполняющие те же задачи. Microsoft планирует выложить Kosmos-1 в открытый доступ, пока этого не произошло.
- Нейросеть сыграла в VizDoom на милливаттном чипе
- Электрическое аэротакси пролетело 250 километров — это новый рекорд
- Элли против каннибалов: кадры 8 серии The Last of Us
- Графику в Sons Of The Forest сравнили с The Forest
- Аналитики: для работы ChatGPT требуются десятки тысяч ускорителей
- Хакеры 2 года имели доступ к сети владельцев The Wall Street Journal