Панах Гусейн ушёл в отставку с поста председателя НПА, на эту должность избран Гияс Садыгов-ФОТО
В Гусарском районе автомобиль упал в ущелье: 2 человека погибли, 4 получили ранения
Зеленский: Я не держусь за кресло, мы готовы к проведению выборов, если это позволит ситуация с безопасностью
В Австралии в результате стрельбы погибли 12 человек, подозреваемый задержан -ОБНОВЛЕНО
Технология
- Главная
- Технология
Искусственный интеллект заставили играть в игры
Американские исследователи использовали видеоигры, чтобы оценить эффективность моделей искусственного интеллекта (ИИ).
Как передает Vesti.az, об этом сообщает издание TechCrunch.
Об изобретении нового бенчмарка, который позволил бы оценивать качество ИИ, рассказали специалисты компании Hao AI Lab, созданной на основе Калифорнийского университета в Сан-Диего (США). Они попробовали узнать большее о моделях ИИ с помощью легендарной игры-платформера 1985 года Super Mario Bros. («Супербратья Марио»).
Разработчики создали фреймворк GamingAgent, с которым «заставили» модели воспроизводить и симулировать игровой опыт. Перед этим тестируемые модели получили информацию об игре и правилах с помощью скриншотов. Специалисты заметили, что игра «Марио» заставила каждую модель учиться, принимать решения на скорость и создавать игровую стратегию.
Лучше всего в тестах показала себя Claude 3.7 от Anthropic, немного уступили ей Gemini 1.5 Pro от Google и GPT-4o от OpenAI. Исследователи пришли к выводу, что даже самая успешная модель «играла» хуже, чем любой начинающий геймер. Скорее всего, это связано с тем, что любой модели нужно иметь как минимум секунду на принятие решения, однако «Марио» не давала им такой возможности.
Сооснователь OpenAI и известный ученый Андрей Карпатый прокомментировал в X исследование коллег, заметив, что не знает, как правильно оценивать ИИ в 2025 году. По его словам, пока не существует конкретных метрик эффективности моделей генеративного искусственного интеллекта.
Vesti.az
Рашад Набиев встретился в США с вице-президентом NVIDIA -ФОТО
Азербайджан и Meta рассматривают совместные проекты в области цифрового управления
«Режим для взрослых» появится в ChatGPT в 2026 году
Кембридж выявил рынок фейковых аккаунтов по цене от 8 центов
Внедорожник BAW 212 обзавелся дизелем и готовится к выходу в версии T10-ФОТО
В Баку обсудили развитие искусственного интеллекта -ФОТО