Моделът за изкуствен интелект Grok на Илон Мъск, базиран на xAI, демонстрира най-ниския процент на грешки сред популярните чатботове, според нов доклад.
Според проучването, процентът на така наречените „халюцинации" на Grok е бил 8%, което е почти четири пъти по-ниско от това на ChatGPT и Google Gemini. За сравнение, процентът на ChatGPT е достигнал 35%, а на Gemini - 38%, което поставя под въпрос използването им в задачи, изискващи висока точност.
Оценката беше проведена по няколко критерия, включително процент на грешки, оперативна стабилност, потребителски оценки и време на престой. Въз основа на обобщените данни, на всяка услуга беше даден резултат по скала от 0 до 99, като по-високите резултати показват по-голяма ненадеждност.
Grok получи краен резултат от 6 - един от най-добрите резултати в проучването. Експертите отбелязаха висока постоянство на отговорите, потребителска оценка от 4,5 и минимално време на престой от само 0,07%.
Междувременно ChatGPT се класира на дъното на класацията с максимален резултат от 99. След него се наредиха Claude и Meta AI с резултати съответно 75 и 70. Китайският DeepSeek показа резултати, сравними с Grok.
© 2019 MenTrend. Всички права са запазени.
Забранява се възпроизвеждането изцяло или отчасти на материали и публикации, без предварително съгласие на редакцията; чл.24 ал.1 т.5 от ЗАвПСП не се прилага; неразрешеното ползване е свързано със заплащане на компенсация от ползвателя за нарушено авторско право, чийто размер ще се определи от редакцията.
Съвет за електронни медии: Адрес: гр. София, бул. "Шипченски проход" 69, Тел: 02/ 9708810, E-mail: [email protected], https://www.cem.bg/
Четете още