Счупеният часовник е прав 2 пъти на ден, а най-добрият ИИ модел: в 69 процента от случаите
Току-що получихме отрезвяваща картина за това какъв брой постоянно моделите с изкуствен интелект уточняват обстоятелствата. Тази седмица Гугъл DeepMind показа документа FACTS Benchmark Suite, който мери какъв брой надеждно моделите с изкуствен интелект дават в действителност точни отговори.
Той тества модели в четири области: отговаряне на фактологични въпроси от вътрешни познания, дейно потребление на уеб търсене, мотивиране на отговорите в дълги документи и интерпретиране на изображения. Най-добрият модел, който се оказва Gemini 3 Pro на Гугъл, доближи 69% акуратност, като другите водещи модели бяха много под това равнище.
Като непряко съпоставяне, в случай че публицист напише материал, в който фактологията е единствено 69 % вярна, това би следвало да бъде пагубно както за доверието в медията, по този начин и за кариерата на индивида.
Източник: manager.bg
КОМЕНТАРИ




