Току-що получихме отрезвяваща картина за това колко често моделите с

...
Току-що получихме отрезвяваща картина за това колко често моделите с
Коментари Харесай

Счупеният часовник е прав 2 пъти на ден, а най-добрият ИИ модел: в 69 процента от случаите


Току-що получихме отрезвяваща картина за това какъв брой постоянно моделите с изкуствен интелект уточняват обстоятелствата. Тази седмица Гугъл DeepMind показа документа FACTS Benchmark Suite, който мери какъв брой надеждно моделите с изкуствен интелект дават в действителност точни отговори.

Той тества модели в четири области: отговаряне на фактологични въпроси от вътрешни познания, дейно потребление на уеб търсене, мотивиране на отговорите в дълги документи и интерпретиране на изображения. Най-добрият модел, който се оказва Gemini 3 Pro на Гугъл, доближи 69% акуратност, като другите водещи модели бяха много под това равнище.

Като непряко съпоставяне, в случай че публицист напише материал, в който фактологията е единствено 69 % вярна, това би следвало да бъде пагубно както за доверието в медията, по този начин и за кариерата на индивида.
Източник: manager.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР