LinuxDays 2025

Vyhodnocování umělé inteligence (AI benchmarky)
05.10.2025 , 107
Jazyk: Čeština

Představíme si způsoby, kterými se vyhodnocuje kvalita a vývoj současných jazykových modelů (LLM), AI asistentů a obdobných technologií.

Ukážeme různé úlohy, kterými se lidé snaží zjistit, jak moc jsou jejich programy skutečně inteligentní - a co si vlastně pod inteligencí představují. Letem světem od Turingova testu přes Winogradovy dvojice po SWE-Bench a ARC-AGI.


Obtížnost:

Začátečníci

Vyvinul radar na počasí hodný 21. století a spoluzaložil startup, který je teď vyrábí a prodává po světě.

Rekreačně se zajímá o nastupující technologie, jako je aktuálně třeba AI.

Tento přednášející je uvedený také u: