Vyhodnocování umělé inteligence (AI benchmarky) LinuxDays 2025

Vyhodnocování umělé inteligence (AI benchmarky)
.ical

05.10.2025 15:00–15:20, 107
Jazyk: Čeština

Představíme si způsoby, kterými se vyhodnocuje kvalita a vývoj současných jazykových modelů (LLM), AI asistentů a obdobných technologií.

Ukážeme různé úlohy, kterými se lidé snaží zjistit, jak moc jsou jejich programy skutečně inteligentní - a co si vlastně pod inteligencí představují. Letem světem od Turingova testu přes Winogradovy dvojice po SWE-Bench a ARC-AGI.

Obtížnost:

Začátečníci

Viz také: slidy (902,6 KB)

Jan Hrach

Vyvinul radar na počasí hodný 21. století a spoluzaložil startup, který je teď vyrábí a prodává po světě.

Rekreačně se zajímá o nastupující technologie, jako je aktuálně třeba AI.

Tento přednášející je uvedený také u:

Zpracování vysoce kvalitních rádiových signálů
Radarová technika pro 21. století

Vyhodnocování umělé inteligence (AI benchmarky) .ical 05.10.2025 15:00–15:20, 107 Jazyk: Čeština

Vyhodnocování umělé inteligence (AI benchmarky)
.ical

05.10.2025 15:00–15:20, 107
Jazyk: Čeština