Alignement des IA (RLHF) et prédiction de football

Описание к видео Alignement des IA (RLHF) et prédiction de football

Le modèle de Bradley-Terry est devenu au coeur des scores Elo des joueurs d'échec, les meilleurs modèles de prédiction des matchs de football, l'alignement des modèles de langage et la gouvernance démocratique des IA de recommandation. Cette vidéo détaille
#LeFabuleuxChantier #Tournesol #Bayes #Science4All

Playful:ai : https://playfulai.net/fr
Script + sources : https://github.com/lenhoanglnh/manusc...
Contribuez à Tournesol : https://tournesol.app/

0:00 Introduction
2:01 Le score Elo
5:18 Le modèle de Bradley-Terry
11:47 Playful:ai
17:19 Alignement des modèles de langage
22:13 Notre généralisation de Bradley-Terry
26:32 L'élicitation et l'apprentissage des préférences
29:03 Conclusion

Twitter :   / le_science4all  
Facebook :   / science4allorg  
LinkedIn :   / l%c3%aa-nguy%c3%aan-hoang  

La formule du savoir (mon 1er livre) :
https://laboutique.edpsciences.fr/pro...
Le fabuleux chantier (mon 2e livre, avec El Mahdi El Mhamdi) :
https://laboutique.edpsciences.fr/pro...
Turing à la plage (mon 3e livre, avec Rachid Guerraoui) :
https://www.dunod.com/sciences-techni...
SmartPoop (mon 4e livre, avec Tristan Le Magoarou, aka @RisqueAlpha ) :
https://bit.ly/smartpoop-fr
La dictature des algorithmes (mon 5e livre, avec Jean-Lou Fourquet, aka @ApresLaBiere ) :
https://www.tallandier.com/livre/la-d...

Комментарии

Информация по комментариям в разработке