強化學習

6 篇文章0 人追蹤
看板篩選
成功大學

連Andrej Karpathy都為之著迷的RLVR

OpenAI 創始元老之一的 Andrej Karpathy 在 2025 年度回顧中直接點出,今年是屬於 RLVR(Reinforcement Learning with Verifiable Re

由強化學習的觀點,探討生命意義

在刀劍神域(SAO)裡面的世界觀,人工智能分為 Top Down、Bottom Up 兩種訓練方式,Top Down 是人類運用經驗和知識庫,賦予AI抽象的意義和規則,Bottom Up 則給予AI初

科技業

強化學習跟機器人在國外有搞頭嗎

如題,最近在決定方向,不知道有沒有在國外的大大可以分享,感激不盡

沒有更多內容囉!