成功大學板國立成功大學25/12/28連Andrej Karpathy都為之著迷的RLVROpenAI 創始元老之一的 Andrej Karpathy 在 2025 年度回顧中直接點出,今年是屬於 RLVR(Reinforcement Learning with Verifiable Re211271
個人牆咀嚼抹茶25/4/1由強化學習的觀點,探討生命意義在刀劍神域(SAO)裡面的世界觀,人工智能分為 Top Down、Bottom Up 兩種訓練方式,Top Down 是人類運用經驗和知識庫,賦予AI抽象的意義和規則,Bottom Up 則給予AI初10114