與120萬擦肩而過 Kaggle Vesuvius Challenge - Surface Detection 9/1391 金牌

megapx
megapx
詳細的解決方案不會出現在此篇貼文中 有興趣者可以直接參考上述連結了解比賽和我們的方案。 Kaggle是一個數據建模和數據分析競賽平台。企業和研究者可在其上發布數據,統計學者和數據挖掘專家可在其上進行競賽以產生最好的模型。母公司是GOOGLE,Kaggle在全球範圍內擁有將近20萬名數據科學家,在上面活躍的人真的都是各國工程師,尤其是NV工程師。 在台灣很少打Kaggle的人其實很少,會使用到Kaggle大部分是資工上課、上課範例會需要爬一下上面的資料 貼文之類的,導致其實台灣不太有此種環境能夠討論相關問題,上次寫AICUP沒人想屌我們,這次直接往上挑戰Kaggle。 先敘述一下我們的參賽經歷,雖然我們在Kaggle中都是藍頭(無經驗者),但我們隊伍已經參與過大部份台灣的AI賽事,對此有一定了解,像是 AI CUP 2025 玉山人工智慧公開挑戰賽-AI偵探出任務,精準揪出警示帳戶!3 / 790 AI CUP 2025秋季賽-電腦斷層心臟肌肉影像分割競賽 I-心臟肌肉影像分割 佳作 AI CUP 2025秋季賽-電腦斷層心臟肌肉影像分割競賽 II-主動脈瓣物件偵測 前標 AICUP 醫病語音敏感個人資料辨識競賽 3 / 271 IMBD 2025 2 / 182 Kaggle 比賽雖然獎金豐厚 但是很明顯能感受出來在上面比賽的人,真的比較像是來幫助主辦解決問題的,氣氛不會太肅殺,整體風氣是鼓勵大家一起進步,而不是像零和遊戲一般計較名次。 討論區比起台灣的各種競賽來說,豐富度是一個天一個地,台灣的競賽有些討論區到結束連一篇文都沒有,有些根本不讓你討論,搞得不知道競賽目的是甚麼,保密防諜玩得比誰都強。 Kaggle的討論區會有很多見解、代碼,甚至我們這次主辦在比賽中途發表了可以達到前10的公開代碼作為BASELINE,也有很多對於比賽資料、指標的疑問,主辦也都會一一回覆(當然不能太沒料),然後就看主辦覺得對公平性影響大不大,我們這次比賽中經歷兩次改制都刷掉蠻多人,但我們還是在驚滔駭浪中活了下來嘻嘻。 Shake-up的部分,就是Public 與 Private 的差異,意旨其實會有兩個排行榜,比賽結束前都只能看Public和本地CV去接受反饋 ,最終名次以Private為主,兩個資料集是完全獨立以避免過度擬和,但是這場Shake-up倒是意外平靜。 最終來到為什麼我們會跟120萬擦肩而過呢,上面有提到說有 Public 與 Private 其中主辦在比賽結束後有提到 Public 跟 Private 不只是量體上有差距,連組成也差異很大。 這點其實在比賽途中我們也有觀察到,但還是被 Public 負反饋嚇到了,我們最終提交版本並非本地CV最好的版本甚至差的有點多,比賽結束後有測試一次CV最好的版本然後
megapx
megapx
megapx
Public 害人不淺 , 也怪我們心智不夠堅定。
megapx
megapx
最後 Kaggle 台灣一年能拿到金牌不到5人(網路查的),但今年已經超過了嘻嘻 我是還不知道他對我求職有沒有很大的幫助 但我真心認為他很稀有。 希望能有更多人能夠參與,不要埋沒了自己的潛力。 #Trust your validation
愛心
跪
44
22
全部留言