美國科技業 NG 上岸經驗分享

沒想到終於上岸了! 能拿到 PayPal offer 已經超乎我的預期 因為這一路以來收到無數人的幫助所以想整理一下整個準備過程還有一些經驗給大家、希望能幫助到越多人越好! 也歡迎connect LinkedIn 之後可以幫需要的人refer ! : linkedin.com/in/howyeh8906 先來一下我的Background: Northwestern University, Master's Penn State University, Bachelor's 給我職級的title 是Machine Learning Engineering 2 今年畢業、無工作經驗 無美國實習經驗 找工作時間 : 8 個月 Research Intern - LLM on Sign Language & Bio inspired camera design Research - Financial Analysis with LLM LLM RAG optimization project on Financial data 投遞崗位是 cold apply no refer 我有referral 的全部都被拒絕了 總投遞職缺:724 Online Assessment:2 一輪面試:4 二輪:1 三輪:1 Final round:1 Offer:1 Paypal 面試流程: 第一輪 : LC 的 string and heap 各一題 第二輪 : ML QUESTIONS 像是 tree based algorithms random forest, layer norm batch norm , 第三輪 : Business Acumen/ System Design 前面是瘋狂的 brainstorming language model 的 agents 我有提到可以用 self correction agent outside of mutli-agent communication 還有如何解決 multi agent communication hallucinations problem 第四輪 : ML algorithms deep dive 前面叫我選一個我覺得 有 involves 和 contributions 的 project 這部分我用 之前做的RAG + Knowledge Graph 來介紹. 剩下的時間給我一個scenarios 給你一個 bank statements 如何用 llm agent 加上RAG 給一個 risk score. 講完之後問我你會怎麼解釋這個 score 或是有了結果以後你會怎麼做. 這部分我的回答是 我會拿最後一層的或是最後的結果做embedding 丟到 logistics regression or Xgboost 再給一個分數、主要目標是 interpretation! 因為和他們前幾輪聊下來 可解釋性其實非常重要的! Leetcode 大概230左右 這部分根據我少少的經驗以及找很多上岸和資深的人聊天的結論是 頻率是 String/ Hash Table > graph (DFS, BFS) > heap > recursion > Binary search tree > dynamic programming > backtrack 這部分其實會這樣排有很大的原因是 考官也沒有時間找題目、他們會傾向找他自己也好理解和引導你的提醒(當然如果是非常 research 崗位例外) 我 最後兩個算法只複習重要或是經典題型。 Machine Learning 面試比較好準備一點、除了基本的八股 還要 focus在 attention architecture 比如 為什麼transformer 要用 layer norm but not batch norm之類的 另外就是 Bert LoRa 這些多瞭解一下。 這部分我覺得按照一畝三分或是 medium 上的八股再來和GPT 做模擬和提問就可以了~ 這部分還要加一個是面試之前先去肉搜一下考官的背景大部分情況考官會細問他自己之前做的內容。我第二輪被問到很多 tree based alg 因為考官做很多這個。 總共做筆記時間140 小時 包含 traditional machine learning, deep learning, attention mechanisms, gpt auto regression, Lora and system design. 補充一下 deep learning 準備、 這部分可以看崗位方向做準備、比如走 computer vision, object perception detection 之類的 那麼 CNN and Diffusion models 要很熟。因為我知道我的崗位沒有要求、所以我只是大概過了一下 另外考官也知你不是什麼都要知道、所以他也會問說你有沒有這方面的經驗。我有被問到有沒有 graph neural networks 和 flash attention 的經驗但我都說沒有~ 但是大方向的deep learning 就要讀、像是 drop out, optimizer, gradient descent diff to stochastic gradient descent, and learn rate etc. 再來是比較難準備的 system design. 因為很容易會 off script 你自己準備的方式。這部分我喜歡做一個 SOP 並且根據自己的架構回答、如果因為面試官的問題跑題我比較好拉回來。 切記不要照抄(大方向是沒問題、用什麼模型也是沒問題)網路上的回答 (比如你找了 how to design recommendations 的回答一字一句的抄下來)因為你的考官或是同一輪的面試者也有機會知道或是用相同的東西、這樣會很尷尬.. System design 分兩種。一個是要自己 lead conversation (應該是比較 senior role) 另一個是 面試官會用一個提問或是一個 business scenarios 來開頭、之後根據你的回答深挖 (這部分很重要因為不懂、或不熟不要說) System design 我的準備方式我附上我的 note 希望能幫上大家 裡面有一堆問自己的問題和問考官的問題做 clarify 。 我覺得有一點很重要!!!拜託去看一下你申請公司有沒有 medium 從裡面找一下他們用的技術以及guidelines (PayPal 有 一個 pdf 講如何設計 ml alg 網頁上找得到 )因為裡面的文章的內容和一些關鍵字都會讓你脫穎而出 另外 記得先把大致上的架構搭好再琢磨細節 好比說 我會先 clarify question scope narrow down to a specific area and ask interviewer if he is okay for my assumption. 記得一定要問 what is the success metric for business, is it kpi? Or money prevent from fraud 之類的 這部分很重要‼️ 要有一個 mindset 站在 business POV 這樣才能showcase 你的不同 再來做一些assumption for setup requirements etc 像是假設符合 隱私保護 和 fairness (這部分很重要因為你上課學不到但是產業很看重)不同人種要怎麼處理之類的 再來才是 data requirements 我都會假設 data has both unlabeled and labeled 用 weak supervisor 處理 unlabeled see 再來是 data imbalance 怎麼處理 該用什麼 metrics 切記要normalization 最後才是 model selection 這邊 note 有做總結 到這裡應該就90趴左右了 剩下的就是面試資深的差別了 Model deployment 我沒有太多經驗就不深究 但是我的筆記還是做了一下~ Sys 筆記的部分看最後幾頁~
最後的最後 送上一句話一直激勵我到現在 Through adversity, a character is built Embrace the pain and enjoy the pain Get the mentality of oh poor me to oh poor everyone. 大家都在掙扎所以你不孤單
愛心
驚訝
113
23
全部留言